多元回归为什么总可以转为多元线性回归？

wufaxian

我学习回归的时候，教材特别提示，首先要看散点图，看看散点分布大致符合什么函数线，是一次函数？还是二次函数曲线。那么最多我们可以看到三维散点图。

问题1：但是如果超过三元呢？我们就无法看到散点图了。那么怎么猜测可能的散点形态呢?如果用PCA降维以后还是大于三元，怎么办呢？
有一种说法是“多元回归分析应该强调是多元线性回归分析！强调线性是因为大部分人用回归都是线性回归，Y=a+bLnX，我们可以令 t=LnX，方程就变成了 Y=a+bt，也就线性化了。”

问题2：上例是有效解决多元散点图不可实现时，“强行”确定回归方程模式的好方法么？ ![我不理解的地方我们本来想通过回归方程找出x和y之间遵循什么函数关系。现在被强行替换成t了，那我原来的问题不还是无解？所以通过替换将非线性模型线性化，这是正确的方法么?如果正确，那么回归之前看散点图推测函数类型，岂不是成了多余步骤？!

看到书上写："如果条件期望函数是线性的，使用回归就能找到这个函数：如果条件期望函数不是线性的，回归能够找到这个函数的一个好的近似"-------------请问这是退而求其次，妥协的结果。对么？明知道拟合的不好。但也没有别的更好的办法了？

henrywangnl

散点图好处多多，比如可以看一下是不是存在共线性，是不是有异常值等等。
其实，如果t=lnX，你找出了Y=a+bt，那也就间接找到了y和x的函数了啊。

wufaxian

henrywangnl
你找出了Y=a+bt，那也就间接找到了y和x的函数了啊。-------某种程度上说是对的。不过所求出的斜率和截距都是y于t 的关系。R平方代表拟合的质量，也仅仅表示回归直线对t的拟合程度。和x的拟合程度如何呢？
如果y与x之间本身是非线性关系，能直接用非线性函数去拟合，效果不是更好么？不是更直观的揭示出y与x之间的俄关系么。比求出y与t之间的线性关系，再把lnx代数函数，为了追求线性求出一个间接的方程更好把？