我学习回归的时候,教材特别提示,首先要看散点图,看看散点分布大致符合什么函数线,是一次函数?还是二次函数曲线。那么最多我们可以看到三维散点图。
问题1:但是如果超过三元呢?我们就无法看到散点图了。那么怎么猜测可能的散点形态呢?如果用PCA降维以后还是大于三元,怎么办呢?
有一种说法是“多元回归分析应该强调是多元线性回归分析!强调线性是因为大部分人用回归都是线性回归,Y=a+bLnX,我们可以令 t=LnX,方程就变成了 Y=a+bt,也就线性化了。”
问题2:上例是有效解决多元散点图不可实现时,“强行”确定回归方程模式的好方法么? ![我不理解的地方我们本来想通过回归方程找出x和y之间遵循什么函数关系。现在被强行替换成t了,那我原来的问题不还是无解?所以通过替换将非线性模型线性化,这是正确的方法么?如果正确,那么回归之前看散点图推测函数类型,岂不是成了多余步骤?!
看到书上写:"如果条件期望函数是线性的,使用回归就能找到这个函数:如果条件期望函数不是线性的,回归能够找到这个函数的一个好的近似"-------------请问这是退而求其次,妥协的结果。对么?明知道拟合的不好。但也没有别的更好的办法了?