sunnytown 因变量为y,自变量为x1,x2,x3,x4,x5,x6 单独算y与x1,x2相关系数是,相关系数是负的,物理意义上也应该是负的 用多元逐步回归的时候,却算出来回归系数为正值?这是怎么回事? 另,x1,x3,x5之间存在一定共线性,除了多元逐步回归,有没有更好的数学统计方法,解释 y=f(x1,x2,x3,x4,x5,x6) 谢谢!
nan.xiao 相关系数和回归方程的系数没有必然联系 。。。这现象其实也很好解释,具体可以查查什么是 suppressor variable。 存在共线性太正常了,不过这里变量太少,可以用纯 l2 惩罚的岭回归,E-net 中含有的 l1 项这里似乎没必要加。甚至我觉得都没必要加正则项,如果共线性不是很严重的话,简单的多元线性回归做出来放那里就好。
Cloudly 回复 第4楼 的 谢益辉:能弱弱的问一句...丁鹏兄文章里的问题有答案么... 计量经济学中的“内生性”(endogeneity)怎么定义?它和 Yule-Simpson 悖论有什么联系?
pwpwpw2009 除了共线性的问题外,还有一个就是意义方面的问题,多元回归中的系数属于偏回归系数,是保持其他几个不变,该变量变化所引起的因变量的变化,而一般计算的因变量与某自变量之间的相关系数属于单相关系数,其自变量的变化也是包含在其中的,由此,偏回归系数与单相关系数之间是并无多大联系的。