hfl109
请教各位专家:
对17个变量和1个因变量做个多元回归分析,存在严重共线性,但是又想比较这17个变量对因变量贡献的大小,不知道这样得到的偏相关系数和标准回归系数还有没有意义?怎么解决?
非常感谢!焦急中。。。
anita_jiu
存在严重共线性-how serious, R²=0.8?? What is the size of your sample, by the way?
hfl109
17个自变量之间的相关系数都在0。8以上,只有少数几个为0。7何0.6之间,而且显著,vif值达几百,上千
样本是一个时间序列的变化过程,采集有11个点,重复2次,17个自变量(17个化合物)
anita_jiu
0.8 and all of them?? That sounds very odd. Multicollinearity is one assumption of regression. Usually variables with high correlation would be otmitted from the analysis. As I have no idea about your variables and measurement, therefore I am not able to comment on your case. Sorry. Perhaps others in COS may be able to share their experience and knowledge with you. Good luck.
yihui
共线性导致的直接结果就是系数估计的方差巨大,这样的估计系数是没什么意义的,就好比你估计出一个beta=100,而它的置信区间为[-1000000,1000000],这有什么用呢?
最好能用某种方法选择自变量子集,或者用偏最小二乘法,岭回归,等等
abel
如果是timeseries数据,试一试VAR吧,看看结果先
一路向北
存在严重多重共线的话偏相关系数是没有意义的,因为你无法去固定其它的变量而单独去研究某个变量对被解释变量的影响。但是如果回归方程是显著的话,单单看所有变量联合起来对被解释变量的影响还是可以的吧。
解决这类问题可以用岭回归、逐步回归等方法。
hfl109
多谢,多谢!
做作其他的看看!
feiyuanwcj
不错