bec
问题如下:
因变量: D
自变量: A, B, C, 与D的相关系数分别为0.77, 0.78, 0.77。共线性检验,发现容忍度均小于0.01。
请问在这种情况下,如何从自变量A, B, C中找出主导因子,即那个因子起着主导作用?谢谢
park
用主成分分析试试吧
bec
谢谢回复,用主成分分析合适吗?存在强烈共线性的情况下,是否可以用逐步回归?谢谢!
redlou
可以试试主分成回归
rtist
[quote]引用第0楼bec于2007-08-27 22:26发表的“请教自变量共线性问题”:
问题如下:
因变量: D
自变量: A, B, C, 与D的相关系数分别为0.77, 0.78, 0.77。共线性检验,发现容忍度均小于0.01。
请问在这种情况下,如何从自变量A, B, C中找出主导因子,即那个因子起着主导作用?谢谢[/quote]
什么叫容忍度?看abc与D的相关系数干什么?有什么直接意义么?
bec
谢谢版主指点
因变量: D是纬度梯度上野外样地上的物种数量
自变量: 纬度梯度上野外样地的气候数据,A(年平均温度), B(温度年较差), C(最冷月均温), 与D的相关线性系数分别为0.77, 0.78, 0.77,很接近。共线性检验,发现容忍度为spss里的Tolerance,均小于0.01。
请问在这种情况下,如何从自变量A, B, C中找出主导因子,即那个因子起着主导作用?我一直感觉这几个气候指标共线性太强,何难找出主导因素。请指点。
bec
一般情况下,最冷月均温和年平均温度越高, 温度年较差越小,物种数量,即生物多样性就越高。这是一个生态学问题。在纬度梯度,即从南到北,最冷月均温和年平均温度均呈线性降低趋势,而温度年较差则呈线性增大趋势。
rtist
我的意思是说,共线性和D没什么关系,看相关系数也应该看ABC之间的,而不是他们和D之间的。
如果共线性真得很强的话,那么逻辑上基本就没法区分究竟是哪个因素造成的。
我不清楚共线性检验,也不清楚tolerance在这里的定义。
主成分分析也很难说,因为任何主成分都是linear combination的结果,共线性很强的时候loading本身意义似乎也不是很大。
bec
谢谢指点,tolerance其实是VIF的倒数,是表示共线性强度的指标。A,B,C各自变量之间的相关系数均大于0.99。看来很难找出主导因子了,我也不折腾了。
rtist
[quote]引用第8楼bec于2007-08-28 07:49发表的“”:
谢谢指点,tolerance其实是VIF的倒数,是表示共线性强度的指标,既然变量之间共线性很强,不能区分主导因子的话,那就算了。我也不折腾了。谢谢啦[/quote]
这么说和VIF提供的信息应该一样了
rtist
另外共线性不影响预测。
如果非要解释参数,那么三个因素放一起同时解释应该就可以了。
bec
是的,A, B, C个自变量之间的相关系数均大于0.99, 看来没必要找主导因子了
bec
我认为不可能,但审稿人非要我找主导因子,说可以通过逐步回归获得,正是瞎说。
rtist
[quote]引用第12楼bec于2007-08-28 07:58发表的“”:
我认为不可能,但审稿人非要我找主导因子,说可以通过逐步回归获得,正是瞎说。[/quote]
对,瞎说。事实上三个因素本质上在提供基本一样的信息。