统计小白求教:
单因变量y(温度)与土地覆盖(建筑、水体等x1,x2,x3,x4...)的关系
y与x1,x2,x3,x4,x5,x6都为极显著相关,其中y与x1为正相关,与其他都是负相关,与物理意义相符。
x1~x6之间显著相关,存在较为严重的共线性。
使用偏最小二乘回归,计算回归系数与VIP值(spss 20)
首先发现y的累计方差不到60%(如下)
已解释的方差比例
潜在因子 统计
X 方差 累积 X 方差 Y 方差 累积 Y 方差(R 方) 调整后 R 方
1 .519 .519 .455 .455 .454
2 .249 .768 .069 .523 .522
3 .157 .925 .020 .543 .541
4 .040 .965 .005 .548 .545
5 .008 .973 .024 .572 .568
更悲催的是发现回归系数值也不对,该为负值的基本都是正值
参数
自变量 因变量
y
(常量) 4.349E-011
x1 1.423
x2 .638
x3 .732
x4 -.093
x5 .043
x6 .004
真是诡异。。。。。。
用岭回归倒是没有回归系数诡异的问题;但是
1)由于是多个地点的对比,如何选择k值,使不同研究地点之间有可比性?
2)怎么看每个岭回归系数的显著性?
3)研究希望能给出x1,x2...x6对y变化的相对重要性,岭回归能做到吗?多谢啊!!!
****** Ridge Regression with k = 0.2 ******
Mult R .7327475069
RSquare .5369189089
Adj RSqu .5325295147
SE .5933674308
ANOVA table
df SS MS
Regress 6.000 258.406 43.068
Residual 633.000 222.870 .352
F value Sig F
122.3218697 .0000000
--------------Variables in the Equation----------------
B SE(B) Beta B/SE(B)
x1 5.3514725 .2395893 .4368583 22.3360216
x2 -1.7613169 .1847584 -.1799373 -9.5330805
x3 -1.3016926 .2022909 -.1227101 -6.4347561
x4 -1.0654967 .8662651 -.0322201 -1.2299891
x5 -.7905836 .6219594 -.0333026 -1.2711178
x6 -1.1100222 .4451432 -.0664477 -2.4936295
Constant 25.5289485 .1097132 .0000000 232.6881157
谢谢!!!!!!!!!!!!!!