• R语言
  • 《R语言实战》里一句话不太明白,求助

第八章回归,8.3.1 OSL回归统计假设里的线性:若因变量与自变量线性相关,那么残差值与预测(拟合)值就没有任何系统关联。
自己的理解:由残差平方和最小得到回归系数,由回归系数得到预测值,这里的因果关系不是很明白。
我试着解释一下:
简单线性回归顾名思义,就是解决因变量和自变量的线性关系的。如果因变量和自变量确实存在线性关系,那么残差值(就是自变量不能解释的部分)就纯粹是由随机因素造成的。试想,一堆随机值怎么会和自变量有线性关系呢?如果还存在线性关系,那只能说明这个线性模型不合适,也就是说残差值还包含着自变量能够解释的部分。
1 个月 后
[未知用户]
抱歉,这么长时间没回。英文版书的另外一句话说:
In other words, the model should capture all
the systematic variance present in the data, leaving nothing but random noise。
按你所说,如何解释这句话。systematic variance 是系统方差,还是系统误差。
我觉得楼上解释的有道理,systematic variance在这里表示系统变异,就是所建立的模型能解释所有变异中的系统变异,只剩下随机变异
我尝试回答一下:
最OSL中,若线性的假设成立,则你不会看见残差与预测值(或者解析变量值)之间有明显的pattern, 而只会看见残差呈现没有什么规律的(随机)波动。这可以从假设的回归模型看出来:
yi=β0+β1xi+ϵi y_i=\beta_0+\beta_1 x_i+\epsilon_i
当中{ϵi}\{\epsilon_i\}是iid的,也就是不应该跟yiy_i或者xix_i有任何关系。
[未知用户]
最近也看到这句话,当时没想明白,现在感觉一下子清楚了~