两者有联系,但不是一个东西。从总体来说,相关系数是
$$ Cor(X, Y) = \frac{EXY - EXEY}{\sqrt{Var(X)Var(Y)}} $$
而\(R^2\)
的定义是
$$ R^2 = \frac{Var(E(Y|X))}{Var(Y)} $$
从定义来说两者就是不同的:\(R^2\)
更侧重于response,也就是这里的Y,被模型拟合的情况。注意到条件方差公式
$$ Var(Y) = E(Var(Y|X)) + Var(E(Y|X)) $$
它描述了响应变量的方差里,条件期望(模型拟合部分)的方差占比有多少。而相关系数\(Cov(X, Y)\)
中对X和Y的侧重是一样的。
两者的联系在于,当极端情况,即线型模型恰好就是数据的真实情况时,两个度量值(绝对值)都为1。