yuling
为什么相关系数的检验可以用,t或卡方呢,求得两组数据差异显著,那么相关系数就显著了呢
比如点二列相关,不懂原理。
等待指教
yihui
卡方用不了吧。
建议你去查一查检验的统计量,一般的数理统计书上都有。但是你上面的说法是不对的,差异显著未必相关系数显著。比如x为一列随机数,y也是一列随机数,然后在y的基础上都加上一个很大的数,x和y的差异必然显著,但是相关系数却会很低。
用R随便给你作个演示:
> x=rnorm(50)
> y=rnorm(50)+10
> x
[1] 0.2447312201 1.1229825171 -0.2573012857 0.5000488624 0.8620130176
[6] -1.5208268336 0.0937311079 0.2681336152 -0.6992520694 -0.6252442260
[11] 0.6845654149 -0.3337048493 -0.6981247779 -1.1012463210 -0.3248484398
[16] 0.4548684238 0.2373160217 0.1458212536 0.4534276308 0.8999639395
[21] 1.1039873768 -1.2085259492 -1.9900827408 -0.5346416945 -0.0632127524
[26] 0.8010175970 -2.4185507253 -1.6655354231 0.5100738933 -0.4758769097
[31] 0.7155448072 1.9129977667 0.2845613310 0.9495714136 -0.5768026384
[36] 0.4496020247 1.3358439840 -1.0408575975 -1.2555397798 1.0131271485
[41] -0.8352170307 2.4373007316 -0.0009515503 -0.2839983487 -0.6530983054
[46] -1.2550079151 0.6575078522 1.3593980156 -0.1735179884 -0.5723075135
> y
[1] 9.812066 9.236754 10.201281 9.608937 9.897460 9.385596 11.247757
[8] 10.740272 10.299103 9.894767 9.913708 10.177835 11.862908 9.760958
[15] 9.180583 9.241564 10.312901 11.313367 10.209924 9.593271 10.391929
[22] 9.162339 12.412769 9.794193 10.632054 10.385621 10.254164 10.352903
[29] 10.006919 11.030043 9.722948 10.102462 10.205305 10.043373 8.987541
[36] 8.872611 11.193243 11.995592 11.748886 8.809096 10.206237 10.580766
[43] 11.440892 10.125081 8.904705 9.730979 10.603883 9.185925 10.376877
[50] 11.091155
t检验(差异显著)
> t.test(x,y)
Welch Two Sample t-test
data: x and y
t = -50.2488, df = 98, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-10.394928 -9.605072
sample estimates:
mean of x mean of y
-0.02132273 9.97867727
相关系数检验(不显著):
> cor.test(x,y)
Pearson's product-moment correlation
data: x and y
t = -1.4894, df = 48, p-value = 0.1429
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.46152781 0.07240246
sample estimates:
cor
-0.2101810
yuling
谢谢,但是,书上就是这么给的阿,用t检验去检验,相关系数的显著性,我也明白有差异不一定相关,
所以我才问原理呢
rtist
管理员那个结果不对把?那个y明显不等于x+10啊。
rtist
问题其实问得不太清楚,什么叫相关系数闲著阿?
如果检验相关系数是否为零,那么和检验回归系数是零是一样的。
如果检验是否相等,或者是否等于其他数,则不一样的。
小木匠
周概容的《概率论与数理统计》里有,前几天刚看到
这本书出得比较早,不过往往是这种老书,给的东西比较详细
yuling
检验相关系数是否为零,不是相等
我说卡方是指,比如在φ相关用卡方作检验相关系数的显著性,即是否为零.
如果一般的显著性检验,用到t或z应该用这个系数减去零啊
而我看到的一本 王孝玲编的教育统计学 在检验点二列相关系数显著性时,用的是两组数据的平均数的差,所以有点不懂,才问,相关系数检验和平均数差异弄一起去了呢,在我的理解中有相关不一定就有差异,所以困惑了
yihui
[quote]引用第3楼rtist于2006-11-25 12:23发表的“”:
管理员那个结果不对把?那个y明显不等于x+10啊。[/quote]
不好意思,“口非心是”了……已经改过来了:)
llyxt
虽然样本相关系数r可作为总体相关系数ρ的估计值,但从相关系数ρ=0的总体中抽出的样本,计算其相关系数r,因为有抽样误差,故不一定是0,要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体,必须进行显著性检验。检验假设是ρ=0,r与0的差别是否显著要按该样本来自ρ=0的总体概率而定。如果从相关系数ρ=0的总体中取得某r值的概率P>0.05,我们就接受假设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系;如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自ρ≠0的另一个总体,因此就判断两变量间有显著关系。
由于来自ρ-0的总体的所有样本相关系数呈对称分布,故r的显著性可用t检验来进行。
dingpeng
binary的时候,确实可以用t test。原因如下:
假设有列联表
Y
1 0
X 1 p1 1-p1
0 p0 1-p0
X 与 Y 不相关,等价于OR=1,即主对角线的乘积等于次对角线的乘积,化简得到p1 = p0。
也就是检验两个二项分布的参数p是否相等,也就是均值的检验。
于是,可以看成两样本的均值检验(X=1和X=0对应的Y的均值是否相同),即用t 检验。
上面举得例子表明:在正态分布下,不可。
根本原因在于:两点分布,均值是充分统计量,而正态分布,方差是充分统计量(假定事先零均值化)。
dingpeng
不过,还有一种理解。
正态分布下,检验X与Y是否相关,也可用t检验。
regress Y on X
检验X的系数是否为0.
t检验,检验是否相关,可以证明t统计量是样本相关系数\rho的函数。