同关注,我的想法是:
1.关于是否用正态估计
楼主用函数wilcox.test()进行wilcoxn秩和检验,使用
========================================
> wilcox.test(x, y)
========================================
进行的是精确检验,即没有正态估计,因此得出的p-value为
========================================
p-value=0.2544
========================================
与接下来验证的(且不说是否正确)
=============================================================
(5)T<-(abs(Ry-ERy)-1/2)/VarRy^(1/2) #等于 1.163508
(6)p_v<-2*(1-pnorm(T)) #求精确p-值,等于0.2446236
=============================================================
的p-value不一致是正常的。
而采用标准正态估计为(参考R-help):
> wilcox.test(x, y, exact = FALSE, correct = FALSE)$p.value
[1] 0.2206714
2 关于统计量U(或者W)
维基百科的介绍(参考网址<
http://en.wikipedia.org/wiki/Mann-Whitney_U_test> --->尽管图被阉割了)
统计量U的计算:
U.x = R.x-n.x*(n.x-1)/2=90-45=35
#R.x为第一组的秩和
这里也提出如果样本数较多,统计量U近似为正态分布
3 关于近似正态分布的参数
不清楚楼主是参考哪些资料(可能是wilcox的原始论文,因为据说wilcox和Mann-Whitney的两篇文章中使用的检验方法实质虽然相同,但细节有异。我也再仔细看看)得出期望E的数学表达式
#可能楼主参考文献中此处不是统计量U而是其他统计量
Mann-Whiney文章中(参考文章On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other. H. B. Mann and D. R. Whitney)指出其正态分布期望为 n.x*n.y/2, 方差为 n.x*n.y*(n.x+n.y+1)/12
因此可做修改楼主验证为:
> ERy <- 5*10/2 #方差
> VarRy <- 5*10*(5+10+1)/12 #期望
> T <- (35-ERy)/VarRy^(1/2) #标准化,此处用第一组的秩和,也可用第二组的秩和为15
> 2*(1-pnorm(T))
[1] 0.2206714
结果与使用
> wilcox.test(x, y, exact = FALSE, correct = FALSE)$p.value
[1] 0.2206714
一致