多谢回复!上面我引用的数据是英国Routledge出版社2007年出版的一本学术书籍中的。原书中的几组原始数据都以列联表形式呈现,我只是试着想用R书本上学过的东西对其结果进行再次计算来验证我学习R的进展情况。
我用上面的算法能计算出来其第一组数据的结果,但是上面提到的第二组的结果我却算不出来,所以就有了上面的问题。
第一组原始数据是:列1:581962,437149,1325516,2813226,2847335,2451519; 列2:3,3,97,32,36,14
原文提供的LL值是178.234,p<0.001。
我计算过程及结果是:
> d<-matrix(c(581962,437149,1325516,2813226,2847335,2451519,3,3,97,32,36,14),nr=6)
> d
[,1] [,2]
[1,] 581962 3
[2,] 437149 3
[3,] 1325516 97
[4,] 2813226 32
[5,] 2847335 36
[6,] 2451519 14
> toi<-chisq.test(d)
> g<-2*sum(toi$observed*log(toi$observed/toi$expected))
> g
[1] 178.2338
> nu<-prod(dim(d)-1)
> nu
[1] 5
> 1-pchisq(g,nu)
[1] 0
结果是能对上号的。那请问:1楼的数据是怎么算出那个7.216的?