tigerandfox
在An Introduction to Categorical Data Analysis (by Agresti)的第九章上面有这
麽一个问题,一个机构先后两次对首相的民意支持率做了调查,调查对象是同一批民众
,得到如下的数据:以x1代表第一次调查,x2代表第二次调查,用1表示approve,用0
表示disapprove,用n11表示第一次赞同,第二次也赞同的人数个数,用n10表示第一次
赞同第二次不赞同的人数,依次类推,边上的数字为边缘分布。如下表:
x2
1 0
x1 1 n11 n10 n1+
0 n01 n00 n0+
n+1 n+0 n=(n11+n10+n01+n00)
现在要做检验,H0:首相前后两次的民意调查支持率一样,即P(x1=1)=P(x2=1);
然后这本书上从极大似然估计,给出了检验统计量:z=(n12-n21)/(n12+n21)^0.5,当n
较大时,z服从卡方分布,参数为1.从表达试可以看出,这个统计量跟主对角线上的数
字大小没有关系,只跟两次投票不一致的人数有关。而且,书上给出具体数据,当n11=
794,n10=150,n01=86,n00=570时,支持率有很大很明显的不同。
现在我的问题是,如果我把这几个数字取得稍微极端一些,比如说我取n11=100000,n00
=100000,n10=150,n01=86,即让前后两次选择一致的人数很大,保持不一致的人数跟课
本上的一致,那么根据z的表达试,仍然断言首相支持率很不一样,但是这就跟常理不
太符合了。因为,两次变动的人数相对于不变的人数来说是很小很小的,不变的占了绝
对的大多数,那怎么可以断言首相的支持率发生明显改变了呢?版上的牛人麻烦给小弟
一点help吧,这到底为什么啊?谢谢了!!
FZYJANE
I think it is a pairs problem.
tigerandfox
[quote]引用第1楼FZYJANE于2008-05-23 04:13发表的“”:
I think it is a pairs problem.[/quote]
thank you for your reply. But could you be more specific? I do not really catch you.
鲸whale
书后面有另外一种检验的。
这个统计量不好,个人觉得,没反映n00和n11。
鲸whale
你是 老番 ????
tigerandfox
[quote]引用第3楼鲸whale于2008-05-24 22:39发表的“”:
书后面有另外一种检验的。
这个统计量不好,个人觉得,没反映n00和n11。[/quote]
第几页?
FZYJANE
好不容易登陆了.
H0: P1=P2
从数学上,简单代换后就得到 实际上就是P10=P01,看下面分解:
P1=n1+/n, p2=n+1/n
n1+/n=n+1/n
(n11+n10)/n=(n11+n01)/n
n11/n+n10/n=n11/n+n01/n
n10/n=n01/n
所以, P1=P2 的问题就变成了P10=P01.
从理论上讲, P1和P2是相关的
tigerandfox
[quote]引用第6楼FZYJANE于2008-05-25 15:14发表的“”:
好不容易登陆了.
H0: P1=P2
从数学上,简单代换后就得到 实际上就是P10=P01,看下面分解:
.......[/quote]
我觉得前面都没有问题,但是从n10/n=n01/n这一步开始往下推,我觉得是不是应该考虑|n10-n01|/n与0的差别有多大来确定到底两次调查是不是一直,而不是单单去考虑n10与n01的差别,因为前者考虑到了一个总数问题,后者好像忽略了n10与n01占的总数的百分比~~你看这样合理不??
然后又有个问题了,到底|n10-n01|/n的分布怎么确定好啊~~~
BTW,"jane" is a good name!!
FZYJANE
Thanks.
我不是很看懂你的问题. 推到最后就是想说明研究H0: P1=P2 跟研究P10=P01是一样的. 至于我们要看两次调查是不是一致, 通过检验, 来推翻原假设或接受原假设.象你说的用McNemar test:(n12-n21)^2/(n12+n21)~X2 with degree of freedom 1 for big sample size, if sample size is small, we should use binomial test.
BTW, since n is fixed, each cell follows multinomial distribution.
tigerandfox
[quote]引用第8楼FZYJANE于2008-05-26 14:51发表的“”:
Thanks.
我不是很看懂你的问题. 推到最后就是想说明研究H0: P1=P2 跟研究P10=P01是一样的. 至于我们要看两次调查是不是一致, 通过检验, 来推翻原假设或接受原假设.象你说的用McNemar test:(n12-n21)^2/(n12+n21)~X2 with degree of freedom 1 for big sample size, if sample size is small, we should use binomial test.
BTW, since n is fixed, each cell follows multinomial distribution.[/quote]
我问题就是如果n11和n22都很大很大,比如说十万,甚至于一百万,然后n12和n21相对较小,比如说156和80,这样的话你看两次民意调查的赞同的比例的波动其实是很小的,两次民意调查的支持率可能只有零点零几个百分比的不同,这样的话从常理来说我们应该认为这两次民调支持率是一样的吧~~
但是用McNemar test的话,因为这个统计量没考虑到主对角线上面的元素,也就是n11和n22的值,用R检验出来的p值<0.05,所以我们又会认为这两次民调有很大不同,就跟前者好像有点矛盾了~~
zhlin850411
要是两次相差这么大 第二次完全可以忽略