本人不是学数理统计出身的,有个问题问一下,这是我在参加一个考试的时候看到的,请高手给出解答,

抽样多少才具有有效性呢?







为调查呼吸阻塞症在中国发病率,发了 5000 份问卷。由于呼吸阻塞症与嗜睡症有密切关系,问

卷都是关于是否有嗜睡倾向的。后来,问卷只回收了约 1000 份,对回答了问卷的人进行了检测,发

现呼吸阻塞症患病率为 12%。对此比率数值是否准确的判断应为:

A. 可以认为此数是发病率的正确估计

B. 由于未回收问卷较多,此值估计偏高

C. 由于未回收问卷较多,此值估计偏低

D. 1000 份太少,上述发病率的估计无意义



答案是B
B

有呼吸阻塞症与嗜睡症的人会倾向于回答问卷。而那些没有这些疾病的人,很多不会回答问卷。
25 天 后
1 个月 后
好吧。。发5000份合着可能4000个都是没病的
9 天 后
。。。。感觉是这个题本身有点怪异
如果你采用区间估计,

就无所谓点估计偏高偏低的问题,





当然回答问题的人群是值得考虑的问题,

可以认为是整个区间估计的偏移
9 天 后
估计此题是美国质量协会黑带考试的题目的中国版本

翻译的不正确,导致根本无解
我觉得应该选D。



4000份没有回复的问卷,也有可能是因为他们本身没有嗜睡倾向,不想回答问卷,不感兴趣,而回答问卷的却是那些可能有嗜睡倾向的,如果这样,那末估计值过高。



如果4000份没有回复的问卷也有可能是那些有嗜睡倾向的,他们不好意思回复,如果这样,那末估计值过低。

所以,必须在对这4000份缺失数据信息有一定假设的情况下,才能知道12%的估计偏高还是偏低。