一个典型的样本数量问题,想讨论一下。统计全省的某一电力设备的健康状况。
比如全省有1万台,历史数据表明合格率为80%。要确定至少需要检测多少台才能够代表全体,有个经典的公式是
n=(z^2)p(1-p))/(e^2+(z^2)p(1-p))/N)=(1.96^2*0.8*0.2)/(0.02^2+(1.96^2*0.8*0.2)/10000)=1332
即检测1332台就可以保证95%置信区间精确度80±2%。
现在的问题是,想知道是否有必要在南北两个区内单独抽样,是否需要在每个市单独抽样。个人觉得这要根据历史数据先计算每个区和每个市的合格率。如果和总体合格率相同,就没有必要。但是这在统计上有没有什么相关的理论和方法呢,谢谢!