三顾茅庐
新手上路,向站内前辈请教,先多谢了
我们现在有个数量为300的样本,想检查里面是否存在错误的,不想一个一个全部检查,希望以抽查的方式进行。
抽查的结果只有两种可能:有错、无错。假设我随机抽查了30个都没有错误的话,那我有多大的把握说300个样本没有问题
呢?
或者说如果我希望有95%的把握说300个样本没问题的话,至少要抽样多少个都没问题才行。
请问有这样的计算公式吗?急啊!
三顾茅庐
自己顶一下,怎么没人啊!
rtist
刚看帖子的时候想过几分钟,发现自己卡住了,就没回贴。后来也没时间再想它。
好像卡住我的问题是似乎我总需要知道,如果有错误的话,300个里面会有多少个错误,或者是一个300个里面错误个数的分布,这样才好算。如果没有这个信息,好像几乎是不太可能算出来。
比如如果知道300个里面至多有一个错误;或者知道错误个数的分布近似于某个已知均值的截尾泊松分布,似乎就会容易很多。
ilikemath
同意,个人觉得如果没有任何先验信息,30个全合格,可以说合格率的矩估计是10%,以95%的把握说合格率的区间估计也在10%的左右。
貌似可以计算应检验多少个产品才能以95%把握说合格率大于99%等等问题。
rtist
假定300个里面有k个是有错误的,
随机抽取n个,发现这n个里面没有错误的概率是(300-k choose n)/(300 choose n)。
如果已知k,则可以得到让这个概率<=0.05的最小的n。
计算结果是:
k n至少
1 285
2 233
3 189
4 158
5 135
6 117
7 104
8 93
9 84
10 77
11 71
12 66
13 61
14 57
15 54
16 50
17 48
18 45
19 43
20 41
21 39
22 37
23 36
24 34
25 33
26 32
27 31
28 30
29 29
30 28
31 27
32 26
33 25
34 24
35 24
36 23
37 22
38 22
39 21
40 21
41 20
42 20
43 19
44 19
45 18
46 18
47 18
48 17
49 17
50 16
51 16
52 16
53 16
54 15
55 15
56 15
57 14
58 14
59 14
60 14
61 13
62 13
63 13
64 13
65 13
66 12
67 12
68 12
69 12
70 12
71 11
72 11
73 11
74 11
75 11
76 11
77 10
78 10
79 10
80 10
81 10
82 10
83 10
84 9
85 9
86 9
87 9
88 9
89 9
90 9
91 9
92 9
93 8
94 8
95 8
96 8
97 8
98 8
99 8
100 8
101 8
102 8
103 8
104 7
105 7
106 7
107 7
108 7
109 7
110 7
111 7
112 7
113 7
114 7
115 7
116 7
117 6
118 6
119 6
120 6
121 6
122 6
123 6
124 6
125 6
126 6
127 6
128 6
129 6
130 6
131 6
132 6
133 6
134 6
135 5
136 5
137 5
138 5
139 5
140 5
141 5
142 5
143 5
144 5
145 5
146 5
147 5
148 5
149 5
150 5
151 5
152 5
153 5
154 5
155 5
156 5
157 5
158 4
159 4
160 4
161 4
162 4
163 4
164 4
165 4
166 4
167 4
168 4
169 4
170 4
171 4
172 4
173 4
174 4
175 4
176 4
177 4
178 4
179 4
180 4
181 4
182 4
183 4
184 4
185 4
186 4
187 4
188 4
189 3
190 3
191 3
192 3
193 3
194 3
195 3
196 3
197 3
198 3
199 3
200 3
201 3
202 3
203 3
204 3
205 3
206 3
207 3
208 3
209 3
210 3
211 3
212 3
213 3
214 3
215 3
216 3
217 3
218 3
219 3
220 3
221 3
222 3
223 3
224 3
225 3
226 3
227 3
228 3
229 3
230 3
231 3
232 3
233 2
234 2
235 2
236 2
237 2
238 2
239 2
240 2
241 2
242 2
243 2
244 2
245 2
246 2
247 2
248 2
249 2
250 2
251 2
252 2
253 2
254 2
255 2
256 2
257 2
258 2
259 2
260 2
261 2
262 2
263 2
264 2
265 2
266 2
267 2
268 2
269 2
270 2
271 2
272 2
273 2
274 2
275 2
276 2
277 2
278 2
279 2
280 2
281 2
282 2
283 2
284 2
285 1
286 1
287 1
288 1
289 1
290 1
291 1
292 1
293 1
294 1
295 1
296 1
297 1
298 1
299 1
300 1
对照上表可知,如果想要只抽样30次就达到错判率不高于0.05这个要求,那么300个里面至少需要有28个是错误的。
所以,还是得知道k的先验分布。
三顾茅庐
有了很大启发,先谢谢楼上二位的帮助了,尤其是rtist费心了,呵呵。
三顾茅庐
请问rtist,你上面的列表是用什么公式算的啊