我们都知道 二项分布的公式是 P(X=k)=C(n,k) * (p^k) * (1-p)^(n-k) 此公式中的参数是 n 和 p, 自变量是 k

书上说,当n=1的时候,也就是只做一次贝努利实验的话,P(X=k)=(p^k) * (1-p)^(1-k) 此时 k=0 或 k=1

接下来,我就想,这个p是怎么来的,我想p应该是做了大量实验后某个事件的发生频率(依照大数定律)就应该是p

再接下来,我就想,通过二项分布的公式是不是能自证呢? 我打比方,如果某个事件的概率是p=0.2,如果我做1000次的话,发生200次的概率应该很接近于0.2 ,所以用二项分布公式就有 P(X=200)=C(1000,200) * (0.2^200) * (0.8^800) 通过WOLFRAM计算出来是 0.0315 ,这个数字0.03跟0.2相去很远。

谁能跟我解释一下我的错误犯在哪里?

二项分布中如果n=1, k=1 那么 P(X=k)=p 所以参数p就是做一次实验就发生事件的概率

我的问题其实就是,这个所谓的概率p, 或参数p是怎么得到的呢?

回复 第1楼 的 nyyankee:楼主计算的是做1000次相互独立的伯努利试验(成功事件发生概率为0.2),成功次数恰好等于200次的概率。

关于参数p的估计,可以看看参数估计的方法。

例如,多次独立重复实验之后,可以用样本平均值对p进行估计。

回复 第4楼 的 关 菁菁:

我可能表达不太清楚。 其实是这样的, 我认为 如果二项分布中的p是0.2的话,那么做一千次试验后发生200次的概率也应该是0.2 , 但是实际算出来是 P(X=200)=C(1000,200) * (0.2^200) * (0.8^800)=0.0315

请问为什么

回复 第5楼 的 nyyankee:

“p=0.2, 在一次实验中事件发生的概率为0.2” 不等于 “做1000次实验发生200次的概率为0.2”

问题一:已知p=0.2, 计算出1000次实验发生200次的概率为P(X=200)=0.0315

问题二:p未知,1000次实验事件出现了200次(确定事件, 概率P=1,频率为0.2),参数估计出p(在一次实验中出现的概率)大致为频率0.2

不能把“1000次实验出现200次的频率”等同于“1000次实验出现200次的概率”

回复 第6楼 的 iamstomach:

关于“ 在一次实验中事件发生的概率为0.2” 不等于 “做1000次实验发生200次的概率为0.2”, 这个我能够理解,可是你怎么通过一次实验就能得到那个0.2呢,你必然是通过很多次试验才能得到那个0.2,那怎么设计实验呢?

另外”您提到的问题二:p未知,1000次实验事件出现了200次(确定事件, 概率P=1,频率为0.2),参数估计出p(在一次实验中出现的概率)大致为频率0.2“ 想请教下, p未知的情况下, 概率p=1 。。这个怎么回事

这样吧,直观一点的例子来说比较好。

比如说测试一个投球器,投球器前方有一个篮筐,然后开始测试1000次,观察得到1000次里有200次投入篮筐,然后我们就说投球器投入篮筐的概率p=0.2, 然后我们用所谓二项分布的公式来计算,用之前的得到的p作为参数,然后另n=1000,然后看做1000次试验里发生200次的概率大概是多少,最后得到是0.0315

就以上这个实验来说,我相信概率论一定是科学严谨的,一定是我自己哪里没有搞清楚,请帮我解惑一下,谢谢了。

参数估计的思路是做1000次实验,发生200次,所以我们认为发生200次的可能性最大,所以p=0.2,注意是可能性最大即可。接着我们在应用二项式分布进行计算是可得200次的概率为0.03,说明了发生200次的事件的概率,这个数字虽然小,但是它是所有可能性(100次或201次等等)中最大的,符合我们的估计思路。

做n次实验,发生事件A的次数x,则我们认为发生x次事件A的可能性最大,估计出参数为x/n。所以在反过来计算时只要符合 发生x次事件A的可能性最大 就行。

谢谢楼上的耐心解答,我算是大概看懂了您的意思。