茆诗松老师的《概率论与数理统计》一书中讲到贝叶斯概率的时候,提到《伊索寓言》中有一个大家耳熟能详的故事叫《狼来了》。
故事讲得是一个小孩每天到山上牧羊,山里经常群狼出没,十分危险。有一日,他突然在山上大喊“狼来了!狼来了!”,山下的村民闻听风声,纷纷举起锄头上山打狼,可是来到山上,发现狼没有来,一切只是小孩子的一个玩笑;第二天仍是如此;第三天,狼真的来了,可是无论小孩子怎么喊叫,也没有人来救他,他只好葬身狼腹。原来因为他前两次说了谎,人们便不再相信他了。
这个故事,不止于教人诚信,它更深刻的蕴含着“事不过三”的哲理。而“事不过三”这个哲理在刚好可以用统计学中可以用贝叶斯公式来刻画,实在是妙不可言。
现在,用贝叶斯公式来分析寓言中村名对这个孩子的可信度在三次喊“狼来了”的过程中是如何下降的。
首先我们说几个假设:记事件A为“小孩说谎”,记事件B为“小孩可信”。不妨设村民起初对这个小孩的可信度印象为<bblatex>P(B)=0.8,P(\bar B)=0.2</bblatex>。
在贝叶斯公式中我们用到两个概率<bblatex>P(A|B)</bblatex>和<bblatex>P(A|\bar B)</bblatex>。前者是指可信的孩子说谎的可能性,后者为不可信的孩子说谎的可能性。
同样的,不妨设<bblatex>P(A|B)=0.1</bblatex>,<bblatex>P(A|\bar B)=0.5</bblatex> 。
显然,<bblatex>P(B|A)</bblatex>有着鲜明现实意义。它是指这个小孩子说了一次谎之后,村民对他保有的可信度。下面开始分析整个过程。
第一次村民上山打狼,发现狼没有来,即小孩子说了谎(A)。于是村民根据这个信息对小孩子的可信度进行调整,此时对小孩子的可信度调整为<bblatex>P(B|A)</bblatex>,根据贝叶斯公式计算得:
<bblatex>P(B|A)=\frac{P(B)P(A|B)}{P(B)P(A|B)+P(\bar B)P(A|\bar B)}=\frac{0.8 \time0.1}{0.8 \times 0.1 + 0.2 \times 0.5}=0.444 </bblatex>
这表明,村民上了一次当之后,对这个小孩子保有的可信程度由原来的0.8调整为0.444,也就是此时,村民对这个小孩子的可信度印象为 <bblatex>P(B)=0.444,P(\bar B)=0.556</bblatex>。
在此基础上,再一次应用贝叶斯公式计算<bblatex>P(B|A)</bblatex>,也就是这个小孩子第二次说谎后,村民对他的可信程度的调整,于是,
<bblatex>P(B|A)=\frac{0.444\times 0.1}{0.444\times 0.1+0.556\times 0.5} =0.138</bblatex>
这表明,村民经过两次上当后,对这个小孩子的可信程度已经从0.8调整到了0.138,如此低的可信度,无怪乎村名听到第三次“狼来了”无动于衷啊,如此一来他们自然不会再上山打狼了。于是一场悲剧就此发生,史称“贝叶斯悲剧”。