jiaojiaojing 今天大概瞟了一眼这本书,对这里面的一个贝叶斯学习的CASE非常感兴趣,写了点东西,特地拿出来跟大家分享,如果有什么不对的地方,大家一定要帮我指出来哈! Case study 一个调查者,去某湖畔调查是否有某种树蛙,她听到了树蛙20分钟一次的叫声,但是没有发现树蛙的踪影,经验上,没见到踪影,只听到叫声后树蛙存在的概率是80%,那么这次调查到底可否推测树蛙存在呢?这样推测的错误率和正确率各是多少呢? 传统概率方法: 1、零假设概率模型: 如果将树蛙存在设成零假设,那么P(不存在|存在)是P值构建法,这个值求得是0.2, 如果树蛙不存在是零假设,那么P(存在|不存在)的值是1.0 由上可见,两个P值都是超过了0.05的检验范围,这样就得到了两个相矛盾的结论。可见,这样的零假设方法不适用,因为它只能去反驳,但无法去证明一个结论的正确与否,因为大家都知道,只有当P值小于0.05的时候,这个零假设证明才有真正实质性意义,否则,它的结果并不能说明原假设是对的,因为原假设设定后,本来初衷就是保护原假设,所以接受原假设,逻辑上根本没有说服力。 2、理论信息法 换种思维方式,也就是我们考虑,现在的结果是:没有测到树蛙的存在,那么哪种假设最能产生这样的结果,我们发现,P(不存在|存在)=0.2,P(不存在|不存在)=1.0,那么我们发现,树蛙存在的概率小于不存在的概率,为1/5. 传统方法缺陷分析: 我们发现,如果要用传统的理论方法判断树蛙是否存在,那必须要建立在很多年的观察基础上,因为只有这样,你得到的经典概率才更接近真实值,但是在生活中,尤其是生态研究中,我们关心的并不是大量的数据和多次的实验,很多实验根本就是没有办法大量重复进行的,这样的概率计算方法就没有了指导意义,至少在一次实验的结果分析说明中,指导意义不是很强大,所以我们考虑到另一种方法:贝叶斯方法,它不需要大量的多次重复实验,因为多次重复是可以通过模拟完成的,而且对一次实验结果的指导性意义要大很多。也就是传统方法的揭示性很强,但贝叶斯方法的预测性更强。 贝叶斯方法: 其实贝叶斯方法是基于似然思路的基础上的,但是还包括了先验信息或者叫先验分布,而且在运用贝叶斯方法的过程中,我们发现,它是将在不同的假设前提下,结合先验分布和在各个前提下的数据综合分析,来更新实验的结果。那么,当数据更能证明哪种假设的时候,那么这个假设相对于其他的竞争假设而言,就有了更大的优势信息。 首先,我们先讨论为什么先验分布很重要。我们知道,如果这个池塘条件良好,以前经常有树蛙出没,那么这一次没有看到树蛙的失败就并不会影响到这个调查者对这个池塘周围有树蛙出现的想法。 我们发现,这点是跟传统的方法很不一样的地方,传统的方法,你就要一直做实验,调查多次,然后求概率,计算这次没有看到树蛙的概率,或者就是针对这一次调查,没有把以前的信息应用进来。但是对人类而言,我们是很受先验信息影响的。 而且,我们还可以发现,传统方法的思路是“在不同的前提下,我们获得这样的数据的概率是多少?”但是贝叶斯方法的思路是“有了这样的数据,那么哪个前提正确的概率最大?”我们发现,它们的前提和结论刚好相反了。但是我们知道,我们现在关心更多的并不是怎么得到的数据,而是哪个假设产生这样的数据概率大。 我们分解来看这个贝叶斯问题的过程解释,也许更容易理解其中的真谛。 第一步,我们开始认为Pp和Pa(分别代表存在的概率和不存在的概率)都是同等的,在我们的思路上,所以各是0.5; 第二步,现在收集了这次的观察证据后,我们发现将每个结果都乘以权重后得到的后验分布为Pp(存在的前提)=0.5*本次数据更正=0.5*P(不存在的事实|存在的前提)=0.5*0.2=0.1,而Pa(不存在的前提)=0.5*P(不存在的事实|不存在的前提)=0.5*1=0.5,那么我们标准化后的结果就是后验分布Pp=0.1/(0.1+0.5)=1/6,Pa=0.5/(0.1+0.5)=5/6,我们发现,明显有了这一次的调查,我们更加相信树蛙不存在的概率大了,这让我们想到了小时候的故事“狼来了”,这些其实都是一个道理。 我们发现,贝叶斯的思路是用数据对前提进行更正,而不是直接求得数据得出的概率。 这样,如果再从这样的后验分布中抽样,然后再套用以上公式去计算新的一个后验分布,那么结果就更精确一点,这样一直进行,但是进行到什么时候才停止呢? 现在的方法就是取不同的先验,然后编程,当不同的先验汇聚到一定程度,经过了检验,我们就可以停止了,现在得到的这个概率就是最合理的对树蛙到底出现与否的一个比较精确的估计。 在抽样过程中,有很多方法,我们目前用马尔科夫蒙特卡洛方法(MCMC)---是GIBS抽样的精髓,而且贝叶斯方法认为,每次产生的后验都是有个分布的,就比如以上的那个树蛙模型学习中,就是个贝努力实验模型。这个贝努力模型中,其实也就是个P(这里规定为树蛙出现概率)的确定,所以贝叶斯方法也就落在了估计参数上---经过相当次数的更正,那个P也就越来越接近真实值---相当于得知了分布,估计其中的参数。 可以看出,贝叶斯方法的思路来源其实是全概率公式。 以后我还会陆续把学习心得放上来,前段时间忙实验和英语了,早就有想法为贝叶斯学习写点东西,今天才动笔,个人觉得初学者看看这个CASE STUDY,应该就对贝叶斯的脉络清楚很多了,很多抽样方法都只是其中一种方法,关键是先把思路搞清楚,但我的看法不定正确,欢迎大家批评指正。