yuanxn
理性主义传统和统计学
现代统计理论或者数理统计的产生一般来说没有很确切的时点。我们引用龚鉴尧先生《世界统计名人传记》的一段话大略说明一下:
肯德尔认为,如果我们必须选择现代统计理论开始的日期,我们把它放在1890年。这个时代首先在英国,出现了高尔顿(Francis Galton,1822-1911)、埃奇沃思(Francis Y·Edgeworth,1845-1926)、卡尔·皮尔生、尤尔等著名统计学家,他们推进和发展了统计理论和方法,在统计学的许多领域作出了重大贡献;而一位具有划时代意义的伟大统计学家罗纳德·费暄(Ronald Fisher,1890-1962)又正好在这一年出生,此后,经过俄国、美国、印度、法国、意大利等国的许多统计学家的共同努力,到第二次世界大战结束时,统计理论跨越了所有国界成为一门科学,以及技术与工业界公认的学科。(534页,中国统计出版社)
在统计史中还可以看到类似的陈述,如芝加哥大学的斯蒂芬 • 斯蒂格勒在《统计学史---1900前,不确定性的测度》一书中指出1880前后,统计学在英国取得突破(breakthrough)与革命【0】。
那么,在数理统计降生的这段时间以前,英国的状况怎样呢?陈希孺先生在《数理统计学小史》就谈到在19世纪70、80年代以前英国是一个统计思想“进口”国【1】。
这里要顺便解释一下,英国和欧陆隔海相望,为甚么当时英国竟然在某方面滞后,要“进口”对岸的思想呢?这直接的原因中相当部分是微积分的发明权的争夺战引起。双方阵营都很强大,而且剑拔弩张。两岸间引发的心理抵触大约僵持了近一个世纪,造成科学思想交流的阻碍,对英国的理论科学发展非常不利,这在一般科学史上都有记述。这里我们引一下莫里斯 • 克莱因的说法:“这件事的结果,英国和大陆的数学家停止了思想交换,因为Newton在关于微积分的主要工作和第一部出版物,即《原理》中使用了几何方法,所以在他死后差不多一百年中,英国人继续以几何为主要工具。而大陆的数学家继续Leibniz的分析法,使它发展并得到改善。这些事情的影响非常大,它不仅使英国的数学家落在后面,而且是数学损失了一些最有才能的人应可做出的贡献。” (《古今数学思想》中译本,第二册,第94页,上海科学技术出版社,2002年第一版)
这里抛开恩怨来看,我们应该注意到其中的思想传统的差异引起科学研究中的认知途径的不同。从提出微积分思想的缘起看,在牛顿是因解决物理实验问题的提出需要解决手段,而莱布尼兹是要探索哲学上的新课题。
但是,我们回到19世纪末的情景来看,微积分发明权的争议已尘埃落定,英国某些理论科学(如数学)发展局面相对滞后,英国人要借鉴吸收大陆的统计思想,但是,令人吃惊的是转眼就草创了数理统计。难道短短十几年间,就峰回路转柳暗花明,是不是太有些戏剧性呢?为什么数理统计的发生这件事却没有出现在欧洲大陆,特别是法、德这些概率论的“出口”国呢?
就欧陆的情况来说,概率论的探讨还未脱出带有一定先验色彩的古典概型的范畴,这造成一种思维定势,妨碍概率思想向统计学的转移。我们不妨继续引用龚先生那篇涉及肯德尔的文字。
至于古典概率理论与统计学之间的联系(在各种自然现象综合的科学规律性方面),并没有出现在任一可辨别的时点上,在某些地方它沿着一条明显的可描绘的路线前进,但是没有堪作纪念的里程碑。然而关键的一点,不总是与博奕一样事前计算概率,而是一定要实现能测度客观世界的永恒现象。在古典概率理论中,简单的概率都是在事前指定的。许多概率理论是由简单事件的已知概率来导出复杂的有条件的事件的概率。可是当由一个观察的次数分布进行抽样,且不知基本概率时,而是去估计参数。对这个概念的意义的充分认识花了很长的时间,也许是50年,这点一旦认识,统计就利用着概率,而且在过去一个世纪的大发展中,二者始终保持均衡。
这可以部分解释为什么数理统计没有发生在欧陆的原因。
但是,如果我们不拘泥于具体的、技术性的原因,我们或许会发现一些更深远的影响因素。实际上,从宏观上讲,是两个巨大的思想传统的板块相互碰撞、挤压与融合的结果。
为什么数理统计的产生在英国?要想追溯源流,窃以为至少要从欧洲理性主义传统的分野说起。
在思想史或哲学史中,常把启蒙运动思想来源简单地称为英伦传统和欧洲大陆传统(甚至更狭隘的说法是苏格兰传统和法国传统)。仅从哲学史角度来说,理性主义的格局是,一支是培根以来的经验论传统,另一支是笛卡尔代表的唯理论传统【2】。培根的经验论强调知识来自经验归纳,而笛卡尔认为真理须经过如几何证明一样严格的推理得到。前者对于实验科学影响大,而理论科学,特别是数学,笛卡尔路线影响深。
这种分野在培根和笛卡尔之前就根植在各方的民族传统中,在中世纪哲学中各方也有表现,到了十七世纪在理性启蒙路线上发生明显分野,问题表面化。这在后来的科学史中也有表现。比如梅森的《自然科学史》就谈到英法科学家的不同,他写道:
在十八世纪,法国和英国的自然哲学家们站在科学界的前列。正如我们在上面讲过的,他们的活动是互相补充的;法国人倾向于自然界的理论探讨,英国人则倾向于实验研究方面。但到了十九世纪,这两个国家在科学方法论上的分野基本上已经消失了,虽然这种分野的遗迹环继续存在着。(斯蒂芬· F · 梅森《自然科学史》,上海译文出版社,1980年第一版,409页)
概率论发生在欧洲大陆唯理论传统中,像其发现者帕斯卡就是笛卡尔的后辈与忘年之交,也是笛卡尔思想上的同路人与后继者。赌博中的随机事件对唯理论是一种挑战,特别对机械主义的决定论更是如此。数学是演绎逻辑体系【3】,为了把不确定性纳入这种系统,构建了古典概型,即有穷的等可能(或确定)的随机试验中的概率。这里可以看到对于问题限定的苛刻性和封闭性,这样演绎逻辑才可以施展手脚。如果在概率空间中,象统计学那样对基本事件采取开放态度,而且放弃等可能性假设,那么这个演绎系统就会被打破。亚里士多德以来的演绎逻辑处理确定性是有效的,当前提为真时结论为真,其推理过程有保真性,但是对于归纳逻辑来说,当前提为真时结论不一定为真,其推理没有保真性。要想在演绎逻辑中容纳不确定性事务,就必须让推理回避不确定性,而随机事件要经过严格限定等“特殊包装处理”才可进入演绎推导过程。
类似例证还有一些,比如陈希孺在《数理统计学简史》(湖南教育出版社,2002年第一版,17页)谈到:“伯努利对事物采取了一种机械决定论的观点,就是说,世界上的一切事物受到严格的因果律的支配,他分析掷骰子这个例子,认为:若把一切有关条件,包括骰子形状大小、质量分布、投掷的初始位置、外界条件等全部弄准了,则投掷结果也决定了,因此无随机性可言。后来的大家拉普拉斯也是采这种立场,……”,可见构造古典概型的思想传统中,对于世界的不确定性的态度是勉强的,至少是不够开放的。
与唯理论传统不同的是经验论的传统,我们看到欧洲当时最初的统计实践只是经验资料的搜集记录整理,简单的说是一种通过归纳发现知识和信息的粗糙过程。国势学的起源形态,就是驻外使节对于各国状况的记述【4】,恐怕连归纳也是极有限的,只是到了配弟才开始把数字作为统计的主要操作对象。
从思想传统的角度上讲,经验主义可以说是统计学发生的土壤或母体。对于经验形态的处理,培根的学说非常丰富,特别在其《新工具》中,他提出辨别排除假象的各种办法,即通过经验归纳得到真知的途径【5】。经验主义路线的后继者,在这方面有所发展的是穆勒(严复翻译他的《名学》,就是关于归纳逻辑的著作)以及凯恩斯等等。
培根的《新工具》是和亚里士多德的《工具论》相对立的。亚里士多德总结了希腊的逻辑学,当然主要是演绎逻辑。我们知道演绎逻辑是不能创造新知的。这种逻辑,在培根以前一千多年里被用于经院哲学的论证。其推理的前提是来自圣经或教会的信条。培根倡导“新工具”,使人们的知识探索从概念的循环往复里解脱出来,直接面对外部世界,通过实验探索自然,归纳经验得到新知,因此获得“实验科学之父”的称誉。
人们可能要问,通过经院哲学传承下来演绎逻辑被笛卡尔及后继者接过来以后,能用来创造新知吗?实际上,演绎逻辑用于理论科学,其推理前提和概念的定义却是来自现实世界,是新知体系的基础,演绎固然不能创造新知,新的公理和新的概念定义却蕴含了新知,但是不能说有了新前提就万事大吉,新的推论并非和其前提一样是不证自明的。因此演绎证明并没失去意义,我们需要演绎逻辑把推论变得明了,以便通过一般常识可以接受。(庞加莱甚至说,公理就是约定,证明过程有了前提和演绎法并不能自然而然的得到定理,这个过程中需要数学家按照一定次序排列推导的步骤才能有效。(参见昂利 · 彭加勒 ,《科学与假设》 , 李醒民译,商务书馆,2006年。))
培根路线体现了英国的思想传统和气质,这往往就意味要拒绝亚里士多德路线,比如达尔文就自认为是接受培根关于经验归纳的思想、亚当 • 斯密就表示拒斥亚理士多德以及经院哲学的演绎传统(见其《道德情操论》),他还是休谟的好友,后者是英国经验论的代表,他的经验主义人性论认为人自私天性是经济活动的原因,这种思想也表现在斯密的《国富论》基本思想中;数理统计的创始人之一高尔登是达尔文的表弟,进化论者,其研究方式是基于经验的,大陆那边是理论推导高斯分布,他在英国却独立地采用漏沙试验来得到它。在经验论影响下的人类取得的思想进步非常可观。马尔萨斯《人口原理》中到处是经验主义的叙述方式;进化论是通过经验资料的归纳得出的,而且反对目的论;亚当 • 斯密的《国富论》也是通过归纳经验资料推出理论的……。(一个非常有意思的例子是马克思,自欧洲大陆来到英国后写作《资本论》,受到斯密等人的启发,但是由于受黑格尔影响,他把经验归纳得来的结果进行倒叙,用辩证演绎构造理论。他从商品这个“细胞”开始,推导出整个资本主义经济关系) 旧的经验主义有打破教条面对现实的积极面,但是也有固守狭隘经验的另一面。旧的唯理论虽崇尚理性,但也有过分依赖推理以致脱离现实的毛病。经验论和唯理论在历史上也发生过很大的争论,主要就是在休谟和莱布尼茨间,众所周知,后来康德的成就在于批判综合这两条路线,这已不是本文所能讨论的了。
但是对于统计学来说,经验论与唯理论传统的交汇与合流孕育出新生儿。十九世纪末二十世纪初,英国统计学家接受了欧陆的概率论,又经过三十年的工夫数理统计才逐渐形态丰满。培根原来对科学假说是忽视的,而20世纪初推断统计的建立后,假设检验在精神实质上突破旧经验论的樊篱。而我们回头审视这些数理统计创建者时,发现他们或者是社会学家(皮尔逊)、或者是生物学家(孟德尔、高尔登、菲舍)甚至是酿造业工程师(高赛特)等等,他们原来都是从事实验、调查的人群。很难找到隐庐之中一纸一笔一香茗就可演绎造化的人。
数理统计产生前后,生物学以及社会科学,它们的榜样是物理学,甚至马克思都说任何一门学科只有运用了数学才算是成熟。马克思说此话时,物理学正跟着数学走公理化的道路,当时的背景是非欧几何出现后,数学家受到鼓舞,数学的公理化运动如火如荼。马克思所说的成熟标致相当程度上是以物理学为榜样的。但是,生物学和社会科学不确定性太多,像物理学那样走数学化的路线,甚至搞抽象的符号运算的前景都不看好。只是数理统计确立后,生物学和社会科学化解困境的黎明曙光才出现。
其实,在数理统计草创以前欧洲大陆已有比利时天文学家凯特勒把概率论用于社会统计。牛顿以来自然科学特别是物理学的巨大突进,刺激其他学科的数理方法应用,凯特勒的功绩就不说了,但他把社会看成物理的或机械的系统(他写了一部《社会物理学》)。在欧陆的唯理论氛围中机械主义和决定论流行,凯特勒对社会的认识也难免除其影响。这种影响让人们面对经验资料就想套用先验的理论模式,对于数理统计的发生不利。这和今天我们普遍承认世界中的不确定性的共识相差很远。这也部分反证了数理统计草创没有发生在欧洲大陆的原因。
在考察这段历史时,我们还要指出,理性主义两大传统到了十九世纪已经发生了变化,经验论中演化出实证主义,唯理论氛围中孕育着大反叛,即非理性主义。而且实证主义在数理统计学降生时就打下了印记,至今可在卡尔·皮尔森的相关理论中窥见一斑,它在我们今天的统计学观念里留下的影响是不可磨灭的。科学史家伊恩·哈金在他的《驯服偶然》(中央编译出版社,刘刚译,2000年3月第一版,338-339页)中指出皮尔森“是位实证主义者,而且对原因不抱偏见。在实证主义的准则中,原因是一种形而上学的观念。超越形而上学的一个好方法就是破坏因果性。……他说(引者注:皮尔森)在高尔顿之前,每个人都没注意到相关分析。大多数企图将定量分析应用于心理学、医学和社会学研究的人,不论是孔多塞还是凯特尔、甚至是拉普拉斯,都没把握住这个概念。”你看,欧洲大陆人没有经验主义背景,决定论、重视因果的规范式分析,使得他们对眼皮底下的变量间的关系从未考虑比较松散的角度去观察和把握,最后让英国人抓住了。
皮尔森的看法值得今天的人深思。培根说读史使人明智。现在统计学中,演绎性推导和证明不可避免,但是,如果使年轻学生误以为统计是演绎的学科,那是否是绝大的误导呢?在理论与经验之间我们如何取得一种明智的平衡呢?
今天,统计学领域依然活跃,孕育着某种突破。从各种迹象来看,传统的统计学已经造成某种桎梏,人们的经验和实践试图摆脱高斯分布框架。在当代,大家越来越觉得统计学的处理对象与其说是数据,不如说是信息甚至是经验。
欧洲两种思想传统的碰撞、分化、缠绕、融合,在思想史上、在哲学史和科学史上,当然也在统计学史中给我们留下无尽的经验和教益,让我们玩味和思索。
----------------------------------
注:
【0】这里要说明一下的是,这里的 Stephen M. Stigler , 不是 George Stigler ,那是他的父亲,后者是经济学诺贝尔奖得主。这里引用的著作是:The History of Statistics (The Measurement of Uncertanty before 1900 ),Harvard University Press,1986,Stephen M. Stigler .参见该书英文版第8章(265页以后)。
【1】连载在中国现场统计研究会主办的杂志《数理统计与管理》。这里引用的是1999年第5期57页。另外,陈先生在写作这篇《数理统计学小史》时,以及后来的《数理统计学简史》(湖南教育出版社)都参考了 Stephen M. Stigler 的上述著作。
【2】哲学史中对理性主义内的两个分支有不同的称呼,有把唯理论称作理性主义的。这里关于理性主义有两种定义,一是指启蒙运动后提倡人类理性的思潮,其中包含经验论和唯理论。二是,狭义的理性主义,就是指唯理论。对唯理论,哲学书中多称为理性主义,而思想史中采用唯理论称呼较多。关于理性主义内的两个分支的问题,国内比较好的专著是《欧洲的经验主义和理性主义》(余丽嫦著,人民出版社)。
【3】有人可能会提出数学中有所谓的“数学归纳法”,但是逻辑学家认为它实际上还是一种演绎逻辑。
【4】参见高庆丰《欧美统计学史》(中国统计出版社)关于国势派的部分。
【5】在逻辑学史中认为演绎逻辑在古希腊已经确立,但归纳逻辑几乎没有太多建树,其真正确立很晚,一般认为是培根开始,这以后经穆勒等人进一步发展。严复翻译的穆勒《名学》就是一部归纳逻辑著作。现在归纳逻辑有很大的发展,代数化的符号演算和概率论及统计方法的引入等等,对于逻辑学甚至统计学都造成很大的理论与学术的开拓机遇。