yuanxn
前言
这里是一组批判卡尔•波普尔的概率理论的文章。
波普尔是一个精通数理科学的哲学家,他曾经提出概率的倾向性诠释与量子力学的统计系综诠释。然而,正是在数理科学的领域中,他有两次颇为引人注目的败走麦城。一次是在《科学发现的逻辑》一书中,初出茅庐的波普尔试图设计一个违反“测不准原理”的“判决性实验”。当他认识到自己的错误时,有很长一段时间“处于一种失败主义的情绪中”。另一次是功成名就的波普尔预测检验贝尔不等式的实验将得出反驳量子力学的结论,结果却适得其反,使他大吃一惊。诚然,尽管有这种经历,波普尔仍然是二十世纪最卓越的学者之一。但这两次挫折毕竟表明在波普尔的哲学思想特别是他的概率理论有某些问题。问题究竟在什么地方呢?我将这一组文章中进行探讨。
概率与统计规律
—— 一评波普尔的概率理论
谭天荣
青岛大学 物理系 青岛 266071
内容提要:本文指出:一个事件之所以是随机事件,不是因为它不能预测,而是因为我们发现了某种统计规律,该事件是服从这一统计规律的大量事件中的一个事件;概率计算是从统计的前提得出统计的结论,而不是从“无知”得出“在实践中得到光辉的验证的结论”。
关键词:卡尔•波普尔;概率理论;随机事件;统计规律;统计资料
中图分类号:O21;B561.5
1. 引言
本文将考察波普尔关于随机事件的含义和概率计算的实质的论点。
在《科学研究的逻辑》一书中,波普尔写道:随机事件的特征是一种特殊的不可计算性,这使得人们经过许多次不成功的尝试后倾向于相信,一切已知的理性预测方法用于这些事件必定失败。可以说,我们感觉到除了先知以外没有一个科学家能够预测它们。然而正是这种不可计算性使我们得出这样的结论:概率理论能够应用于这些事件。
概率计算使我们从不可计算性达到可计算性(即达到某种计算的可应用性),这一结论有点悖论性质。我们如何解释这个事实:我们可从无知中得出在实践中得到光辉的验证的结论呢?我将这一问题称之为机遇理论的基本问题,甚至频率理论直到现在还不能对这个问题提供一个令人满意的解答。
(上面引用的基本上是波普尔的原话,但为了与上下文一致,我不得不稍作词句上的修改。在这种情形下,我不用引号。)
下面是我对波普尔的这一论点的评论。
2. 随机事件与统计规律
在日常生活的用语中,我们可以把“事件”分成“必然事件”、“不可能事件”和“随机事件”三种,必然事件是概率为1的事件,不可能事件是概率为0的事件,而随机事件则是概率大于0小于1的事件。所谓“机遇理论”或“概率理论”就是考察随机事件的理论。那么,按照这种日常生活的理解,一个事件怎么会是一个随机事件呢?让我们先看一个例子。
掷硬币是典型的随机事件:把一枚硬币一再地随手一掷,这枚硬币一会出现正面,一会出现反面;但是,当掷的次数增多时,出现正面的次数与出现反面的次数将趋于相等;在任意给定的场合,当掷的次数足够多时,就可以认为出现正面的次数与出现反面的次数是相等的(即可以忽略出现正面的次数与出现反面的次数之间的微小差别)。这一经验事实可表成:在大量掷硬币的事件中,硬币出现正面的相对频率是1/2。在这种意义下,我们说“单次掷一枚硬币,它出现正面”的概率是1/2。为什么这一事件有确定的概率1/2呢?因为有“在大量掷硬币的事件中,硬币出现正面的相对频率是1/2”这一经验事实,这一经验事实乃是一个统计规律。因此,在这个例子中,统计规律乃是一个事件成其为“随机事件”的前提。
波普尔提到一个类似的例子——掷骰子,他认为‘这一次掷骰子出现5点’这一事件之所以是随机事件,是因为掷骰子的结果不能预测。波普尔承认骰子的运动遵循牛顿力学定律,不能预测的是它的初始条件。为了保证掷骰子的结果不能预测,波普尔还特别说到防止我们测量骰子运动的初始条件“游戏规则”。例如骰子必须是均匀的;它必须在一个封闭的容器中“好好摇动”,等等。
如果考虑另一个例子,我们将发现,波普尔的这种思考诚然细致入微,却不得要领。设想有一位射手练习打靶,他发射的每一发子弹都落在靶上某处。或许,迄今为止还没有人专门研究骰子运动的动力学规律,但子弹的运动的动力学规律——弹道学,却是人们精心研究过的。一颗子弹从发射到落在靶上的运动过程,服从弹道学的规律,这种运动过程似乎不能说是除了先知以外没有一个科学家能够预测的,也不曾有人刻意制订某种游戏规则以保证它的初始条件的不可预测性。但是,一颗子弹落在靶上某处仍然是一个随机事件。为什么呢?这是由于有如下经验事实:如果这位射手连续射击,发射了一千发子弹,每一颗子弹都射在靶上,则一种与弹道学规律迥然不同的另一种规律起作用了。这一千发子弹的落点在靶上形成一种颇为规则的分布。如果这位射手再一次射出一千发子弹,还会形成一个大同小异的分布。
如果我们在靶上给出一个坐标系,使得靶上的一个位置对应坐标(x, y),则大量子弹的落点在靶上的分布,可以由一个二元函数F(x,y)来描写:如果靶上一共有N颗子弹,是靶上一个位于(x, y)附近的一个足够小的区域,其面积也记作,则该小区域内的落下的子弹数大致为n=NF(x, y)。在这种意义下,我们说这位射手射出的单发子弹落在中的概率为n/N=F(x, y)。这个概率既不是1也不是0,而是某一介于1与0之间的数值。因此我们说这发子弹落在中是一个随机事件。
当射手发射子弹时,他瞄准的是靶心,由于眼睛和手的偏差,由于风向或其他干扰,这颗子弹偏离了靶心。诚然,这些导致子弹偏离靶心的上述主观的和客观的因素是难以预测、难以控制的。但是,这发子弹落在中是一个随机事件这一结论所表现的不是因为使它偏离靶心的各种因素不能预测,而是因为我们发现了大量子弹落点的统计规律。
在这里,概率计算的前提是F(x,y)这一统计分布函数,这是一个统计的前提,结论是单发子弹落在中的概率是F(x,y),这是一个统计的结论。我们由此得出一般结论:概率运算是从统计的前提得出统计的结论,而不是从“无知”得出“在实践中得到光辉的验证的结论”。
波普尔非常关注概率在物理学中的应用,在这里,随机事件的含义与概率运算的实质表现得格外明显。
以分子运动论为例,用f(v)表示麦克斯韦速率分布函数,a表示置于某一容器中的气体的一个分子,则事件“分子a处于速率间隔[v,v+dv]”的概率是f(v) dv。如果没有麦克斯韦速率分布函数所表示的统计规律,就根本谈不上f(v)dv这一概率,而我们就不会遇到“分子a处于速率间隔[v,v+dv]”这一随机事件。分子运动论从这一统计前提导出了许多统计的结论,其中之一是给出气体分子的平均自由程。
吉布斯正则系综是概率在物理学的应用获得极大成功而又没有多少争议的例子。在这里,统计规律表现为一个基本假设,它是描写大量分子的状态分布的函数。加上某些辅助假设,这个函数可导出热力学的全部定律,还能导出某些热力学之外的结论,例如热力学量的涨落。有了这一统计规律,一个由大量分子组成的系统处于某一微观状态才成其为随机事件。在这里,概率运算是从表现为基本假设的统计前提得出种种表现为可以观测到的统计结果。
最后,我们提一下量子力学。以电子衍射过程中单个电子在屏幕上的落点为例,由于迄今为止,我们没有发现单个电子的动力学规律,甚至有没有这样的规律还是一个争论中的问题,因此,“单个电子落在屏幕上某一位置”这一随机事件就显得是“除了先知以外没有一个科学家能够预测的”的事件。或许,波普尔正是在这里引出他这一如此独特的论点。然而,量子力学的应用虽然获得了不容置疑的成功,它的基本概念却还处于剧烈争论的阶段。我们认为,要弄清“随机事件”这样的极为初等的概念的含义,不宜诉诸像量子力学这样过分专门而又处于争论中的科学分支。
3. 随机事件与统计资料
随机事件并不是总以某一统计规律为前提。例如,如果我们说“‘张三得肺结核的概率’是0.02”,那么,在这一命题有意义的限度内,它是指
第一,张三属于某一人群G;
第二,人群G有2%的人得了肺结核。
既然“张三得肺结核”这一事件的概率是0.02,既不是1也不是0,“张三得肺结核”就是一个随机事件。显然,张三是否得肺结核这一问题决不是除了先知以外没有一个科学家能够预测的,我们也从来没有试图对这一问题作过“理性预测”。因此,我们所考察的这一随机事件,更没有波普尔所说的特征。
如果说射手打靶时大量子弹形成规则分布是一个统计规律,那么张三所属的人群得肺结核的比例是2%就只能说是一种“统计资料”,说不上是什么规律。
有时候,概率计算的前提一部分是统计资料,一部分是统计规律。下面,我们举概率论教程中常见的例子。
设在市面上流通的某种金币中有百万分之一是假币,这种假币的两面都是正面,而a是一枚这样的金币,若一再地把a随手一掷,一连出现100次正面,则它以后会出现反面的概率为1024。证明如下。
令A表示“a是假币”,B表示表示“a是真币”,则A与B的概率分别为:
Pr(A)=106; Pr(B)=1-106。
如果a是假币,则每次掷它只能出现正面,从而它一连出现100次正面的概率为1。如果a是真币,则它出现正面的概率为1/2,从而一连出现100次正面的概率为(1/2)100。用C表示“a一连出现100次正面”,则上面的结果表成:
Pr(C|A)=1; Pr(C|B)=(1/2)100。
a一连出现100次正面之后,它是真币的概率表成Pr(B|C),根据Bayes公式,有:
Pr(C|B)=Pr(B)•Pr(C|B) Pr(A)•Pr(C|A)+Pr(B)•Pr(C|B)=(1-106)×(1/2)100 106×1+(1-106)×(1/2)100≈1024 。
当且仅当a是真币时,它有可能出现反面,因此,a在第100次出现正面之后还出现反面的概率是1024。
上面的计算有两个大前提:
第一,某一金币集合有百万分之一是假币,其两面都是正面。
第二,将一枚真的金币随手一掷,出现正面的概率是1/2。
在这里,第一个前提则是统计资料,第二个前提则是统计规律。从这两个前提我们几乎可以肯定,如果a一连掷100次都出现正面,则它一定是假币,从而几乎可以肯定,以后再掷这枚金币,只会出现正面,不会出现反面。这个结论肯定会得到证实,或许,它可以算得上是波普尔说的从概率计算“得出在实践中得到光辉的验证的结论”的例子。但是,这一结论的前提并不是“无知”,而是上述统计资料与统计规律。诚然,从统计资料与统计规律只能得出具有统计性质的结论,即得出由概率表示的结论。但是,当某些概率非常接近1或0时,就能对单个事件作出“几乎肯定”的预测。
4. 随机运动与规则运动
在《科学发现的逻辑》一书的《定律与机遇》一节中,波普尔写道:
“人们有时听说,行星的运动服从严格的定律,而一粒骰子的掷下是碰运气,或受机遇支配。我认为区别在于这个事实:迄今我们已能成功地预测行星的运动,但还不能预测掷骰子的个别结果。”
下面,我们把波普尔这里说的服从严格的定律的运动称为“规则运动”,而把受机遇支配的运动称为“随机运动”。行星的运动是规则运动,而一颗骰子的运动则是随机运动。波普尔认为,区别在于规则运动是可以预测的,而随机运动则是不可预测的。波普尔承认,这种划分有一定的主观性,例如,“可以设想,仪器设备精良的物理学家,能观测其它人预测不到的一次掷骰子的结果。”
波普尔还说:“与这种主观观点相反,人们有时支持一种客观的观点。就这种观点利用事件本身是指决定的还是不决定的这种形而上学观念而言。”
下面,我们提出第三种划分标准。
还是以射手打靶为例,单颗子弹的运动服从牛顿力学定律,从而是规则运动。但是,大量子弹的运动服从运动统计规律,在这种意义下,单颗子弹的运动却是随机运动。因此,单颗子弹的运动既是规则运动又是随机运动。
当我们考察气体的大量分子的运动的统计规律时,单个分子的运动就是随机运动。但是,在经典统计力学的前提下,单个分子的运动服从牛顿力学的动力学定律,在这种意义下,它的运动是规则运动。另一方面,人们或许都承认天体的运动是规则运动,但是,当我们考察例如一个像银河系这样的包括千百万个天体的“宇宙岛”的整体运动的统计规律时,单个天体的运动就是一种随机运动了。因此,单个分子的运动和单个天体的运动都既是规则运动又是随机运动。
现在,我们用另一种用语表达上面的结论。无论是分子,天体还是子弹的运动,都服从严格的动力学规律,在这种意义下,它们的运动是规则运动。但是,当我们考察大量分子、大量天体或大量子弹的统计规律时,单个分子、单个天体或单颗子弹的运动就成了随机运动。或者说,它们的运动具有随机性。由此我们得出结论,随机性并不是某种运动的固有属性;它是一种相对统计规律而言的性质,一种满足动力学规律的规则运动,相对于统计规律就成了随机运动,正如单个事件相对于大量事件的统计规律就成了随机事件一样。
5. 热寂说
物理学史上许多疑难,与人们把随机运动看作某种运动的固有属性有关,所谓“热寂说”就是其中之一。
热寂说的疑难可以追溯到亚历斯多德的时代,按照亚历斯多德的物理学,万物之所以运动,是因为它们都有走向自己的“自然位置”的趋向。人们难免会问,有朝一日万物都达到了自己的自然位置,这个世界不就静止下来了吗?热寂说只不过在新条件下,用新的用语提出了这一古老的问题。
在《自然辩证法》一书的《导言》中,恩格斯这样提出了热寂说的疑难:
“……地球,一个像月球一样的死寂的冷冻了的球体,将在深深的黑暗历沿着愈来愈狭小的轨道围绕着同样死寂的太阳旋转,最后就落到它上面。其他行星也将遭到同样的命运,有的比地球早些,有的比地球迟些;代替安排得和谐的、光明的、温暖的太阳系的,只是一个冷的、死了的球体在宇宙空间里循着自己的孤寂的道路行走着。我们的太阳系所遭遇的命运,我们的宇宙岛的其他一切星系或早或迟地都要遭遇到,其他一切无数的宇宙岛的星系都要遭遇到……
“但是,当这样一个太阳系完成了自己的生命行程并且遭遇到一切有限物的命运,即死亡的时候,以后又怎么样呢?”
这里,恩格斯所描写的太阳系的末日,是当时人们的认识,现在人们已经有了不同的认识:太阳系确实有自己的末日,但不是这样的末日。这一点并不重要,重要的是顺着恩格斯的思路,似乎可以得出如下结论:
第一, 我们的宇宙岛的每一颗恒星都是有限物,从而都会死亡。
第二, 我们的宇宙岛也是一个有限物,它也会死亡。
第三, 当我们的宇宙岛的每一颗恒星都死亡时,我们的宇宙岛的末日就来到了。
这些结论对不对呢?
我们知道,单个原子总是倾向于从激发态转移到基态。如果一个原子处于寂静的天空,它或许可以在某一激发态滞留几百天,但终究会达到基态,以后只要没有外界干扰,它就会永远滞留在基态。用亚历斯多德的话来说,基态乃是原子的自然位置,原子总是倾向于走向自己的这一自然位置,这是一种不可逆的进程。另一方面,如果大量相同的单原子分子形成气体,则这些原子的状态会倾向于某种分布,这种分布乃是气体的自然位置,这又是一种不可逆的进程。这里有一个明显的事实:当这种气体达到自然位置即达到它的平衡状态时,它的诸原子的状态分布并不是每一个都处于基态。
现在我们转向天体,像太阳这样的恒星的演化有一定方向,它们最终要演化成为白矮星或中子星这样的星体残核。这种星体残核乃是恒星的演化的自然位置。另一方面,像银河系这样的“宇宙岛”,其诸恒星的状态会倾向于某种分布,这种分布乃是该宇宙岛的自然位置。同样明显的事实是:当一个宇宙岛达到平衡状态时,它的诸恒星的状态分布并不是每一个都成为星体残核。
从上述事实我们得出一个结论,在另一个地方,恩格斯已经给出了这一结论。他提出了如下命题:
“个别运动趋向于平衡,而整体运动又破坏了个别的平衡。”
他只是忘了补充一句:“整体运动破坏个别的平衡,是为了达到整体的平衡。”
例如,气体中的每一个原子趋向于达到基态,但气体为了达到整体的平衡,即它的诸原子达到与气体的平衡状态相对应的状态分布,不得不破坏每一个原子都走向基态的趋向。同样,我们“宇宙岛”的每一颗恒星趋向于走向星体残核,但宇宙岛为了达到整体的平衡,即它的诸恒星达到与宇宙岛的平衡状态相对应的状态分布,不得不破坏每一颗恒星走向星体残核的趋向。
热寂说可以表述为:“整个宇宙将达到其自然位置”。但我们已经看到,宇宙分为一些层次,它的各个层次各有其自然位置,甚至两个相邻的层次也没有共同的自然位置,因此不可能有“整个宇宙的自然位置”。
那么,热力学第二定律所表述的不可逆性是不是适用于“整个宇宙”呢?宇宙的各个层次走向其自然位置的趋向都是一种不可逆性。热力学第二定律所表述的不可逆性适用于从气体的诸原子走向对应于气体平衡状态的状态分布到恒星走向星体残核这一广阔领域(这个领域可以用玻尔兹曼常量来表征)的一切过程。但它不能描写单个原子走向基态的不可逆趋向,也不能描写银河系诸恒星走向对应于整个宇宙岛的平衡状态的状态分布的不可能趋向。因此,热力学第二定律所表述的不可逆性不适用于“整个宇宙”。
综上所述,我们得出结论:宇宙的每一个层次都在走向自然位置,但各个层次走向自然位置的不可逆趋向相互冲突、相互制约,因此任何一个层次都不可能一直滞留在自然位置。
6. 波普尔的无人岛
在《科学研究的逻辑》一书的《对量子论的若干意见》这一章的开头,波普尔写道:
“我们对概率论的分析,已使我们掌握一些工具,我们现在可通过应用它们于现代科学一个主要问题来检验它们;并且我将借它们之助试图分析和澄清现代量子论若干更为模糊不清的论点。
“我用哲学或逻辑方法解决物理学中心问题之一的有点大胆的尝试,必定会引起物理学家的怀疑。我承认他们的怀疑是正当的,他们的怀疑是有充分根据的,然而我希望我也许能够克服他们。同时,值得注意的是在每门科学分支中,成堆的问题主要是逻辑的。量子物理学家一直渴望参与认识论讨论,这是事实。这提示他们本身感到量子论中某些仍未解决的问题的解法不得不在逻辑与物理学之间的无人岛上寻找。”
在这里,波普尔提出了三个论点:
第一, 物理学的每个分支都有成堆的问题;
第二, 这些问题主要是逻辑的,其解法不得不在逻辑与物理学之间的无人岛上寻找;
第三, 概率理论是解决这些问题的主要工具。
关于这里的第三个论点,波普尔在《无尽的探索》一书中明确断言:“量子力学的诠释问题都可以追溯到概率计算的诠释问题。”他还给出了如下两个著名的结论:第一,海森堡原理是统计学的离散关系;第二,“波包收缩”是一种普遍的概率效应。这些结论我们将在以后逐一考察。
热寂说无疑是波普尔说的“成堆的问题”中的一个,而且这个问题确实主要是逻辑的,我们上面的解法确实也是在逻辑与物理学之间的无人岛上找到的。但是,物理学各分支中的问题更多是数学和物理学方面的。在本文的附录中,我在分子运动论和系综理论中,各举一个这种问题例子。
7. 几句题外的话
我想,只要有足够的耐心,每一个物理系的本科生都不难看懂附录中的内容。这并不需要高深的数学,也不要什么前沿的物理学知识。但请不要走极端,以为其中只有加减乘除,只有牛顿第二定律。不,你必须学过统计物理学,而且学得比较认真,还有一个条件,你不要指望读完这篇文章能得到什么“收益”。
如果你确实看懂了附录中的这两个例子,而你又没有过多的偏见,就肯定会得出结论:前人确实在我所考虑的问题上有所疏忽,我确实解决了两个微不足道的历史遗留问题。但在欣赏之余,你难免会为我惋惜,有这功夫怎么不去研究几个前沿的问题,搞这些陈谷子烂芝麻的东西有什么意思?如果你早年不把时间浪费在这种问题上,而是及早奔赴前沿,你就不会像今天这个样子了。
问题就在这里!稍稍有点才能的人都不屑于作我所作的工作。一代又一代的物理学家都匆匆赶往前沿,一路留下了太多由于疏忽而造成的错误,留下了太多由于错误而造成的疑难,留下了太多为解决这些疑难而建立的新学说、新理论、新体系和不可思议的“新颖观念”。
分子运动论和系综理论无疑是经典物理学的重要组成部分,我们在这里指出这两个错误是因为它们恰好与本节考察的概率与统计规律的问题有关。不幸的是,物理学的每一个领域都有类似的错误,而且这些错误已经积累了好几个世纪。这些错误有些从来没有人觉察过(例如,气体分子有两种平均自由程),一些曾经一度困扰过当时的物理学家(例如,压强涨落问题),但现在已经被人遗忘,再也无人理睬。不幸的是,这些错误不会因为你未察觉或不理睬而安安静静地沉睡,它们在成长,它们在繁殖,它们在变异,所有这些错误现在已经聚积为一个整体,形成了物理学机体上的恶性肿瘤。十九世纪末叶以来一次又一次的物理学危机就是这一恶性肿瘤的确定无疑的症状。
因此,我完全同意波普尔关于物理学的每个分支都有成堆的问题的结论,但我认为实际情况比波普尔说的还要严重得多,而且这些问题远不是在波普尔的无人岛上能解决的。
我写这组文章批判波普尔,不是因为波普尔与我分歧最多,而是恰好相反,是因为对于物理学的现状和概率与物理学的关系等问题,我与波普尔的观点最接近。在批判波普尔时,我将以波普尔的观点为起点阐述自己的观点,这是一条事半功倍的途径。另一方面,我选择这位鼎鼎大名的西方学者为对手,也是为了使别人能注意到我这无名小卒。
附录
附录1 气体分子的两种自由程
在分子运动论发展初期,有人提出异议:按照这个理论,分子应该具有每秒数百米的速率,而事实上气体的扩散却缓慢得多。为了解决这一矛盾,人们引进了气体分子的平均自由程的概念。当麦克斯韦的速率分布函数已经给出以后,用这个函数来计算这个平均自由程应该说是分子运动论的最基本、最主要的工作之一。可是在这里,人们却遇到了问题。这问题不是得不到自由程的平均值,而是先后得出两个平均自由程的表达式:一个称为麦克斯韦自由程,另一个称为泰特自由程。这样,这两个表达式到底哪一个是真正的平均自由程就成了问题。下面我们给出这两种自由程的表达式,并阐明其含义。
设容器V中盛有某种纯气体,有N个分子,已经达到热平衡。在某一时刻,气体中的N个分子有各式各样的速率,用f(v)表示麦克斯韦速率分布函数,则这些分子的平均速率为v=0+vf(v)dv。现在我们证明,这个平均速率也是单个分子在一段足够长的时间内的速率的平均值。
观察某一分子a,设它在一段足够长的时间T内飞过的总路程为L,则其速率的长时间平均值为L/T。现在考虑全体气体分子的长时间平均值v,由于气体达到了平衡,全体气体分子的平均速率在任一时刻是一样的,因此,v=v。另一方面,每个分子的长时间平均值是一样的,因此,v=L/T,于是v=L/T。由此我们得出结论,分子a在时间T内飞过的总路程为L=vT,这里,v是全体气体分子在观察时刻的平均速率。
把速率分成一些间隔,其中第k个间隔的速率约为vk,我们把速率在这一间隔内的分子称为vk分子。设在容器中的N个分子中,在t=0时刻有Nk个vk分子;在时间间隔(0, )内,vk分子与其他分子碰撞了Mk次。一个vk分子与其他分子碰撞过之后,一般就不再是vk分子,因此,在时间间隔(0, )内,一个vk分子最多只能与其他分子碰撞一次。但有可能某一分子在t=0时刻不是vk分子,在时间间隔(0, )内经过碰撞变成了vk分子,然后又经历一次碰撞,这第二次碰撞将对Mk作出贡献。如果足够小,则这种第二次碰撞的贡献可以忽略。这样,Mk是t=0时刻的vk分子在时间间隔(0, )内与其他分子碰撞的次数。因此比值Mk/Nk小于1。这个比值称为单个vk分子在时间间隔(0, )内的可几碰撞次数;k=Mk/Nk则称为单个vk分子的可几碰撞频率。用p表示一个vk分子在时间间隔(0, )内与其他分子碰撞的概率,则有
Mk=Nkp1+Nk(1p)0=Nkp
于是k=Mk/Nk=p乃是单个vk分子在时间间隔(0, )内与其他分子碰撞的概率。
在时间间隔(0, )内,N个分子的总碰撞次数是kMk=kNkk,从而单个分子的可几碰撞频率是kNkk/N,它是各种速率的分子的可几碰撞频率的平均值。如果速率间隔分得无限细,这个求和过渡到积分,用v表示速率为v的分子的可几碰撞频率,v表示单个分子的可几碰撞频率,则有v=0+vf(v)dv。同样可以证明,每一个分子在长时间T内碰撞了v次。
于是,分子a在时间T内飞过的总路程为L=v,与其他分子碰撞了v次。平均地说,它在两次碰撞之间飞过的路程为M=v/v。在分子运动论中,一个分子在两次碰撞之间飞过的平均路程称为“自由程”。因此,M乃是单个分子的自由程的长时间平均值,也是全体气体分子的自由程的平均值。这个平均值就是麦克斯韦自由程。
现在考虑另一种路程的平均值。
令G(x)表示我们所观察的气体中的一个速率为v的分子从观察时刻起飞过了路程x尚未与其他分子碰撞的概率。由于气体已经达到平衡,这个概率与观察时刻无关。设a是某一分子,在t=0时刻速率为v,考虑如下三个事件:
A:a从t=0时刻起,飞过了路程x尚未被碰。
B:a从t=0时刻起,飞过了路程x+y尚未被碰。
C:a从t=x/v时刻起,飞过了路程y尚未被碰。
根据定义,事件A的概率Pr(A)=G(x);事件B的概率Pr(B)=G(x+y);如果已知条件A成立,则C事件的概率Pr(C|A)=G(y)。显然,B=AC,从而
Pr(B)=Pr(AC)=Pr(A)Pr(C|A),
即
G(x+y)=G(x)G(y)。
不难解出,G(x)=ex,其中是待定常量。
把一个分子从观察时刻起到第一次与其他分子碰撞为止飞过的路程称为“自由前程”。则事件A可表成:“以t=0为观察时刻,a的自由前程大于x。”考虑事件:
D:以t=0为观察时刻,a的自由前程大于x,但不大于x+dx。
按照定义,事件D的概率
Pr(D)=G(x)-G(x+dx)=-G’(x)dx=- ex dx。
取x=0,dx=vdt,则上式给出结论:a在时间间隔(0, dt)中被碰的概率是-vdt。另一方面,根据v的定义,它在时间间隔(0, dt)中被碰的概率是v dt。于是,=-v /v。
由于诸分子无规则运动,同样是速率为v的分子,其自由前程是各式各样的。这些自由前程的平均值v称为单个速率为v的分子的可几自由前程。根据定义,v=0+xPr(D)。将上式代入,得到v=-1/=v/v。
全体气体分子的平均自由前程是各种速率的平均自由前程的平均值:
T=v=v/v=0+v—vf(v)dv。
这个平均自由前程就是泰特自由程。
似乎不曾有人明确区分自由程与自由前程两个概念,但显然已经有人看到,在考虑气体扩散的快慢时,起作用的是自由程的概念;而分子射线实验所测量的平均路程,则是平均自由前程。伯克利的《统计物理》一书甚至把这里的自由前程作为自由程的定义。妨碍人们意识到这两种路程有不同平均值的或许是如下事实:既然气体已经达到平衡,一个分子的可几自由前程与观察时刻无关,因此如果一个分子在观察时刻刚刚碰过一次,则它的自由前程与就是它的自由程。于是自由程与自由前程应该有相同的平均值。这种想法对于给定速率的分子的平均值是正确的:速率为v的分子的平均自由程和平均自由前程都是v=v/v。但不适用于全体气体分子的平均值。
全体气体分子的平均自由程乃是如下分子集合的平均自由前程。它的每一个分子在观察时刻刚刚碰过一次,其速率则是随机的。这个分子集合的速率分布函数却不再是f(v)。设是一个正的无穷小量,则在时间间隔[, 0]碰过一次并且速率间隔[v,v+dv]中的分子集合的分子数与vf(v)dv成正比。从这个表达式可得出归一化速率分布函数(v)= v——vf(v)。这样,在观察时刻刚刚碰过一次的分子的平均自由前程应该是
M=0+v—v(v)dv。
于是我们再次得出结论,全体气体分子的平均自由程是麦克斯韦自由程。
我们看到,麦克斯韦自由程与泰特自由程原是不同物理量的平均值,却被理解为同一物理量的不同的平均值。人们甚至还说,泰特自由程是比麦克斯韦自由程更精确的平均值。这虽然只是一个微不足道的误解,但迄今为止从来没有人弄清过。
附录2 压强的涨落公式
吉布斯的系综理论把一个热力学体系看作一个力学系统。若它有n个自由度,则其状态由2n个正则变量,即由n个广义坐标和n个对应的广义动量组成的2n维数组
(q, p)=(q1,…,qn; p1,…,pn)
来描述,状态随时间的变化满足哈密顿方程。除正则变量以外,哈密顿方程中的哈密顿函数中的宗量还有一组“外参量”,它们是热力学中的广义坐标。如果系统的体积V是唯一的外参量,则哈密顿函数表成H(q, p; V)。
正则变量(q,p)也称为“相变量”,任一函数f(q, p; V)称为“相函数”,吉布斯的系综理论把热力学量看作某一相函数的平均值,特别是,内能是哈密顿函数的平均值,压强是哈密顿函数对V的偏导数的平均值:
U=H; P=-(H——V)qp。
系综理论不仅能得出热力学的基本方程,而且还能得出热力学量的“涨落公式”。我想不会有人否认,给出压强涨落的表达式是系综理论的一个最基本、最主要的工作之一。然而偏偏在这一工作中,人们遇到了意外的挫折。
从上述压强的表达式自然得出结论:相函数-(H——V)qp是压强的微观值或“微观压强”。由此可得到压强的涨落表达式:
D(P)=kT[(P——V)T+(2H——V2)qp]
从吉布斯开始,人们从这一公式总是得出令人烦恼的结论。例如,著名的物理学家R. H. Fowler把这一公式应用于如下实例:设容器中盛有N个相同的单原子分子组成的理想气体,则单个分子的哈密顿函数为
=1——2m( px2+py2+pz2)+(x,y,z)。
其中(x,y,z)是如下势函数:当(x, y, z)在容器中时为0,当(x, y, z)在容器外时为无穷大,它表示分子不能离开容器。这个函数可以用一个叫“壁势”的一元函数来表示,这个壁势函数还把容器的体积V作为外参量引进哈密顿函数。气体的哈密顿函数是N个单个分子的哈密顿函数之和。这个函数对V的偏导数时,要求对壁势求导。但根据定义,壁势的导数没有意义。Fowler把壁势改成某一陡峭的连续函数,并从它计算出结论:气体压强的涨落与容器的性能有关,这是一个很费解的结论。
另一方面,涨落还可以用“准热力学方法”计算,在与正则系综相同的前提下,“准热力学方法”给出压强的涨落公式为
D(P)=kT[(P——V)T-(P——V)S]。
Fowler得出的结论与用准热力学方法得出的结论也不一致。
按理说,从系综理论应该可以得出准热力学方法的涨落公式,但对于这一令人望而生畏的任务,前人似乎都不敢问津。著名的前苏联物理学家兰道,为物理学写了一套百科全书式的教程。看来,对这一问题他也力不从心。他用“准热力学方法”计算了各种物理量的涨落,也用系综理论计算了某些物理量的涨落,唯独回避了从系综理论得出压强涨落的计算。难能可贵的是,我国物理学家王竹溪明确提出了这一问题,并承认这个问题还没有令人满意的解答。
在这里,人们忽略了一个细节:如果通过变换q*=q*(q, V)取另一组广义坐标,并取与之对应的广义动量p*=p(q, p; V),可得到对应的哈密顿函数H*=H*(q*, p*; V),还可得到对应的偏导数-(H*——V)q*p*。不难证明,虽然两个相函数-(H*——V)q*p*与-(H—V)qp具有相同的平均值,但它们本身却并不相等,从而它们不可能都是压强的微观值。因此,从压强的平均值表达式我们只能得出结论:存在一组正则变量(q, p),使得-(H——V)qp是压强的微观值。我们把这样的正则变量称为关于外参量V的“特征相变量”。问题在于,在一定的场合,相变量往往是已经给定的,我们怎么知道它是不是特征相变量呢?下面我们提供一个判据。
设系统的熵函数为S=S(P, V),则系统的宏观态也可以由(S, V)来描写。设宏观态(S, V)对应一个正则系综,它有m个微观系统,在观察时刻,其中的第k个微观系统的状态为(qk, pk; V),则系统的内能作为哈密顿函数的平均值表成U(S,V)=1—mkH(qk,pk;V),其中k从0至m取和。若V1与V足够接近,则近似地有
(H——V)qp =H(qk, pk; V1)-H(qk, pk; V)——————————————V1-V。
另一方面,热力学关系P=-(U——V)S可表成
P(S, V)=-U(S, V1)-U(S, V)——————————V1-V。
考虑到P(S, V)=1—mkf(qk, pk; V)和U(S, V)=1—mkH(qk, pk; V),从上式两式可得到
U(S, V1)=1—mkH(qk, pk; V1),
这一结果暗示:m个微观态
(q1, p1; V1), (q2, p2; V1), ……(qm, pm; V1)
形成对应于宏观态(S,V1)的正则系综。根据这一暗示,我们提出如下判据:
判据1:(q, p)是关于V的特征相变量的必要充分条件是:如果将宏观态(S,V)的正则系综中的每一个微观态(q, p; V)换成(q, p; V1),则得到对应于宏观态(S,V1)的正则系综。
设w(q, p; V)是某一相函数,其系综平均值是W(S,V),则当V1与V足够接近时,有
(W——V)S=W(S, V1)-W(S, V)——————————V1-V。
另一方面,若(q, p)是V特征相变量,m个微观态(qk,pk;V)是对应于宏观态(S,V)的正则系综,则根据判据1,m个微观态(qk,pk;V1)形成对应于宏观态(S,V1)的正则系综。这样,我们有
W(S, V)=1—mkw(qk,pk;V); W(S, V1)=1—mkw(qk,pk;V1)。
代入上式,得到
(W——V)S=kw(qk, pk; V1)-w(qk, pk; V)——————————————V1-V。
右边正是偏导数(w——V)qp的平均值,于是有
(W——V)S=(w——V)qp。
取w=H,得到(U——V)S=(H——V)qp;取w=(H——V)qp,得(P——V)S=-(2H——V2)qp。于是,我们从正则系综的压强涨落公式过渡到准热力学方法的压强涨落公式。
在Fowler的上述计算中,(x, y, z)是固定在地面上的坐标系的坐标,气体的哈密顿函数中的相变量是由这种坐标给出的。根据判据1可以得出结论:对于V的特征相变量不是这组相变量而是取固定在容器上的“活动坐标系”得到另一组相变量,对于后一组相变量,外参量V不是出现在势能而是出现在动能的表达式中,这时很容易计算出压强的相对涨落,并得出与准热力学方法一致的结论。
至此,正则系综的压强涨落问题已经彻底解决。可惜的是,已经晚了一点。当代的物理学家们早已把这个问题忘了。一代又一代的物理学家都匆匆赶赴前沿阵地攻克新的课题,一路留下了太多没有弄清的问题,这又是其中的一个。
Probabilities and Statistical Laws
——A Comment on Popper’s Interpretation for Probability
TAN Tianrong
(Department of Physics, Qingdao University, Qingdao 266071, P.R.China.)
Abstract: It is pointed that the reason why an event is a stochastic event because that a certain statistic law about a great lot of events has been found and the very event is one of them, instead of because it is impossible of calculation; also, the essence of probabilistic calculations is reaching statistic conclusions form statistic promises instead of from “ignorance” to obtain results which is gloriously verified by practices.
Key words: Karl • Popper; theory of probabilities; stochastic events; statistic laws; statistic data
yuanxn
概率与相对频率
——三评波普尔的概率理论
谭天荣
青岛大学 物理系 青岛 266071
内容提要:本文指出:概率的定义有两种稍微不同陈述方式,按照第一种陈述,相对频率就是概率;按照第二种陈述,相对频率与概率是不同的概念:概率依赖于观察者;相对频率则与观察者无关。只有在一定条件下,这两个不同含义的量才在数值上相等。关于概率的许多争论,特别是概率的主观诠释与客观诠释之间的争论,都与这两种陈述的微妙区别有关。波普尔采用的是第一种陈述,但他也承认存在第二种陈述。在此基础上他创建了一个复杂的概念体系。本文将考察波普尔的这一概念体系。
关键词:卡尔•波普尔;相对频率;参考序列;客观概率;全称陈述的概率
中图分类号:O21;B561.5
1. 引言
在《科学发现的逻辑》一书中,波普尔关于概率的论述中不仅提出了许多独特的观点,而且采用了一套独特的用语。例如,波普尔在某处说:
一旦我们认识到同一事件作为不同参考类的一个元素可以有不同的概率,不少所谓概率悖论就消失了。例如,有人说事件“骰子出现5点”的概率在它出现以前不同于同一事件在它出现以后的概率:在以前它等于1/6,而在以后只可能等于1或0。当然这个观点是完全错误的。这一事件的概率在它出现以前和以后总是相同的。只是根据观察提供给我们的信息,我们可选取一个新的参考类,而对于新的参考类这个概率值是1。告诉给我们关于单个事件实际结局的陈述,不能改变这些事件的概率;然而,它们可提示我们选取另一个参考类。
波普尔的这段话可能使概率论的初学者不知所云。实际上,波普尔的概率理论有其独特的概念体系,本文将考察这一概念体系。
2. 频率定义的陈述
首先,我们通过一个例子,从另一角度考察概率的频率定义。
考虑如下电子的小孔衍射过程:有N个电子通过小孔落在屏幕上,将落在屏幕上的诸电子以某种方式(例如,以到达屏幕的先后顺序)编号,令Xi表示“第i个电子落在屏幕上的位置xi”。则这一电子衍射过程给出如下有限序列:
={ X1, X2,……, XN }。
设是屏幕上的一个小区域;是中一切满足条件xi的元素组成的子序列,它有n个元素,则实验证明:当N无限增大时,比值n/N趋向某一稳定值p。
按照通常的概率论教程中的用语,在上述过程中,一个电子通过小孔落在屏幕上是一次“随机试验”;“第i个电子落在屏幕上的位置xi”是第i个随机试验的“结果”。在整个过程中,N个“结果”的全集称为“样本空间”。极限p称为对的“相对频率”。至于“事件”和“概率”两个用语的定义,则有两种稍微不同陈述方式。
第一种陈述方式是:样本空间的任一“子集”是一个“事件”,因此就是一个“事件”;第二种陈述方式是:“事件”的基本形式是样本空间的某一元素属于(或不属于)它的某一子集。因此,如果K是的一个元素,即存在k,使得K=Xk,则K或“第k个电子落在上”这样的命题才是一个“事件”。
相应地,“概率”的频率定义也有两种陈述方式:当人们称为一个事件时,“相对频率”p就是的概率;当人们称K为一个事件时,“概率”和“相对频率”是不同的概念:事件K的“概率”,记作Pr(K),涉及序列的单个元素K,而“相对频率”p却与K无关。只不过在K这一条件下,这两个不同含义的量在数值上相等:
Pr(K)=p, K。 (1)
从集论的角度来看,这两种陈述方式之间的区别只不过是对同一符号的不同的读法。例如,对某一条件概率Pr(E|S)来说,如果把 E和S理解为以试验结果为元素的某一集合,就是在第一种陈述方式;如果把E和S应该分别理解为某一试验结果e具有性质E和满足条件S,就是第二种陈述方式。诚然,如果坚持把 E和S理解为以试验结果为元素的某一集合,则第二种陈述就应该写成Pr(eE|eS)。但按照集论的惯例,可以把它略写作Pr(E|S)。于是,第二种陈述方式乃是概率的正式陈述方式,而第一种陈述方式则是它的略写。按照这种理解,同时采用两种陈述方式不会有什么问题。实际上,在通常的概率论的教程中,人们往往在介绍基本理论时采用第一种陈述方式,在例题和习题中应用概率时采用第二种陈述方式。
但是,如果把第一种陈述方式当作概率的正式陈述方式,对“概率”这一用语就会有极为不同的理解。按照第一种陈述方式,上述例子中的概率乃是子序列的概率,它仅仅反映如下客观事实:落在上电子数与落在屏幕上的电子数的比值为p,从而概率是一个客观范畴;而按照第二种陈述方式,上述例子中的概率是单个电子e落在上的概率,它有两个前提:第一,电子e落在屏幕上,第二,落在上电子数与落在屏幕上的电子数的比值为p,其中第一个前提是观察者的已知条件,从而概率是一个主观范畴。因此,两种陈述方式的并列难免引起冲突。事实上,关于概率的许多争论,特别是概率的主观诠释与客观诠释之间的争论,正是因此而引起的。
3. 一个概率公式
在《概率与观察者》一文中,我们提出如下观点:条件概率是概率的一般形式,因此,概率有两个要素,一个是“事件”,一个是“观察者的已知条件”。对于概率定义的陈述,我们按照通常的概率论教程的惯例,在解题时采用第二种陈述方式,但在表达新的频率定义和证明概率的乘法公式时,则采用第一种陈述方式。总之,我们把第二种陈述方式作为概率定义的正式陈述方式,而把第一种陈述方式作为它的略写。以上面的电子衍射过程为例,我们把(1)式写成Pr(K|K)=p,也可略写成Pr(|)=p。
另一方面,波普尔却把第一种陈述方式作为概率定义的正式陈述方式(他也规定相对频率与概率这两个概念有一些数学上的细微区别,在这里我们没有考虑这些区别)。但是,波普尔也看到,概率这一用语在实际应用中确实有第二种陈述方式,即像K的概率或“第k个电子落在上的概率”这样的陈述方式。他把这种陈述称为“形式上单称的概率陈述”,并且用符号PK()表示K的“形式上单称的概率”,又用F()表示对的“相对频率”,于是他把(1)式写成:
PK()=F(), K。 (2)
在我们看来,这一公式只不过用独特的符号表示概率的频率定义。但波普尔却把这一公式看作是他的创造,并说这一公式“令人惊异地有用,它甚至可帮助我们澄清现代量子理论的某些复杂问题。”
波普尔把(2)式理解为如下定义:
定义1:如果K是序列的一个元素,事件K具有性质的形式上单称的概率,即性质在参考序列内的概率。
在这里,波普尔把称为“参考序列”;把事件K的概率称为“形式上单称的概率”;把对的“相对频率”称为“性质在参考序列内的概率”。
这样,波普尔的用语与我们的用语就大大不同。下面,我们把波普尔的用语与我们自己的用语作一比较。
关于“参考序列”,波普尔给出了如下例子:
“一个个别的人将在一定时期内死亡这种概率可根据我们认为他是他的年龄组的一员,还是他的职业组的一员等等来假定十分不同的值。……同一偶发事件或事件作为不同参考类的一个元素可以有不同的概率。”
为了确定起见,把波普尔说的“一个个别的人”记作a,把“a将在E时期内死亡”这一事件记作E,用X表示条件“a属于X年龄组”,Y表示条件“a从事Y职业”。这样,当我们认为a是他的年龄组的一员时,事件E的概率就是条件概率Pr(E|X);而当我们认为a是他的职业组的一员时,事件E的概率就是条件概率Pr(E|Y)。而“同一偶发事件或事件作为不同参考类的一个元素可以有不同的概率”则是指Pr(E|X)与Pr(E|Y)不一定相等。于是我们看到,波普尔说的“参考序列”,不多不少正是条件概率中的“条件”,也就是“观察者”的已知条件,如果我们把这一条件等同于一位观察者,“参考序列”就对应于某一“观察者”。
关于“形式上单称的概率陈述”,波普尔写道:
“我称一个概率陈述为‘形式上单称的’,当它把某一概率赋予某个单一偶发事件或某类偶发事件的单个元素时;例如,‘用这个骰子掷下一次得5的概率是1/6’或‘(用这个骰子)掷任何一次得5的概率是1/6’。从频率理论观点看,一般认为这些陈述是不十分正确的表述,因为不能把概率归之于单个偶发事件,而只能归之于偶发事件或事件有限序列。”(见查汝强、邱仁宗译本,第71节。)
用我们的用语来表达,波普尔这里说的“归之于偶发事件或事件有限序列”的东西是“相对频率”;而“归之于单个偶发事件”的东西则是“概率”。
在另一个地方,波普尔把相对频率称为“客观概率”;同时宣称,他并不反对“形式上单称的概率”的主观诠释。在波普尔看来,概率的主观诠释把概率理解为“理性信仰程度”,他同意把“形式上单称的概率”理解为“理性信仰程度”,只要这种“理性信仰”受某一客观的频率陈述的指导。这样,波普尔实际上把概率分成两种:一种是“客观概率”,即我们说的“相对频率”;另一种是“主观概率”,即我们所说的“概率”。
但是,如果把“主观概率”理解为不是“客观概率”的概率,那么,它并不全是“形式上单称的概率”。举例证明如下:
设有两只乌鸦,分别记作u和v,则按照波普尔的用语,“u是黑的”与“v是黑的”这两个命题的概率都是主观概率,从而这两个命题的“积命题”,即命题“u是黑的并且v也是黑的”的概率也是一个主观概率。推而广之,若A是一个有限只乌鸦的集合,则“A中的每一只乌鸦都是黑的”作为有限个命题的积命题,其概率也是一个主观概率。再进一步,全称命题“一切乌鸦都是黑的”的概率也是一个主观概率。如果我们把这一全称命题的概率称为“形式上单称的概率陈述”,就显得是一个“形容词的矛盾”了。或许,正是这一矛盾使得波普尔把“一切乌鸦都是黑的”这样的命题的概率看作“客观概率”,忽略了观察者的存在,这才得出他的“一切全称命题的概率为0”的错误判断。
4. 应用举例
在实际应用中,波普尔的用语是极为别扭的,下面我们举两个例子。
按照我们的看法,概率有两个要素,一个是事件,一个是观察者的已知条件,当观察者通过某种方式(例如,通过观察或测量)获得某种信息时,同一事件的概率将发生变化。概率论中的Bayes公式描述了这种变化。
我们曾应用Bayes公式得出如下结论:已知在市面上流通的某种金币中有百万分之一是假币,这种假币的两面都是正面。设a是一枚这样的金币,不知真假。一再地把a随手一掷,一连出现20次正面,则“a是假币”的概率约为1/2。
在这里,“一再地把a随手一掷,一连出现20次正面”相当于一次“测量”。在这次测量之前,我们作为观察者,只知道“a是一枚市面上流通的某种金币,而这种金币中有百万分之一是假币”。根据题给条件,这时“a是假币”的概率是百万分之一。在这次测量之后,我们的已知条件多了一个内容:“a曾经一连出现20次正面。”应用Bayes公式,计算得出在新的已知条件下,“a是假币”的概率约为1/2。
翻译成波普尔的语言,上面的计算过程可表述如下:
“形式上单称的概率”有两个要素,一个是事件,一个是参考序列。如果事件保持不变,则“形式上单称的概率”将随着参考序列的改变而改变。在概率论中,Bayes公式描述这种变化的一种特别重要的特殊情形:新序列是原序列的子序列。
上面的例题涉及两个“参考序列”,它们可以这样构成:在想象中把市场上流通的这种金币一个一个地拿来。令yi取值0或1,yi=1 表示“第i次拿来的金币是真币”,yi=0 表示“第i次拿来的金币是假币”。如果一共拿来N个,则我们得到一个有限序列{y1, y2,……, yN},这是第一个序列。然后在这一序列中进行如下筛选:将这N个金币中的每一个一次一次地随手一掷,如果连续出现20次正面就留下,否则就搁置一边。这样依次留下的金币就给出第二个序列。
对于第一个序列,性质yi=0的相对频率是百万分之一,从而“a是假币”的“形式上单称的概率”是百万分之一;而对于第二个序列,这个相对频率约为1/2,从而这个“形式上单称的概率”约为1/2。
这无疑是极为冗长而又曲折的表达方式。或许,有较高语文的水平的人会表达得简捷一些,但很难想象能有根本的改善。如果用这种用语写一本概率论教程,读者一定会苦不堪言。
更糟糕的是,波普尔似乎并未把他的“参考序列”理解为条件概率中的条件。从上面的例题我们看到,在条件概率中,条件与事件总是同时给出的。换句话说,在我们要解决的问题中,条件是已经预先给定的,从而在实际问题中,不存在怎样选择这个条件的问题。但波普尔却实际上提出了这一问题,他说:“对于应该从若干可能的参考类中选定哪一个,不可能制定一个一般规则。(最窄的参考类往往最合适,假如它多到足以使概率陈述立足于合理的统计外推,并且得到足够量验证证据的支持的话。)”可见波普尔为怎样选择“形式上单称的概率”的“参考序列”而无所适从,可惜他没有提到他在什么场合遇到这一问题。在我们看来,这个问题就像在一个概率的表达式中,不知怎样选择“事件”一样荒谬。
波普尔的用语用来表述像上面那个简单的例题,已经显得不堪重负。用来表达本来就极为复杂的问题时就难免陷入困惑了,“全称命题的概率”就是这样的问题。
作为例子,我们考察“一切乌鸦都是黑的”这一命题成立的相对频率。考虑一个有M项的有穷序列R,每一项要么是“一切乌鸦都是黑的”,要么是“有些乌鸦不是黑的”。把R中的第一类项可分离出来构成一个子序列(它的每一项都是“一切乌鸦都是黑的”),设它有m项。则比值m/M在M趋于无限大时的极限就是“一切乌鸦都是黑的”这一命题成立的相对频率。
另一方面,如果一位观察者c对“一切乌鸦都是黑的”这一命题进行检验。用zi表示他第i次观察的结果,zi=1表示他看到的第i只乌鸦是黑的,zi=0表示这只乌鸦不是黑的。由于这种观察可以无限地进行下去,我们可以用一个无穷序列{z1, z2,…, zi…}来表示他的检验的一个可能的结论。当且仅当这个无穷序列的每一项都是1时,从他的观察得出了“一切乌鸦都是黑的”这一结论。
上述无穷序列{z1, z2,…, zi…}乃是序列R中的一个元素,因此R乃是一个“序列的序列”。“一切乌鸦都是黑的”这一命题的概率就由这个序列的序列给出。
或许有人会提出如下质疑:只要R中有一个第一类项,就表示“一切乌鸦都是黑的”这一命题成立,而这一命题成立,就表明R中应该全是第一类项。于是,“一切乌鸦都是黑的”这一命题的概率要么是1,要么是0。我们怎能用R这一序列的序列来定义“一切乌鸦都是黑的”这一命题的概率呢?
这一问题涉及逻辑学中的一个或许不太引人注目的规定。当我们问某一全称命题是否成立时,总要预先指定一个“论域”或“客体域”。在考察“一切乌鸦都是黑的”这一命题是否成立时,我们所指定的客体域可以是我们这个星球上到现在为止的一切鸟;也可以是某一更大或较小的时空范围的一切鸟;还可以是其他的客体域。无穷序列{z1, z2,…, zi…}作为R的一个元素,所指定的客体域应该是观察者c能观察到的一切鸟。至于R中的其他项,其客体域一般是不同的。于是,和R的某一元素相比,R涉及一个较大的客体域。这样,我们就不能从R中有一个第一类项得出R中全是第一类项的结论了。
由此可见,波普尔远没有把“‘一切乌鸦都是黑的’这一命题的概率”的含义用他自己的用语表达清楚。
5. 概率的主观诠释与客观诠释
波普尔认为,他已经消除了概率的主观诠释与客观诠释之间的对立。他说:“客观和主观理论之间的冲突,初看似乎是如此难办,可用某种一目了然的形式上单称的概率的定义来完全消除。”
实际上,波普尔只不过把概率分成主观概率与客观概率两类。这种所罗门式的判决,并未消除主观诠释与客观诠释之间的对立。要消除它们的对立,必须或者让主观诠释吞并客观诠释,或者让客观诠释吞并主观诠释。在《概率与观察者》一文中,我们把观察者引进概率的频率定义,完成了主观诠释对客观诠释的吞并。而在波普尔的概率理论中,主观诠释与客观诠释实际上平分天下,用“参考序列”取代“观察者”,只不过是他扩大客观诠释领地的一种尝试,这种尝试是他的一个更大的、雄心勃勃的计划的一个组成部分。
我们知道,波普尔是一位实在论者,他坚持物理学规律的客观性;“反对‘观察者’对物理学的入侵”;力图建立一种“没有观察者的量子力学”。因此,凡是出现“观察者”这一用语的地方,他都尽可能换成别的用语。但是,这种努力只不过是南辕北辙。
当一个科学分支刚刚建立时,“观察者的入侵”乃是一个必经阶段,并不是一件坏事。例如在热力学中,人们规定水的冰点为0度,水的沸点为100度(摄氏)。至于介于这两个温度之间的温度,则用某种物质的膨胀程度来划分。人们称这种物质为“测温物质”,他们发现,不同的测温物质给出不同的划分。例如,用水银做成温度计,某一温度是50度,而用另一种物质做成温度计,这个温度就不再是50 度了。人们把这种现象描述为:“温标依赖于测温物质的选择。”正如在解析几何中人们可以把“坐标系”等同于一位观察者;在相对论中人们可以把“参照系”等同于一位观察者;在劳动价值论中,人们可以把“交换价值”等同于一位观察者一样,在热力学中,人们也可以把“测温物质”等同于一位观察者,从而说“温标依赖于观察者”。后来,人们发现,用不同的稀薄的气体作测温物质,给出相同的温标,人们称这种温标为“理想气体温标”。在热力学第二定律建立以后,人们发现可以确定一种“绝对温标”,它与测温物质的选择无关,而且与理想气体温标一致。这才在温标这一问题上最终摆脱了观察者。正是诸如此类的成果的积累,人们才一步步建立了“没有观察者的热力学”。如果满足于用“测温物质”取代“观察者”,在这里禁止使用“观察者”这一用语,“没有观察者的热力学”就不可能建成了。
波普尔要建立的不是“没有观察者的热力学”而是“没有观察者的量子力学”,这是一个更为棘手的工作,仅仅排除“观察者”这一用语就更难有什么成果了。
6. “不确定性”的两种含义
波普尔不仅是一位实在论者,而且还是一位非决定论者。他相信“不确定性”乃是自然界的一种客观性质。在谈到“形式上单称的概率陈述”时,波普尔说他不反对把这种概率陈述理解为“不确定的预见”。但“预见”这一用语蕴含如下事实:概率中的事件尚未发生。波普尔对“不确定性”的这种理解留下了一个大漏洞。
让我们回头考察本文开始时所引的波普尔的那段话。在那里波普尔用他自己的用语表达了如下事实:
第一,“骰子出现5点”这一事件的相对频率与它出现与否无关,在它出现以前和在它出现以后都是1/6。
第二,根据观察提供给我们的信息,我们作为观察者的已知条件改变了。因此,“骰子出现5点”的概率也改变了,从1/6变为1或0。
波普尔的用语明显地与概率这一用语的习惯用法不同。除此之外,他还有一个概念混淆。
当我们说某一对象的状态“不确定”(或“确定”)时,可能有两种含义,一种是对象的状态在客观上不确定;另一种是观察者对对象的状态的主观认识不确定。如果事前就知道某一对象肯定会处于某一状态,则该对象的状态可能在客观上尚未确定时,主观上就已经确定了。这种情形下用不上概率这一用语,我们不予考虑。于是,按照“确定”或“不确定”来划分,对象可以处于三种状态:客观上和主观上都确定的状态,我们称它为“已知状态”;客观上和主观上都不确定的状态,我们称它为“未决状态”;客观上已经确定,但主观上尚未确定的状态,我们称它为“暧昧状态”。下面,我们把客观上的“确定”称为“决定”,把主观上的“确定”称为“明确”。在我们考察的情形下,尚未决定的状态也是不明确的;反过来,明确的状态肯定是已经决定的。这样,未决状态是尚未决定的状态;已知状态是已经明确的状态;暧昧状态则是已经决定但还不明确的状态。
例如,将一颗骰子在一个带盖的容器中摇动,当容器还在摇动时,骰子将出现哪一点是“不确定”的。这种不确定是客观上的不确定,是“尚未决定”。因此,这时骰子处于未决状态。当容器不再摇动,骰子已经落定,但容器盖还没有打开时,骰子的状态即它的哪一点朝上是否确定呢?第一,骰子已经落定,它的状态已经决定;第二,容器还是封闭的,我们作为观察者不知道骰子出现哪一点,因此它的状态还不明确。于是,此时骰子处于暧昧状态。在揭开容器的盖子以后,我们看到了骰子的点数,则骰子的状态不仅是决定的,而且也是明确的。于是,此时骰子处于已知状态。
当波普尔说“骰子出现5点”的概率在它出现以前和在它出现以后是否改变时,他问的是已经决定的事件的概率与尚未决定的事件的概率是否一样;当他说“告诉给我们关于单个事件实际结局”的陈述,能否改变这些事件的概率时,他指的是已经明确的事件的概率与还不明确的事件的概率是否一样。因此,波普尔实际上把客观上的“不确定”与主观上的“不确定”混淆起来。以后我们将会看到,这种混淆会引出什么样的结论。
7. 统计分布与概率分布
用pi表示“骰子出现i点”的概率,则我们有pi=1/6。这一表达式有六个等式,它给出骰子出现各种状态的“概率分布”。以“骰子出现5点”的概率为例,当骰子处于主观上“确定”的状态,即处于已知状态时,它是1或者0;当骰子处于主观上“不确定”的状态,即处于未知状态或暧昧状态时,这个概率才是1/6。从这一事实我们再次看到:“概率”这一用语所表现的乃是观察者的主观认识,而不是对象的客观状态。
回到上面考察的电子衍射过程中。如果把屏幕分割成s个小区域,用pj表示电子落在第i个小区域j上的相对频率,则我们得到一个相对频率的有限序列{ p1, p2,……, ps}。当屏幕上的小区域分得足够细时,这个序列就给出屏幕上诸电子的位置的“统计分布”。相应地,其左端表示单个电子e落在屏幕上的诸位置的“概率分布”。于是,只要让p遍历p1至ps,则(1)式的右边表示的“统计分布”,左边则表示对应的“概率分布”。而(1)式表示这两种分布在e或“e落在屏幕上”这一条件下数值相等。概率依赖于观察者,因此概率分布也依赖于观察者,从而概率分布是一个主观的范畴;相对频率与观察者无关,因此统计分布也与观察者无关,从而统计分布是一个客观的范畴。
在统计物理与量子力学中,以微观系统为元素的集合,称为一个“系综”。在上述例子中,一个电子就是一个微观系统,落在屏上的电子的集合就是一个系综。的统计分布乃是这个系综的属性。波普尔由此得出结论:“统计分布是系综的属性,而不是系综的元素的属性。”并批评量子力学的哥本哈根诠释把“统计分布等同于系综的元素的一种物理属性”。波普尔声称:这种不合逻辑的概念混淆,是一个“巨大的量子泥潭”。
但是,在刚才的例子中,是一个系综,而单个电子e则是该系综的一个元素。与“的统计分布”相对应的是“单个电子e落在屏幕上的诸位置的概率分布”。因此,概率分布所表现的不是“系综”而是“系综的元素”。那么,概率分布能不能“等同于系综的元素的一种物理属性”呢?我们将在下一篇文章中考察这一问题。
Probability and Relative Frequency
——Another Comment on Popper’s Interpretation for Probability
TAN Tianrong
(Department of Physics, Qingdao University, Qingdao 266071, P.R.China.)
Abstract: It is pointed that there are two forms of statement about the definition of probabilities. By the one, a relative frequency is a probability; by the other, relative frequency and probability are two distinct concepts; the latter is dependent on the observers, while the former is not. When the observer has been given, these two quantities are equal in amount. A lot of disputes about probabilities, particularly, dis-putes between subjective interpretation and objective interpretation, are related to the subtle distinct be-tween these two statements. Popper adopted the first statement; but he agreed that there exit the second statements, based on such a disposal he founded a complex probability concept system, which will be examined herein.
Key words: Karl • Popper; relative frequency; observer; reference series; single probability statements in form; objective probabilities; probabilities of universal
yuanxn
独树一帜的波普尔哲学
谭天荣
青岛大学 物理系 青岛 266071
ttr359@126.com
内容提要:本文通过对波普尔的概率理论的考察得出结论:早期的波普尔对于概率的一般理论坚持客观诠释;对于概率的实际应用则“不反对主观诠释”。这种骑墙的立场是不稳定的,最后转化为“概率的倾向性诠释”,它对单个事件的概率也作出客观的诠释。这种错误的概率理论决定了他的量子理论的失败。此外,还考察了波普尔的某些其他理论
关键词:波普尔;实在论;主观主义哲学;概率;倾向性诠释
1. 引言
英国哲人卡尔•波普尔是本世纪最卓越的哲学家之一,他的“证伪论”、他对测不准关系的“统计系综诠释”以及他对概率的“倾向性诠释”,都是独树一帜的理论。下面,我们从数学和物理学的角度评论这些理论。
2. 一个奇特的论断
波普尔有一个著名的论断:
命题1:一切全称命题成立的概率为零。
这一论断可举例证明如下:如果发现一只乌鸦是黑乌鸦的概率为p,那么连续发现N只乌鸦都是黑乌鸦的概率就是pN。作为概率,p 的取值大于0小于1,因此当N趋于无穷大时,pN的极限是零。因此,全称命题“一切乌鸦都是黑的”成立的概率为零。
波普尔从命题1得出一系列奇特的结论,这里举几个例子:
第一,人们通常认为,不同的全称命题的“可信度”是不同的。例如,全称命题“每次测量电子的电荷都会得出密里根的测量值(在误差范围内)”就比“一切乌鸦都是黑的”更可信。不幸的是,根据命题1,这两个命题成立的概率都是零,因此不能用“概率”来表现这种“可信度”;因此,以这种可信度的概率表达为研究对象的“归纳逻辑”及“概率逻辑”等学科是没有意义的。
第二,人们通常认为,如果从某一理论得出的结论一再被证实,该理论的可信度就会不断提高,当它有足够多的结论被证实时,这个理论就被证实了。但是,任何理论都由全称命题来表达,而根据命题1,全称命题的可信度是不能量度的,因此“可信度不断提高”就没有确切的意义。由此得出结论:“理论是不能被证实的。”
第三,对一个理论进行验证的结果按照时间顺序形成一个无穷序列。如果把有利于该理论的结果记作1,不利的结果记作0,则根据命题1,即使这个序列的前一百万项为1,也不能保证以后的项不出现0。这意味着一个理论可能由于一个得到充分确证的定律突然垮台而被“证伪”;或者老的实验有一天会产生新的结果,虽然这种事从来没有发生过。
从上面的例子可以看出命题1是极为新奇的,但相信了这一论断,就得否定概率理论中的大量卓有成效的结论。与其相信那些结论全都错了,我们倒是宁可相信这一论断不成立。那么,这一论断的问题在那儿呢?
按照波普尔的意见,如果我们发现第一只乌鸦是黑乌鸦的概率为p,则在连续发现k只乌鸦都是黑乌鸦以后,发现第k 1只乌鸦还是黑乌鸦的概率仍然是p。但在许多常见的情况下,这样的前提并不成立。根据概率论,当观察者的已知条件的改变时,一个事件的概率并不是固定不变的,它会按照一定的规律改变,“贝叶斯公式”表达了这一规律。
例如,如果在市面上流通的某种金币中有百万分之一是假币,这种假币的两面都是“正面”,而a是一枚这样的金币,不知真假,则从贝叶斯公式可以得出结论:
命题2:如果一再地把a随手一掷,一连出现20次正面,则a是假币的概率为1/2。
一般地说,如果用pn表示在a一连出现n次正面的前提下,“a是假币”这一事件的概率,则根据贝叶斯公式,当n很小时,pn接近0,例如,p0 ≈ 106;当n很大时,pn接近1,例如,p100 ≈ 11024。从上面的计算我们看到,n = 20可以作为当n增大时,pn从小变大的转折点。
现在让我们尝试计算“一切乌鸦都是黑的”这一命题的概率。我们立刻看到,作为一道概率论的习题,题给的条件是不够的:我们可以把概率p理解为我们看到的“第一只乌鸦是黑的”这一命题的概率,但我们不知道在看到20只乌鸦都是黑的之后,怎样计算“第21只乌鸦仍然是黑的”这一命题的概率。因此,如果没有其他已知条件,关于“一切乌鸦都是黑的”这一命题的概率,我们还不能得出任何确定的结论。
要得到这个概率,除了需要更多的已知条件。还得弄清楚“有些乌鸦不是黑的”这一命题的确切含义。例如,如果我们看到一只白色的鸟,其性状与乌鸦差不多,那么,这个“差不多”要怎样规定,我们才能算是发现了一只白乌鸦?如果乌鸦的定义包括“黑色的”这一特征,那么“一切乌鸦都是黑的”就是一个同义反复,这一命题成立的概率肯定是1,虽然这是一个平庸的结论,但也能看出“一切乌鸦都是黑的”这一命题的概率对于“乌鸦”的定义的依赖关系。
或许,这个问题太复杂,我们可以换一个问题:如果我们发现一种基本粒子,其电荷与电子电荷的密里根值不同,但其他“可观察量”与电子完全一样,这时,我们究竟是发现了“有些电子的电荷与密里根的测量值不同”,还是发现了一种新的基本粒子呢?这是一个必须预先弄清楚的问题。
其实,在概率论的习题中,我们已经遇到过求“全称命题的概率”的问题。例如,从命题2可得出结论:“在一连出现20 次正面以后,每一次掷出a都会出现正面。”在这里,“每一次掷出a都会出现正面”就是一个全称命题,在给定的条件下,其概率是1/2。
或许,这里说的全称命题不像是我们通常理解的全称命题。我们可以换一种方式解释命题2的计算过程。
设前人对某种X鸟作过抽样调查,发现在这种鸟的幼鸟中,雄性与雌性相等。但是也发现在某种未知的条件下,这种鸟不会生出雄性的幼鸟,这种变异了的X鸟占全部X鸟的百万分之一。现在,有位专家试图弄清楚这种鸟变异的原因,他通过实验发现在他所给定某种条件下,20对这样的鸟所生的幼鸟全是雌鸟,于是他得出结论,在该条件下X鸟一定会变异,不会生出雄鸟来。这一结论显然是一个全称命题。通过与得出命题2同样的计算,我们知道这位专家得出的结论成立的概率约为1/2。但按照波普尔的意见,这个概率却是0,只因为它是一个全称命题的概率。
在一般情况下,要研究一个全称命题的概率,需要知道的已知条件是各式各样的,上面的计算无助于解决一般性的计算全称命题的概率的问题。尽管如此,我们已经能绰绰有余地得出结论:波普尔的命题1是一个错误的论断。
3. 一次重大的挫折
波普尔断言:“理论是不能被证实的。”另一方面,波普尔又断言:只要一个反例就可以“证伪”一个理论。从这两个判断出发,波普尔在《科学发现的逻辑》一书中提出了脍炙人口的“证伪主义”原则,并得出结论:“‘可证伪性’是科学之为科学的标志,而宗教神学和一切形而上学却不具备这一优点。”
按照波普尔的这一原则,马克思的学说是“可证伪的”,而且现在已经被“证伪”。其论据是:马克思曾经预言无产阶级革命不能在单一国度首先取得胜利,而世界历史的进程“证伪”了这一预言。于是波普尔得出结论:“马克思的学说被‘证伪’了”。在这里,波普尔似乎混淆了历史预测的两个因素。
如果我们预言一个自然过程满足波动方程,是不是就能预言该过程未来的进程呢?回答是否定的。要预言这样一个自然过程未来的进程,除了必须知道该过程所满足的方程以外,还必须知道该过程的初始条件与边界条件。如果该过程的实际进程偏离了预言,当然可能是该过程并不满足波动方程,但也有可能是如下情况:该过程满足波动方程,只是原来对初始条件、边界条件的描述出了偏差。
对历史事件的预言也有类似的情况。恩格斯为马克思的《路易•波拿巴的雾月十八日》的第三版写的序言中说:马克思在事变刚刚发生时就对它有了透彻的洞察,是无与伦比的。马克思能做到这一点有两个条件:第一,他深知法国的历史,不仅研究了法国过去的历史,而且还考察了法国当前历史的一切细节;第二,他找到了历史唯物论这一历史进程的规律。粗略地说,恩格斯在这里所说的这两个条件可以和上面的波动方程的例子作如下类比:第一个条件相当于知道初始条件与边界条件,而第二个条件则相当于给出波动方程。按照恩格斯的意见,马克思在路易•波拿巴的政变刚刚发生时就对它有了透彻的洞察,不光是因为他找到了历史唯物论这一历史运动的规律,还因为他深知法国的历史。
即使如此,马克思也没有事前预言路易•波拿巴的政变,而只是在事变发生之后对它进行描述。那么,马克思能不能在事前预言这一次政变呢?恐怕不能,但这未必是历史唯物论的问题,不要忘记,在马克思的时代,还没有电脑,对事变的进程以及相关的社会历史资料的掌握比现在困难得多,既然甚至在科学技术有了长足进步的现代,人们都难以预测类似的历史事件,我们又怎能要求马克思当年能事前预测路易•波拿巴的政变呢?
由于预测历史进程需要资料,而马克思的时代这种资料又不可能齐全,因此,像波普尔那样把预测历史进程的能力作为判断马克思主义正确还是错误的标准是不合适的。如果说俄国十月革命的成功可以算作是“无产阶级革命在一国首先取得了胜利”,从而马克思当年关于“无产阶级革命不能在单一国度首先取得胜利”的断言确实是错误的,那么,当然可能是由于马克思的学说的错误;但也可能是如下情况:马克思的学说并没有错,只不过由于马克思当时对世界历史的各种复杂因素掌握得不够充分,因此才作了错误的判断。
如果把波普尔的“证伪主义”原则应用于波普尔本人,将会得出耐人寻味的结论。波普尔曾经错误地预测上世纪70年代那些检验“贝尔不等式”的结果,他说:“我不得不承认这些实验结果使我大吃一惊。当我第一次听说克劳色和西莫尼向检验贝尔定理时,我希望得出的结果能够反驳量子力学,但看来我的预期错了,大多数检验都适得其反。”
贝尔不等式的提出及其被实验“证伪”乃是现代物理学中的一件大事,人们认为这件事对爱因斯坦和玻尔的“世纪之争”作出来判断,实验证明了爱因斯坦坚持的“定域实在论”(满足“定域性原理”的“实在论”)不成立。
按照我们的意见,量子物理学家们误解了贝尔不等式。实际上贝尔不等式既与“定域性原理”无关,也与“实在论”无关,导致贝尔不等式的是经典概率论。而人们早就知道在许多情况下,经典概率论不适用于微观过程。因此,从70年代那些检验“贝尔不等式”的结果并不能得出“定域实在论”不成立这一哲学结论。
不幸的是,贝尔对他自己的工作有两点误解:
第一,贝尔把他应用的隐变量理论当成一般的“定域隐变量理论”。实际上,贝尔应用的隐变量理论之所以能导出贝尔不等式,乃是因为它还原封不动地保留了整个经典概率论。而一般地说,经典概率论既不是定域性原理的特征,也不是隐变量理论的特征。因此,贝尔应用的隐变量理论肯定不是一般意义下的“定域隐变量理论”。
第二,当贝尔从他的隐变量理论导出贝尔不等式时,他实际上把贝尔不等式追溯到他所表述的“隐变量理论的自旋相关公式”,从而追溯到他认为表现了“定域隐变量理论”特征的A(a,l)、B(b,l)和r(l)三个函数。但实际上,在更一般的形式下,“隐变量理论的自旋相关公式”与量子力学是相容的,导致贝尔不等式的真正原因是:贝尔不自觉地对“非布尔”的“微观事件空间”应用了布尔代数的“事件运算规则”,特别是应用了其中的“交换律”。
由于第一点误解,贝尔实际上得出结论:一般地说,定域隐变量理论必须把经典概率论原封不动地保存下来。又因为“实在论”被认为是隐变量理论的哲学前提,从而所谓“定域实在论”被认为是“定域隐变量理论”的哲学前提。因此,贝尔实际上要求“定域实在论”在微观过程中恢复经典的概率运算法而排斥量子力学的概率运算法,从而得出量子力学与“定域实在论”相互排斥的结论。
由于第二点误解,贝尔认为,可以用实验来判断量子力学与“定域实在论”谁是谁非,从而在物理学史上,开了一个通过物理实验来评判哲学争论的先例。正是因为这一误解,上世纪70年代的那些检验贝尔不等式的实验,才被认为是对“定域实在论”的“证伪”。
由于这两点误解,贝尔定理在物理学领域里掀起了持续的热潮,有些人努力从贝尔不等式的破坏得出更加新颖、更加匪夷所思的哲学结论,另一些人则在A(a,l),B(b,l)和r(l)三个函数上绞尽脑汁,希望能找到某种隐蔽的假设,以便同时挽救定域性原理与实在论。
波普尔之所以错误地预测检验贝尔不等式的实验的结果有两个原因:
第一.波普尔是一位实在论者,同时他又坚信定域性原理。
第二,波普尔虽然不像列宁那样“决不想涉及专门的物理学理论”,但他也未加批判地接受了贝尔根据上述两个误解得出的“贝尔定理”。从而相信,如果贝尔不等式被证伪,则定域实在论就被证伪了。
由于这两个原因,他对检验贝尔不等式的实验有那样的预测是可以理解的。哲学家不是先知,不能期望他们对每一个最新的重大的实验裁决都能预言正确的结果。但是“贝尔不等式”问题对于波普尔却具有特殊的意义,这个问题恰好出现在波普尔特别关心的领域——概率理论与量子理论交叉的领域里,而波普尔关于“贝尔不等式的检验会反驳量子力学”的“预测”确实被“证伪”了。如果按照波普尔评论马克思学说的标准,必然会得出结论:“波普尔的学说被证伪了。”我们不会如此轻率地下结论,但波普尔这一预测的失败至少表明,他的概率理论与量子理论在实验事实面前遭到了一次重大的挫折。
4. “形式上单称的概率陈述”
为什么波普尔会得出命题1从而得出“理论是不能被证实的”这样的错误结论呢?因为波普尔认为“概率”是一个客观范畴,与观察者的认识无关。但是,早期的波普尔在这一问题上还是有些犹豫的。在《科学发现的逻辑》一书中,波普尔曾经为如下矛盾而苦苦思索:一方面,按照概率的频率定义,概率是一个客观范畴,没有“观察者”容身之地;另一方面,在实际应用中,概率的陈述似乎却难以摆脱“观察者”这一幽灵。
在日常生活中,我们遇到的总是对单个事件而言的概率陈述,例如:“这一次掷硬币将出现正面的概率是1/2”、“王二这次买彩票中头奖的概率百万分之一”,等等。波普尔不得不承认存在这样的“概率陈述”。但是,他否认这种陈述是概率的一般陈述方式,而是把它列为另类,称它为“形式上单称的概率陈述”。
波普尔看到,对于这种“形式上单称的概率陈述”,除了“事件”以外,“概率”的取值还依赖于另一个因素,他称为“参考序列”或“参考类”,他给出了如下例子:
“一个个别的人将在一定时期内死亡这种概率可根据我们认为他是他的年龄组的一员,还是他的职业组的一员等等来假定十分不同的值。……同一偶发事件或事件作为不同参考类的一个元素可以有不同的概率。”
在这里,波普尔用他独特的语言,揭示了“概率”这一概念的一个最重要的特征。遗憾的是,波普尔的用语过分地与众不同,很难把这些用语同我们所熟知的概率论的命题与公式联系起来。下面,我们用众所周知的概率论语言,重述波普尔的上述关于“参考序列”的论点,并从中引出必然的结论。
为了确定起见,我们假定波普尔所说的“个别的人”名叫李四;“一定时期”则是十年;而李四将在十年内死亡这一事件的概率是5%。这样,从波普尔的上述命题就得出结论:
“‘李四将在十年内死亡’这一事件的概率会因为我们认为他是他的年龄组的一员,还是他的职业组的一员等等而取十分不同的值。”
为什么会这样呢?“李四将在十年内死亡这一事件的概率是5%”这一陈述的意义是:
a.李四属于某一人群;
b.该人群在十年内有5%的人死亡。
但是李四同时属于各式各样的群体,既属于一定的年龄组,又从事一定的职业,等等。另一方面,在“与李四同一年龄组的人”和“与李四从事的同一职业的人”等不同的人群中,十年内将会死亡的人数的百分比是不同的,因此,“李四将在十年内死亡”这一事件的概率也因此而有所不同。
由此可见,“‘李四将在十年内死亡’这一事件的概率是5%”这一陈述是不完整的,完整的表达应该同时给出“李四所属的群体”,例如:“已知李四从事教师职业,则他将在十年内死亡的概率是5%。”这才是完整的概率陈述。在概率论中,这种概率陈述用一个“条件概率”来表示,而波普尔的“参考序列”就对应于该条件概率中的条件。
条件概率中的条件,乃是某一“观察者”的“已知条件”,而波普尔的“参考序列”就对应于某一“观察者的已知条件”。在确定“李四将在十年内死亡”的概率的两个因素a(李四属于某一群体)和b(该群体在十年内有5%的人死亡)中,a就是某一观察者的已知条件,从而是一个“主观条件”。因此,尽管b是一个“客观事实”,不以观察者的认识为转移,但总的来说,“形式上单称的概率”依赖于观察者,从而是一个“主观范畴”。
如果我们把“观察者的已知条件”等同于“观察者”,则波普尔的“参考序列”其实就是“观察者”。“观察者”这一用语听起来颇有主观主义的色彩。波普尔作为一个实在论者,不喜欢这一用语。他用“参考序列”这一中性的用语取代它,但这种“用语的改变”究竟能把“观察者”排除到什么程度,波普尔自己也信心不足,因此他作了如下让步:“我不反对关于单个事件概率陈述的主观解释。”这样,波普尔对概率的诠释实际上保持一种骑墙的态度:对于概率的一般理论,坚持客观诠释;对于概率的实际应用,“不反对主观诠释。”
按照我们的意见,波普尔的所谓“形式上单称的概率陈述”乃是概率的一般陈述方式,因此“观察者”乃是概率自身的组成部分,离开了“观察者”,“概率”就失去了意义。这样,我们从波普尔的前提出发,引出了与波普尔的观点恰好相反的结论:“概率是一个主观范畴。”这是“概率的主观诠释”的基本观点。
然而,“概率的主观诠释”有一个困难:在概率的频率定义中没有观察者;而概率的频率定义则是概率论的基石。这就提出了一个尖锐的问题:在实际应用中,概率这一用语离不开观察者,而在概率的频率定义中,却没有观察者容身之地,正是这一矛盾引起概率的两种诠释之间的长期争论。要消除这一矛盾,必须要么把观察者从概率理论中彻底驱逐出去(而不是把它放逐到一个另类中),让客观诠释在每一个领域都取代主观诠释;要么修改频率定义,使得它能容纳观察者,让主观诠释并吞客观诠释。
考虑到如下两个原因:
第一,在“概率”这一概念的实际应用中,“观察者”是“概率”的一个不可分割的要素;
第二,当前的频率定义是“无条件概率”的定义,而概率的一般形式却是“条件概率”。
我们立刻得出结论:概率的频率定义必须修改。在《暗藏玄机的双缝衍射实验》一文中,我们已经给出了这一修改,从而已经使得主观诠释并吞了客观诠释。
5. 概率的倾向性诠释
上面所说的波普尔的概率理论是他的早期理论,这个理论由于把概率的主观诠释与客观诠释相并列,不可能是一个稳定的理论,以后将会要么滑向主观诠释,要么滑向客观诠释。果然,波普尔后来进一步提出“概率的倾向性诠释”,对“形式上单称的概率”也提出了“客观诠释”。
早期的波普尔认为波函数描写的是大量电子组成的“电子系综”的“统计分布”。但是,按照概率的倾向性诠释,“概率分布”表现单个电子的“倾向性”,而“统计分布”则是“概率分布”的实现。这样,波函数就是对“单个电子”而不是对“电子系综”的描写了。
在这里,波普尔的观点有了引人注目的改变:按照波普尔早期的看法,大量电子在屏幕上的衍射图形表现大量电子的位置的“统计分布”,单个电子的位置的“概率分布”则是这一统计分布的一种“形式上单称的陈述方式”。因此,“统计分布”是原初的,而“概率分布”则是派生的。而按照“概率的倾向性诠释”则刚好相反,表现“倾向性”的“概率分布”是原初的,而“统计分布”作为“倾向性”的实现则是派生的。
在《无尽的探索》一书中,波普尔谈到他提出概率的倾向性诠释是为了反对主观主义,而主观主义是涉及“作为某一大量现象要素的单个事件的概率”时才出现的。他说:“正是在这里主观主义进入了量子力学。并且正是在这里我试图通过引入概率的倾向性诠释来反对主观主义。”波普尔在这里已经说的很明确:在接受“波函数的概率诠释”的前提下,按照他的倾向性诠释,波函数表现的不是系综的属性,而是系综的元素的属性。
早期的波普尔曾经指出:统计分布是系综的属性,而不是系综的元素的属性。他谴责哥本哈根诠释把统计分布等同于系综的元素的一种物理属性,这种不合逻辑的概念混淆是一个“巨大的量子泥潭”。现在,波普尔不仅没有把量子力学从这一泥潭中拽出来,而且自己也掉到这个泥潭中去了。
波普尔曾经说,概率的倾向性诠释“解释了如此经常地从这类实验推出的波粒二象性的无益空论”。但是,如果要问一定的实验条件怎样给出某种特定的“倾向性”,特别是,电子的小孔衍射的实验条件怎样给出表现为电子衍射图形的“倾向性”,就难免涉及“德布罗意波”,这就有涉及“波粒二象性的无益空论”之嫌。相反,不涉及德布罗意波,关于实验条件如何决定“倾向性”的作用机制就只能“免谈”。因此,波普尔的概率的倾向性诠释似乎堵塞了对量子现象作任何进一步考察的道路。
波普尔说他的“倾向性”可认为是“物理实在”。由于可测量的物理倾向(“势能”)已由场论引入物理学,把倾向看作物理上实在的这里已有先例,因此,“把倾向性看作物理上实在的这种意见并不显得十分陌生。”可见波普尔在提出“概率”这一概念的“倾向性诠释”时,完全是从物理学的特殊角度出发的,似乎没有考虑他的诠释在物理学以外的领域是否适用。实际上,按照波普尔对概率的“倾向性诠释”,在物理学中,概率表现出来的“倾向性”是由“整个实验条件”所决定的。对概率的这种诠释显然不能应用到某些领域。
例如,如果我们说“‘张三得心脏病的概率’是3%”,那么,在这一命题有意义的限度内,它是指观察者知道张三属于某一人群,该人群有3%的人得了心脏病。我们很难想象,“张三得心脏病的概率”表现了什么样的“倾向性”,又是什么实验条件给出这种“倾向性”。如果经过体检,查明张三没有得心脏病,那么张三得心脏病的概率就是零。这样,在透视前后,张三得心脏病的概率发生了突变,从3%突变为0。在这里,很难设想有什么实验条件的改变,导致了什么样的“倾向性”的改变,而这种“倾向性”的改变又引起了张三的健康状态的概率分布的突变。
由此可见,波普尔对概率的倾向性诠释不适用于日常生活的情形。
波普尔还说:“‘概率的倾向性诠释’不是一种特设性的引入,而是仔细地修正作为概率频率诠释基础的论据的结果。”但“概率的频率定义”却不仅适用于物理学,它适用于应用概率的每一个领域。上面关于“张三得心脏病”的例子就可以用频率定义来陈述,但这个例子却怎么也不能纳入波普尔的概率的倾向性诠释的框架中。由此可见,频率定义经过波普尔这样“仔细地修正”之后,其适用的范围大大缩小了。
波普尔的“概率的倾向性诠释”更像是专门为物理学,特别是为量子力学提出的概率理论,这种情况很难不使人想起“特设的”这一波普尔常用的哲学用语,尽管波普尔否认这一点。
我们看到,在应用“概率”的日常生活领域,统计分布根本与什么实验条件扯不上关系。即使在量子现象中,统计分布也未必是由“整个实验条件”确定的。特别是,系综的统计分布的改变并不一定伴随着实验条件的改变,这里举一个例子。
实验证明:“单色电子束(指动量一致的电子束)的位置分布是均匀的,而且只有单色电子束的位置分布才是均匀的。”或者说:“当且仅当一个电子束的动量一致时,其位置分布是均匀的。”
实验室制备的单色电子束只能是有限的,诸电子在只能在某一有限的空间均匀分布。根据电子束的位置分布与动量分布之间的关系,这种电子束不可能严格地动量一致,或者说,其“单色性”只能是近似的。下面我们把这种近似单色的电子束称为“准单色电子束”。设有两个准单色电子束一前一后的运动着,后面的电子束运动速度较快,终于赶上了前面的电子束,两个准电子束合而为一。合成的电子束有两种动量,从而其动量不再一致,诸电子的位置分布不再是均匀的。再过一段时间,合成的电子束重新分开,两个电子束都重新恢复均匀分布。在这一过程中,电子束诸电子的位置分布的变化,并未伴随着实验条件的改变。
波普尔的应用“概率的倾向性诠释”最成功的例子或许是消除了人们对电子的双缝衍射实验的困惑。原来人们曾经预期:
命题3:当两条缝同时打开时的诸电子在屏幕上的衍射图形,乃是两条缝轮流打开时的两个衍射图形的迭加,
但实验事实却表明命题3不成立。当人们得到命题3时默认了如下前提:
命题4:一个电子通过某一条缝落在屏幕上某处的概率,与另一条缝是否打开无关。
波普尔从“概率的倾向性诠释”出发得出如下结论:当实验条件改变,例如关闭一条缝时,电子落在各种位置的倾向改变了,从而衍射图形将随着改变。这种情况同把普通的弹球戏中的钉板弄倾斜,因而使滚落的小球的分布发生变化没有原则性的不同。
这一论据否定命题4,从而否定了命题3,这就初步消除了人们对电子的双缝衍射实验的困惑。
然而,双缝衍射实验令人困惑之处不仅在于当关闭一条缝时引起电子束的位置分布的变化,而且还在于这种位置分布改变的方式。电子的双缝衍射图形与光的双缝衍射图形的相似性强烈地暗示电子束伴随着某种未知的波,而对这种暗示的任何探讨都难免涉及波普尔认为是“无益的空论”的“波粒二象性”。因此,波普尔关于“弹球戏”的论点,即使作为对双缝衍射过程的描写也是不胜任的。
总的来说,波普尔的新概率理论更像一种哲学的辩解,而不是一种新的数学物理学理论。如果说“电子具有波粒二象性”的说法只是无益的空论,那么,从“概率的倾向性诠释”我们也没有得到更多的认识。
6. 波普尔论互补原理
关于互补原理,波普尔在《无尽的探索》一书中写道:
“我不能自信我理解了玻尔的‘互补性’理论,并且开始怀疑是否有别的什么人能理解它。虽然有些人显然已被说服,认为他们已经理解了。爱因斯坦后来告诉我,还有薛定谔也有这种怀疑。
“这使我去思考‘理解’问题。玻尔以某种方式断言,量子力学是不可理解的,只有古典物理学才是可以理解的,并且我们不得不顺从这一事实:量子力学只能部分被理解,而且只有通过古典物理学的中介去理解它。这种理解的一部分是通过古典的‘粒子图像’达到的,大部分是通过古典的‘波图像’达到的;这两种图像是不兼容的,它们就是玻尔称为‘互补性’的。没有希望去更充分地或更直接地理解这个理论,要求的却是放弃要达到一种更充分理解的任何试图。
“我猜想玻尔的理论是建立在对‘能够达到什么样的理解’持十分狭隘的观点之上。看起来玻尔想到的是用图像和模型理解——用某种形象化理解。我认为这种观点太狭隘了,我终于发展了一种完全不同的观点。根据这种观点,要紧的不是对图像的理解,而是对一种理论的逻辑力量的理解,就是说它的说明力,它对有关问题和其它理论之间的关系。”
抽象地说,波普尔的这种“对‘理解’的理解”似乎有道理,但只要接触到实际问题,它就显得软弱无力了。
亚里斯多德曾经提出一个著名的矛盾律:“一个人不可能同时又是一条船。”这个命题很容易通过图像和模型来理解。那么,我们能不能通过其“说明力”、“对有关问题和其它理论之间的关系”来领会这一命题呢?换句话说,我们能不能从相反的命题“一个人可能同时又是一条船”的“说明力”,及其“对有关问题和其它理论之间的关系”出发,找出它的错误来呢?
或许有人会说,这是可能的。例如,我们可以这样推理:“一个人可能有60公斤,而一条船可能有一万吨,如果一个人可能同时又是一条船,这个60公斤的人可能就是这条一万吨的船,于是60公斤很有可能等于一万吨。”这样,我们从“一个人可能同时又是一条船”得出了“60公斤很有可能等于一万吨”的结论,而这个结论显然是错误的,于是其前提“一个人可能同时又是一条船”是错误的。由此可以得出结论,我们从“一个人可能同时又是一条船”这一命题的“说明力”以及它“对有关问题和其它理论之间的关系”出发,判断出它是错误的。但是,这一推理并不说明什么问题!
我们不要忘记:从“一个人可能同时又是一条船”出发,不仅可以得出错误的结论,也可以得出正确的结论。而每得到一个正确的结论,这个命题就得到一次证实。如果我们拒绝“形象的理解”,拒绝“图像和模型的理解”,我们就没有根据判断在从这个命题所得出的各种结论中,究竟哪些是正确的,哪些是错误的。而这就表明:亚里斯多德的矛盾律“一个人不可能同时又是一条船”只能形象地理解,只能通过图像和模型来理解。
或许有人会说,拒绝“形象的理解”,拒绝“图像和模型的理解”,我们还有其他标准来判断一个命题究竟是正确的还是错误的,那就是它是否符合实验事实,是否满足已经确立的数学方程。但是,一旦遇到实际问题,这种判断标准也无能为力。
记得在某一个学术会议上,北大物理系的一位老师就斩钉截铁地对我说,“电子既定域在空间的某一点,同时又充满了整个空间,这没有什么难以理解的。”换句话说,“一个电子既是一个几何点,同时又无所不在,这没有什么难以理解的。”也可以说,“电子既是无限小的,同时又是无限大的,这没有什么难以理解的。”这位老师所提出的这个“没有什么难以理解”的命题,乃是量子物理学家们的一种幻想,它决不比“一个人可能同时又是一条船”更容易理解,但是从它出发所得出的一系列的结论,却都既符合实验事实,又满足数学方程。如果不诉诸“形象的理解”,诉诸“图像和模型的理解”,而是诉诸这一命题的逻辑力量,诉诸这一命题的“说明力”及其“对有关问题和其它理论之间的关系”,我们就只能接受这个命题了。而如果我们接受这一命题,我们也就无法拒绝“一个人可能同时又是一条船”以及其他自相矛盾的命题。
在逻辑学中有一个公式表明:
命题5:只要我们接受一个自相矛盾的前提,就可以导出任何自相矛盾的结论。
这样,我们想得到什么结论就可以得到什么结论,从而实证科学就没有立足之地了。
有趣的是,为了理解“在形象上的自相矛盾”而修改“理解”这一概念的波普尔,却正是借助于命题5来反对“辩证法”,因为“矛盾”正是“辩证法”的出发点。波普尔的这种主张对不对呢?这一问题也可以表成:“谁要是坚持亚里斯多德的矛盾律‘一个人不可能同时又是一条船’,他是不是就是在反对辩证法呢?”
诚然,“矛盾”是辩证法的出发点,但是“一个人可能同时又是一条船”决不是辩证法意义下的“矛盾”。那么,什么是辩证法意义下的“矛盾”?怎样区分“一个人可能同时又是一条船”这样的“形象上的自相矛盾”和“辩证法意义下的矛盾”?这个问题,我们将在另一篇文章中考察。
在谈到玻尔的“互补原理”时,人们常常认为这是辩证法在物理学中的体现。而波普尔在反对“互补原理”时,也把它当作辩证法在物理学中的应用来反对。虽然这种看法是对辩证法的误解,但是,辩证法乃是一种世界观,不是三言两语能说清的。在没有弄清楚辩证法的真正含义的前提下,如果要我在“互补原理”与“非辩证法”作一选择,那么,两害相权取其轻,我宁可跟随波普尔选择“非辩证法”,因为“互补原理”这种形式的伪辩证法实在太糟糕了。
7. 小结
不容置疑的是,自从量子力学建立以后,物理学已经从“朴素实在论的大本营”变成了“主观主义的堡垒”,实在论在物理学领域里节节败退。在这一过程中,波普尔的抗争具有典型意义。
总的来说,波普尔并没有成功地恢复实在论在物理学领域里的地位,这种失败的原因是多方面的。从物理学史的角度来看,实在论在物理学领域里节节败退的原因在于在这一领域里,实在论者们犯了一个方向性的错误:有一点波普尔说的对,“主观主义是随着‘单个事件的概率’进入物理学的。”但“单个事件的概率”的应用导致主观主义乃是因为“概率”这一主观范畴被误解为一个客观范畴。因此,为了把主观主义逐出物理学,我们必须正视“‘观察者’是概率的不可分割的组成部分”这一事实,把物理学中的依赖于“观察者”的那些命题从物理学中的表现“客观实际”部分中分离开来。可是实在论者们的努力却恰好相反,他们不遗余力地发挥他们的辩才,把各种主观的范畴描绘成客观范畴。布洛欣采夫是如此,波普尔也是如此,今天,转向实在论的观点的各种量子力学的新诠释还是如此。
除此之外,从波普尔本人的角度来说,我觉得他有如下不足之处。
首先,波普尔过分关心用语而忽略了问题的实质,“观察者”本是“概率”的一个不可分割的组成部分,波普尔不喜欢“观察者”这一用语,用“参考序列”来取代它,这样就掩盖了“概率”这一范畴的主观性,从而就无法理解他所说的“观察者对物理学的入侵”的实质,而且还得出诸如“一切全称命题成立的概率为零”之类的荒谬结论。他的“概率的倾向性诠释”,更使得他掉入他自己所说的“巨大的量子泥潭”中去了。
其次,波普尔相信“量子力学的诠释问题都可以追溯到概率计算的诠释问题”,这样就限制了自己的视野。诚然,“量子力学的诠释问题”中的许多重要问题,特别是“波包编缩”的问题,必须通过“概率计算的诠释问题”来解决。但是在“量子力学的诠释问题”中更重要的问题还是对物理学自身的理解,特别是对“洛仑兹问题”的理解。很可惜,波普尔未曾接触这一方面的问题。
再次,波普尔对概率的运算规则似乎并不熟悉,例如,他从来没有应用概率的乘法公式,更不用说贝叶斯公式了。而不熟悉这些公式,对“概率计算的诠释问题”就难以提出中肯的意见。
最后,波普尔对辩证法的偏见也限制了他的视野。
当然,波普尔在物理学领域还是取得了辉煌的成果,对测不准关系的统计诠释就是其中之一。
Distinctive Popper Quantum Theory
TAN Tianrong
(Department of Physics, Qingdao University, Qingdao 266071, P. R. China.)
ttr359@126.com
Abstract: From an examination for Popper’s probability theory it is concluded that in his early works, Popper persisted in objective interpretation for the general probability theory and did not oppose subjective interpretation for the probability of the single events. Such a standpoint sit on the fence was unstable, and finally trans-formed into “propensity interpretation”, which endowed the single events with objec-tive characteristic. Such a wrong interpretation for probabilities caused his quantum the-ory to be defeated. Also, some other Popper’s theories are examined.
Key words: Karl Popper; realism; subjectivism philosophy; probabilities; propen-sity interpretation