皮尔逊(Karl ,Pearson,1857-1936)
英国统计学家。他的座右铭我们无知,因此让我们努力”是他人生的基本主题。他入剑桥大学学习数学、物理、哲学、宗教和法律,并取得律师资格,但以数学的优异成绩在该校毕业。任伦敦大学应用数学教授时出版了论弹性以及有关科学哲学的专著◇因阅读英国科学家f.高尔顿《自然遗传》(1889)一书,使其深受影响,从而成为高匀顿的忠实学生,开始结合高尔顿关于人的变异、遗传和优生学等问题来发展统计学的理论和方法。1894年起研究生物分布的常态性。1901年与高尔顿、w.f.r.韦尔登联合创办《生物统计学》杂志,发表有关生物学及心理学的定量研究成果。1904年被任命为伦敦大学高尔顿实验室的首任主任,且第一个开设优生学讲座。1914-1930年撰写写出四卷本的高尔顿传记《弗朗西斯·高尔顿的生平、学问和劳作》。
皮尔逊的统计学的分析技术和方法,体现在其《统计学者和生物统计学者用表》(1914)中,如频率分布、偏差度和峭度测量、轴线拟合、标准差检验、相依系数、乘积动差相关系数r、类型的数学公式、双行、多重、多变元非线性相关和概差偏差数,以及各种统计学的抽样分布等。他还发明了主要成分分析,后由c.e.斯皮尔曼发展成心理统计学的因素分析。皮尔逊被称为统计科学的奠基者。他把数学和统计学方法运用于生物问题,特别是进货和跗学的研究,创建了生物统计学,且与高尔顿共同确定了心理问题的统计法为心理学的基本方法之一。他对生物、行为和社会科学的研究作出了较重的贡献。
4. Pearson:改变统计学历史的大师
最近总是看一些统计学历史地东东,有点故纸堆的潮气,但也发现从前的阅读真的太快了,以至于看不到一些闪光的东西。最近在课堂上讲述统计关系,也和学生们一起探索统计关系的一些更深远的价值,因此想到了Pearson,昨天整理了一篇Pearson的介绍性文章,发在博客上,马上就有人回复说,好东东!这就是鼓励。
我还是想说说Pearson的事情,这位伟大的统计学家在统计历史上是划时代的人物,甚至影响了统计学的历史。不管统计学有多少种研究观点,似乎所有人都认为它应该从十九世纪末期高尔顿爵士(Sir Francis Galton, 1822~1911)和卡尔.皮尔逊(Karl Pearson, 1857~1936)的论述作为其起点。
现代统计学是随着1899年高尔顿的《Nature Inheritance》一书的出版而展开序幕的,该书除了其本身的价值外,还引发了杰出的统计学家卡尔•皮尔逊对统计学的兴趣。在此之前,他只是在伦敦大学的大学部 (University College) 执教的数学教员。当时,这“所有知识都基于统计基础”的想法引起了他的注意。1890年他转到格里辛学院 (Gresham College),在那里他可讲授任何他希望讲授的课程,Pearson选了一个题目《现代科学的范围与概念》(the Scope and Concepts of modern Science) 在他的授课中他越来越强调科学定律的统计基础,后来他全神贯注致力于统计理论的研究。不久他的实验室成为世界各地人们学习统计和回国点燃“统计之火”的研究中心。经由他热心的提倡,科学工作者逐渐由对统计研究不感兴趣的境地转而成为热切地努力发展新理论和搜集并研究得自各方面的数据。人们越来越深信统计数据的分析能为许多重要的问题提供解答。另一位当代统计学家海伦•沃克 (Helen Walker) 描述Pearson小时候的一则轶事,生动地显示他往后事业中所表现的特色。有人问皮尔逊他所记得最早的事,他说“我不记得那时是几岁,但是我记得是坐在高椅子上吸吮着大拇指,有人告诉我最好停止吮它,不然被吮的大拇指会变小。我把两手的大拇指并排看了很久,它们似乎是一样的,我对自己说:我看不出被吸吮的大拇指比另一个小,我怀疑她是否在骗我”。在这个单纯的故事中,沃克指出“不盲信权威,要求实证,对于自己对观测数据的意义的解绎深具信心,和怀疑与他的判断不同的人态度是否公平”这些就是Pearson一生独具的特征。
5. 谁是统计学之父?
卡尔‧皮尔逊(Karl•Pearson,1857~1936),生卒于伦敦,公认为统计学之父。K•Pearson 1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院 (University College, London),教授数学与力学,从此在该校工作一直到1933年。
K• Pearson 最重要的学术成就,是为现代统计学打下了坚实基础。自从达尔文演化论问世后,关于演化的本质争论不断,在这方面他深受 Galton(达尔文表哥,“优生学”一词的发明者)与 Weldon 影响。 Weldon 1893年提出“所谓变异,遗传与选择事实上只是算术”的想法。这促使 K•Pearson 在1893-1912年间写出18篇《在进化论上的数学贡献》的文章,而这门“算术”,也就是今日的统计。许多熟悉的统计名词如标准差,成分分析,卡方检验都是他提出的。
Pearson、Galton 与 Weldon 为了推广统计在生物上的应用,于1901年创立统计的元老期刊《Biometrika》, 由Pearson 主编至死,但是Pearson 的主观强,经常对他本人认为有“争议”的文章, 删改或退稿,并因此与英国本世纪最有才华的统计学家 Fisher 结下梁子,到死也没有和解。据说,Fisher两次远走他乡,到澳大利亚讲学,都和Pearson有关。
1906年 Weldon 死后,Pearson 不再注意生物问题,而专心致志于将统计发展成一门精确的科学。
6. 卡尔 皮尔逊――现代统计科学的创立者
卡尔?皮尔逊(Karl Prarson,1857-1936),英国生物学家和统计学家,旧数理学派和描述统计学派的代表人物,现代统计科学的创立者。
卡尔?皮尔逊从儿童时代起,就有着广阔的兴趣范围,非凡的知识活力,善于独立思考,不轻易相信权威,重视数据和事实。他的主要成就和贡献是在统计学方面。他开始把数学运用于遗传和进化的随机过程,首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验,用以检验观察值与期望值之间的差异显著性;发展了回归和相关理论;为大样本理论奠定了基础。皮尔逊的科学道路,是从数学研究开始,继之以哲学和法律学,进而研究生物学与遗传学,集大成于统计学。
在19世纪90年代以前,统计理论和方法的发展是很不完善的,统计资料的搜集、整理和分析都受到很多限制。皮尔逊在生物学家高尔登(Francis Galton,1822-1911)和韦尔顿(W?F?R?Weldon,1860-1906)的影响下,从九十年代初开始进军生物统计学。他认为生物现象缺乏定量研究是不行的,决心要使进化论在一般定性叙述的基础之上,进一步进行数量描述和定量分析。他不断运用统计方法对生物学、遗传学、优生学做出新的贡献。同时,他在先辈们善于赌博机遇的概率论研究的基础上,导入了许多新的概念,把生物统计方法提炼成为一般处理统计资料的通用方法,发展了统计方法论,把概率论与统计学两者溶为一炉。他被公认是“旧派理学派和描述统计学派的代表人物”,并被誉为“现代统计科学的创立者”。他在统计学方面的主要贡献是:
1.导出一般化的次数曲线体系。在皮尔逊之前,人们普遍认为,几乎所有社会现象都是接近于正态分布的。如果所得到的统计资料呈非正态分布则往往怀疑统计资料得不够或有偏差;而不重视非正态分布的研究,甚至对个别提出非正态分布理论的人加以压抑。皮尔逊认为,正态分布只是一种分布形态,他在高尔登优生学统计方法的启示下,在1894年发表了《关于不对称曲线的剖析》,1895年发表了《同类资料的偏斜变异》等论文,得到包括正态分布、矩形分布、J型分布、U型分布等13种曲线及其方程式。他的这一成果,打破了以往次数分布曲线的“唯正态”观念,推进了次数分布曲线理论的发展和应用,为大样本理论奠定了基础。
2.提出卡方(χ2)检验。皮尔逊认为,不管理论分布造反得如何好,它与实际分布之间总存在着或多或少的差异。这些差异是由于观察次数不充分、随机误差太大引进的呢?还是由于所选配的理论分布本身就与实际分布有实质性差异?还需要用一种方法来检验。1900年,皮尔逊发表了一个著名的统计量,称之为卡方(χ2),用来检验实际值的分布数列与理论数列是否在合理范围内相符合,即用以测定观察值与期望值之间的差异显著性。“卡方检验法”提出后得到了广泛的应用,在现代统计理论中占有重要地位。
3.发展了相关和回归理论。皮尔逊推广了高尔登的相关结论和方法,推导出人们称之为“皮尔逊积动差”的公式和两个其它相当的分工,给出了简单的计算:说明对三个变量的一般相关理论,并且赋予多重回归方程系数以零阶相关系数的名称。他意识到只有通过回归才能回答韦尔顿提出的关于出现相关器官的选择问题,意识到要测定复回归系数值,广泛搜集所有变量的基本平均数、标准差和相关的数据。他提出了净相关、复相关、总相关、相关比等概念,发明了计算复相关和净相关的方法及相关系数的公式。
4.重视个体变异性的数量表现和变异数据的处理。皮尔逊认为,在各个个体之间真正变异性的概念,与在估算一个单值方面的误差之间的机遇变异有着很大的差别。对这个观念的强调,是他对生命了解的真正贡献之一。他在1894年那篇关于不对称次数曲线的论文中,提出了“标准差”及其符号σ。
5.推导出统计学上的概差。皮尔逊推导出他称之为“频率常数”的概差,并编制了各种概差计算表。这是他自己认为的最重要贡献之一。这些概差对于先前缺乏度量的大多数统计资料的抽样变异性,标志着很大的进展。
皮尔逊还发明了一种用于二项分布的器械装置。他对算术平均数、众数、中位数之间的关系进行了深入的研究。他发现,在完全对称分布的资料中,算术平均数、众数和中位数三者是重合在一起的,而当资料的分布不对称时,则算术平均数、众数和中位数三点是分开的。如果这种不对称的程度不严重,则三点可构成一固定关系。他还提出其它一些重要统计理论和方法,如统计假设所预计的结果、随机移动、组间相关、四分相关以及力矩方法的应用等。
1914年第一次世界大战开始后,皮尔逊的研究转向用统计来处理和完成大量与战争有关的特殊计算工作,为反法西斯战争服务。在这期间,他编辑发行了一些计算用表,以便利统计人员。战争结束后,他又立即回到各种统计理论方面的研究。1921年到1933年,他在伦敦大学学院应用统计系讲授17、18世纪统计学史。1936年4月27日在英格兰萨里郡的科尔德哈伯去世。
皮尔逊的这些成就和贡献,受到了统计学家们的推崇,使整个一代的西方的统计学家在他的影响下成长起来。皮尔逊于1896年被选为皇家学会会员,他还被选为“高尔登优生学教授”,是爱丁堡皇家学会的名誉会员、巴黎人类学会和前苏联人类学会的会员。
皮尔逊的主要著作有:《科学入门》、《对进化论的数学贡献,ⅠⅡⅢ》、《关于相关变异体系、离差体系与随机抽样》、《17、18世纪的统计学史,与变化的知识、科学和宗教思想的背景对照》等。
more:
http://blog.163.com/yanbozh@126/blog/static/3523157920077904739500/