原载于《北京统计》2003年第10期,转载请注名出处



    数学是至今为止人类所创造的最丰富的而又最纯粹的逻辑体系,任何称得上 “科学”的体系都需要数学来描述其模型。纯粹数学和其他学科不同,它的基本思维方式是演绎,即从假设的模型或条件来推导出具体的结论。在确定的大前提或公理系统下,数学世界为仅有的存在绝对的“是”与 “非”的世界;其他学科的模型和我们所生活的现实世界则往往不存在绝对的 “对”与“错”。虽然人们从小就被告知“大灰狼”是 “坏蛋”,但是谁又能说狼吃羊是错误的呢?是非完全是人类思维的产物,其标准随时代、环境、族群、历史和宗教等许多因素而异。在纯粹的自然界中则绝对没有是非对错的。



  并不是所有学科都能够如物理学那样用具有物理意义的数学模型来描述。注意,这里所提的物理意义和物理模型代表物理、化学、天文、地理、生物等科学所研究对象的内在规律,并不仅限于物理学本身。多数人文社会科学和许多自然科学中的现象并不能用具有物理意义的模型来描述;它们所应用的数学模型是从实际观测数据归纳而来的;模型中的参数即使能够用来解释事物之间的一些关系,也不像物理模型那么确定、精确和具有明确的物理解释。这里从数据到取得数学模型的过程称为归纳;而归纳是典型的统计学思维方式。统计学是迄今为止最完善的从数据中通过归纳取得数学模型的科学。它服务于几乎所有领域,但又不从属于任何具体的学科。只要有数据的地方,就有统计的用武之地。所以有人不无道理地建议把 “统计”改名为 “数据分析”。



  要处理数据和得到数学模型,统计学和数学及计算机科学关系最密切;而在实践中又必须与那些和研究对象相关联的学科密切结合。统计可以按照不同的研究对象来分类,如生物统计、经济金融统计和人文社会统计等;而这些统计应用体系所共有的数学模型的产生和研究则往往被称为数理统计。而数理统计的分支则不一定按照对象,而往往按照理论和方法来归类,如多元分析,时间序列,贝叶斯统计,非参数统计等等。



  统计与物理有很多相似之处。比如,它们的模型都可以根据数据来产生和验证,它们都是在否定旧模型中发展的。但是,在得不到数据的情况下,物理学家可以按照已经掌握的物理规律来提出假设;这在近代物理中是相当普遍的作法;反过来这些物理模型又与数学的发展相辅相成。当然,这些先验理论的最终被承认,一定要有实验结果的支持,否则仅仅是猜想而已。与此相反,统计学家在没有数据支持的情况下,一般不去假定全新的统计模型。只有崭新的数据结构才能推动新模型的产生及数理统计的发展。



  综上所述,称统计为数学的一部分是不那么恰当的;即使数理统计也不能说是数学的一部分。而国内一些学者是把统计称为是经济学科的一部分,则是中国特有的与前苏联关联的国情所造成;读者可以从《苏联大百科全书》的统计学条款得到答案。虽然经济学非常需要大量的统计和数学,但前苏联的经济学中的统计学概念是其意识形态和计划经济体系的产物,其模型多属于小学数学水平,很难称为数学模型。该 “统计学”基本上应属于经济学的一个分支学派,不能称为目前国际流行意义上的统计学或统计学的分支。目前中国的统计已经和国际主流广泛接轨;一部分人愿意延续前苏联文科统计传统也未尝不可。



  虽然学科的分类有其严肃的一面,但是,任何与数据打交道的人都可以称为统计学家。实际上绝大多数统计应用并不是有统计文凭的人实行的。任何懂得一些统计的实际工作者都可以利用统计软件包来解决有些已知的统计问题;当他们有自己解决不了的问题时,往往请教统计学家来帮忙。这也是推动统计理论、方法和相关软件发展的源泉。所以统计的“扫盲”很重要,即所有专业的本科都应把统计设为必修课。否则,不仅影响相关学科,而且统计学也不会发展。专业统计学家主要的责任是根据实际要求发展新模型、新的理论和新的方法;通常这些新的方法需要编制新的软件来为实际工作者所用。他们一般应该有较好的数学修养和计算机编程能力 (使用现成软件包对统计学家来说是不足为道的),最好还要懂得一些应用领域的内容。



  在纯粹的数学世界之外,不存在完美的模型;统计模型当然不能例外。统计模型是根据某些数据而建立的,新的数据必然会改进原有的模型。而数据本身仅仅反映了我们所研究客体的某些方面,不可避免地有误差甚至会有其他干扰。数据和模型之间的关系在统计学中是一对永恒的互相约制、互相促进的两个重要因素。



  统计的一个重要但又不易为人所理解的特点是统计从来不绝对地说 “是”或者 “不是”。统计只能够说可能,而且往往提供某事可能发生的概率。这其实并不是统计生性圆滑,而是实际世界的真实体现。真实世界充满了不确定性;从某种意义来说,生活中唯一确定的事情是其不确定性。也正是这些不确定性使得生活充满了魅力和迷人的色彩。有多少人会享受其未来每一时刻全部已经确定了的世界呢?统计结论的不确定性恰恰符合我们所生活的世界。
1.“统计学家在没有数据支持的情况下,一般不去假定全新的统计模型。只有崭新的数据结构才能推动新模型的产生及数理统计的发展。”吴老师深刻揭示了统计模型必须要和实际应用结合,才能具备强大的生命力。



我现在恐怕在这个方面不幸走上了相反的道路,尝试了“近代物理中是相当普遍的作法”。设想建立一个“四星组合模型”,提倡由直接建立模型转变到间接建立模型,可能对某些随机折线更加适合,理论上这些随机折线能够存在,实际中却比较少了。下面简单交流一下我的设想。

时间序列随机折线,需要差分过滤的进行差分过滤,经过检验达到平稳后,如果把第1,3,5,7等奇数项作为顶点,把第2,4,6,8等偶数项作为底点,把奇数项的点用虚线连接,同样处理偶数项的点,那么就能够发现它们象两条链子一样,有的可能不断交织沿x轴向右伸展。

显然,按照“四星定位方法”,进行坐标系变换,由直接建立模型转变到间接建立模型,四部分数据情况不同,可以分别使用四种不同的统计模型,以及相应的算法,得到四个不同的拟合公式。

这样做的目的:

1)希望对大样本数据建立模型有方便。比如直接对1000个数据建立模型,现在就只是分两次对500个数据建立模型。实质是“一口饭作四口吃”。

2)希望有益对不同数据的比较。四个小模块,可以方便地拿出来1个或者3个小模块同其它的同类数据进行比较。



2.“实际工作者都可以利用统计软件包来解决有些已知的统计问题”。

我现在连统计软件包还不能够正确使用,实在不好意思,争取放暑假的时间把Eviews学习学习。



3.专业统计学家主要的责任一般应该有较好的数学修养和计算机编程能力。

我感觉吴老师对统计专业提出来更高更严的要求,希望谢老板等各位网友多加油,一份汗水才会有一份收获。





真实世界充满了不确定性;从某种意义来说,生活中唯一确定的事情是其不确定性。



这句话说的很有味道,有哲理,呵呵!
看见歼-10·新材料的制造过程,感觉吴老师指出的“计算机编程能力”确实重要。



中国开发出的激光成型新技术,通过计算机的控制,用激光将合金粉末熔化,逐层堆积直接“生长”出各种复杂高性能合金部件。现在,中国已是世界上第二个掌握这种飞机钛合金结构件激光快速成型装机技术应用的国家。



■歼-10·材料 激光技术成型钛合金部件



  钛合金部件因为强度大、重量轻,经常被先进飞机采用。歼-10战斗机同样使用了钛合金部件。然而,中国掌握的钛合金制造技术已实现了跨时代的进步。一束激光,有规则地在金属上游走,在激光经过的线路上,金属神奇地“生长”起来。这就是中国材料学一位年轻的教授开发出的新技术。

过去,飞机钛合金结构件采用传统的锻造和机械加工方法制造。一些大型复杂的构件首先需要耗时数月甚至一年加工锻造模具,然后要动用万吨水压机锻造出零件毛坯,然后还要对零件毛坯进行大量机械加工,如此下来,复杂零件的材料利用率不足10%。而中国开发出的激光成型新技术,通过计算机的控制,用激光将合金粉末熔化,逐层堆积直接“生长”出各种复杂高性能合金部件。现在,中国已是世界上第二个掌握这种飞机钛合金结构件激光快速成型装机技术应用的国家。

"Life is like a box of chocolates,you never know what you are gonna get?"--It's true!



什么事情都可能发生,最后一段很有启发...:)
实际上绝大多数统计应用并不是有统计文凭的人实行的。任何懂得一些统计的实际工作者都可以利用统计软件包来解决有些已知的统计问题。
15 天 后
强烈同意6楼的意见。

任何懂得一些统计的实际工作者都可以利用统计软件包来利用数学和统计解决实际领域的问题。
前提是“懂得”,这一点常常被忽略
2 个月 后
9 天 后
"统计与物理有很多相似之处."

伯克利的统计是物理学院的.......
[quote]引用第10楼crain2007-07-18 19:21发表的“”:

"统计与物理有很多相似之处."

伯克利的统计是物理学院的.......[/quote]



老大,UC Berkeley包括文理学院,商学院,法学院等14个学院,但从来就没有一个物理学院。它的统计系属于文理学院的自然科学部(Physical Science),而生物统计系属于公共卫生学院(School of Public Health ),当然,那个Shedon Ross所在的工业工程与运筹学系的统计也是巨牛无比。。。
1 年 后
统计只是一个辅助学科,必须以其他的另一个专业为主,这样才能看透问题,解决得了问题!!!!!
9 天 后
在统计之前,最重要的是要知道我们想干什么
统计是应用最广的学科,国内很多人都没有意识到这一点,意识到也没有去应用
12 天 后
过瘾!前段时间还在想,是统计推动了数学的发展,就在这看到了这篇文章
6 个月 后
3 个月 后
统计在吴老师那里也是一门艺术   也是我们的追求
2 个月 后
其实,搞统计的常和数学家调侃,说他们是走笛卡尔路线(在一定的约定(即公理)下的演绎),而统计学家首先要遵循培根路线(归纳经验)来行事的。



这两条路线,文艺复兴后以及启蒙时代欧洲哲学发展中的两个重要分支。一支是欧洲大陆,笛卡尔为代表唯理论(理性主义)传统,另一支是培根代表的经验论传统。唯理论传统中利用演绎方式建立古典概率理论,这个古典概率在应用于物理等现象方面很成功,但是,直接用于生物和社会却不成功(魁特勒,著有《社会物理学》,用机械论看待社会),原因是古典概率是在机械论影响下形成的,连正态分布的发现者们(如拉普拉斯也带有较重机械论色彩,陈希儒的《数理统计简史》湖南教育出版社,2002年第一版,17页)中也是机械论盛行,因此数理统计在欧洲大陆难产。19世纪末,因为在经验主义传统中(没有笛卡尔主义那种依赖演绎的毛病,是经验归纳型思维)英国统计学家的工作积累(生物学、社会学方面)的基础上,同时引进欧洲大陆的古典概率,催生出数理统计这个学科。



读统计史和科学史(甚至相关的哲学史),这个问题的脉络就更清晰了。