qh95253882
有次无意中和一个数理统计方向的博士聊到统计,我以很虚心的态度问了个问题:“你觉得数学和统计有什么区别啊?”那为仁兄很一本正经的告诉我:“没什么太大的区别,都需要做证明。”幸好,我读本科那会听过一位高人讲过什么是统计。尽管现在不太能说清楚什么是统计,但还是对什么不是统计还比较清楚。曾经和一位做数据挖掘的教授一起聊统计,那位教授说了个观点:“中国内地没有正儿八经做统计的。”吾深以为然,就中国统计发展的现状而言,这一评价的确不是很过分。下面是范剑青在2006年接受科学时报采访的一篇报道,我觉得有几段话还是发人深思的。“范剑青认为,自己在伯克利最大的收获就是从老师那里学到很多科学思想和科学哲学。他说:‘我把我的数学结果拿给老师看,但他说'不用看,我知道你们中国人做数学可能比我都好,我就跟你去喝咖啡,聊聊数学,教你怎么做有创意的研究,探讨什么是知识创新’。”“博士毕业时,道能浩对他说:“中国人的数学功夫不错,但做学问没有自己的特色就永远没有出路,我侧重理论,而你应该侧重应用。”我觉得统计完全舍弃数学,统计将回到描述统计的年代。但一味的注重数学技巧,而没有统计想法,统计的发展同样将困难重重。中国统计的现状应该应是这种方向的一个很好说明。中国统计的发展尤其是数理统计在将近60年的发展历程中基本上只去参与证明了直通通的三个问题:容许性的证明;相合性的证明;渐近正态性的证明。除此之外,针对数据处理提出的方法和理论则少之又少。因此做理论的只关注纯粹大样本理论的证明,而不注重方法的创新;做应用的只能推广应用别人的方法,实在无法进行方法的创新(方开泰老师的均匀设计也许是并不多见的亮点之一)。因此这两方很多时候是相互不看好。其实为什么会出现这种状况,陈希孺老师在《中国数理统计发展的几点思考》中给出过一个很重要的理由:社会没有对统计学科提出现实的需求。在这篇文章中,陈希孺老师老师还提供了一个很令人振奋人心的数据:日本统计对日本战后经济的贡献大越在5%,这个数据即便降低10倍,也足够养活所有做统计的中国人的。所一大家还是应该对中国统计持乐观态度,尽管中国统计的现状不是那么乐观,统计人才的培养也存在很多不足,但大家应该看到市场已经开始意识到统计的重要性了。
qh95253882
关于统计学的一些理解
(1) 统计是一门收集处理数据的艺术。(《大英百科全书》)
(2) 统计学的内容:
A三大理论基础:抽样分布、参数估计、假设检验;
B两大流派:频率学派、贝叶斯学派;
C三大基本问题:密度估计、分类、回归;
D两种模型文化:数据模型、算法模型;
E三大基本数据类型:截面数据、时序数据、纵向数据(或称面板数据)(其中较难处理的数据是在此三类数据基础上产生的删失、结尾、缺失数据).
注:◇目前参数估计的方法有:矩估计、极大似然估计、拟似然估计、伪似然估计、经验似然估计(1989)、广义估计方程、广义矩估计;
◇构造假设检验的方法:广义似然比检验、拉格朗日乘子法检验、Wald检验、经验似然比检验;
◇数据模型的想法认为数据是由某种我们已知的模型生成的(比如线性模型),这样能得到比较方便解释的模型,但其预测性能往往不好;算法模型则认为我们不管模型到底是什么样子,我们总能给出一个一般的算法使预测的性能比数据模型要好(比如用神经网络),但其解释性并不好。这里面还牵涉到“统计学习理论”,这一理论标榜的最主要优点是能处理小样本问题(注意费歇尔的理论体系实际上整体是基于大样本的)并且有较好的预测性能。根据这一理论提出的具有很强实用性的成果“支持向量机”在实证研究中的表现也的确要比先前所有的模型方法要好。尤其是高维问题。这一理论为瓦普尼克首先在1990左右提出,现在已开始广为流行。算法模型的提法很大程度上就涉及到支持向量机。这也是目前统计学中争议比较大的地方,在实际运用中算法模型也越来越为人们关注,不过统计学界有很多人还没有注意这个问题.
◇在统计学中模型是及其重要的工具,目前根据参数设定的模式可将模型分为:参数模型,包括线性模型、广义线性模型等预先指定变量间的相依关系的模型,但这类模型限制条件太多;非参数模型——预先不指定变量间的相依关系的模型,这类模型建模时误差较大;半参数模型(1982年由恩格尔提出)预先部分指定变量间的相依关系的模型,这类模型综合了前两类模型的优点。目前使用比较多的是参数模型和半参数模型;
◇中国统计还处在将统计分割成数理统计——主要做纯理论,统计学做各种应用性的统计主要是经济统计——主要是做应用。而且搞应用的和搞理论的似乎有必要相互鄙视才能促进统计学科的发展。但也有有识之士提出大统计来看待统计的想法。
(以上只是我个人的一些观点,欢迎有识之士多多指教)
wxqmath
统计是揭示真理的科学。目前中国企业造假风行、只追求眼前既得利益,国家没有严格执行对企业基本统计指标的要求和质量控制要求,没有对各级管理部门提出量化管理要求,各级官员开会的大小报告没有严格的统计数据分析要求,总之,没有一个既得利益者希望人们了解数据的真相,也不愿意了解,所以事实上在中国统计没有市场。
staring12
抽样分布、参数估计、假设检验,这3个理论我现在都在学