1. 刚看完《缩水》和谢老大这篇文章,想起前段时间看的一个谈“Unbiased Look at Dataset Bias”的文章http://www.cvchina.info/2011/06/23/cvpr-nb-paper/。真实的试验数据集多多少少总会带上主观选择的色彩,这个很难避免,即使随机化了,由于数据获取的问题,小样本下,多次重复试验时出现的统计显著性当然会不同,因此需要调整P值,需要这个FDR(话说第一次听这个,真是离统计越来越远了,汗..),于是统计确实像是在赌博,赌承受能力有多大,赌有生之年会不会被小概率事件给砸死...不知我的理解是否正确
2. 我觉得说到期望,必须得与方差联系在一起,一次实验,赌的更多的是承受这个波动的能力有多大
3. 依稀记得课本中说,对于连续型变量,似然函数是一个与参数无关的邻域与概率密度的乘积所得到的概率,所以求极大值时候省掉了那个邻域,直接变成了概率密度的乘积。当然当初没有认真想这个问题,还是去看看那篇40的论文去...
4. 对于这篇文章,赞一下!
George Box的“任何模型都是错的,但有些是有用的”的这个名言太赞了。另外,统计里面的一个基本概念是说,小概率事件在一次试验中不可能发生。众多的假设检验也正式基于此。其实对于一次试验的结果,要么是发生了要么是没有,如果关注某次试验的结果,概率还是很无力。
我几乎完全同意本文的所有观点。我个人有个建议,大家可以做一些模拟的训练,来加强对于随机问题直觉。比如随机生成1000组数据,每组数据包含500个观测值,每个观测值都是用均值为5,方差为5的正态分布来独立生成。每组数据计算平均值,然后把结果记录下来。然后用均值,方差,直方图之类的你所知道的所有技术对这1000个平均值进行分析,尤其注意的是那些“反常的”平均值,特别大的或者特别小的。接下来可以把500个观测值逐步减小,比如减到50或者20,再重复上述的过程。有了这样的经历会让你在直觉上对上帝的骰子有更深入的把握。也能够理解可重复性在科研中的重要。
真理没有缩水,而是探索真理的方法出现了迷失。以金融市场为例,由于人们对时间序列的执着,想当然地认为对时间采取固定间隔的划分可以窥视数据的全貌,其结果就是上帝在掷骰子。
谢兄想得很深啊,呵呵。。。这些看似最基本的一些统计学概念/问题对于真正搞懂统计,正确用统计思考问题解决问题是及其关键的。我也很同意你的观点。。。 统计 近多少年来在理论上已经很难有突破了,所谓的新方法一般也就是把简单问题变复杂,然后再把复杂的方法,算法 再 近似成“简单”。。。 对简单的模型用精确的算法, 比之 对复杂的模型用近似 的方法, 孰优孰劣呢, 很多时候难说。 希望,在不久,真的会有另一个Fisher出现。
很精彩!

在我没有看Lindsey的paper之前,我并不同意似然是一种近似或者与积分中值定理有关。连续随机变量和离散随机变量并没有本质区别,只是一个相对counting measure,一个相对lebesgue measure。不过我同意似然并非万能,比如Cauchy分布的似然就表现很奇特。指数分布族下,似然应该接近完美。

似然的观点其实可以和纯频率学派划清界限。Pearson用矩估计,可以看成正统的频率学派;Fisher用似然,其实更和Bayes相近。只是我们的教科书证明最大似然估计的渐近性质,用到了大数定律和中心极限定理(+泰勒展开),把似然的观点弄成频率学派。

另外,“渐进”->“渐近”。
[未知用户] 谢谢纠正错别字,我居然把所有的渐近都写错了,汗。

你说的也有道理,我以前也是这么想的:尽管密度不直接是概率,但它在某种程度上也体现了概率的相对大小。Lindsey的文章里提了说Fisher老爷子当年定义似然函数的时候在这里非常小心,Fisher用的就是领域内的积分来表示似然函数(这是真正意义上的概率),并不是直接用的密度函数。(如2楼高涛所说)

似然与Bayes更近这说法我也同意,矩估计的基础是期望,而期望则是频率学派的典型特征。
很喜欢小谢的文章。
我上统计学课的时候,给学生介绍统计软件,还引用过小谢的话。还直接得到过他的帮助。
作为一个概率出身的人,想说几句关于概率论的话。概率论是一个数学理论,她象任何一个数学理论一样,有她的三个方面的内容:直观,形式逻辑,应用。而随机变量是为了形式逻辑部分的研究而存在的。相对于其他数学中的对象,她应该算是比较直观的了。
概率论的直观和应用都非常丰富,但这不能作为她的全部,她的中心应该还是形式逻辑的部分。概率论不能专门为哪一个应用而存在。象任何的理论一样,她应该是普适性的。这就要求她应该有自己的理论体系。这也不可避免的会损害她的直观性。但这不是概率论理论的问题,而是任何想应用这个理论的人应该考虑的问题。概率论说到底也只是个工具而已。好比一个锤子,你拿来用可能是不趁手的,因为这个锤子不是为某个人造的。但是这毕竟是一个锤子,可以在很多地方用上。
不知道这些话发在这里是否合适,因为看到了,就有些话想说了。关于上面的话,其实在W.Feller的书里有更多的话。因为恰好反映了我想说的话,有些就直接拿来用了。
[未知用户] 很高兴看到张老师的评论,因为我在数学方面功底不行,所以我一直都想听听数学出身的人怎么想。关于形式逻辑,让我想起来当年张波老师教我们实变函数,当时我心里是八百个痛苦,因为那玩意儿没办法从直观角度去考虑,或者非要从直观角度考虑的话,就会学得很慢很慢,后来我心想算了,这定理套定理的东西只管逻辑就行了,追求直观是自找麻烦。到现在我还是很怵形式逻辑,测度论学得一塌糊涂。有一次我斗胆问了我们系一位测度论老大师(老大+大师+老师),您在概率论或数理统计中见过不可测的集合吗?估计老爷子心里很不高兴,说没有,但你若需要我可以给你造一个。从我的角度来说,我看到的是我们花了很多时间和精力在定义(外)测度、可测集合、可测函数,但当我们步入概率论的领域时,这些基本概念都成了“理所当然”的东西,谈论的对象都是可测的;讲Lebesgue积分时常引用那个Riemann积分不存在的例子,可是那种“奇怪的”函数(Dirichlet)只是从逻辑中构造出来的而已,当我们步入概率论时,看到的都是“乖乖听话”的函数,积分仍然都是Riemann积分。这些都是我的困惑,当然,也可能只是因为我比较懒,于是自欺而已。

抽象肯定有抽象的好处,就算是编程序写代码也需要抽象,否则代码很容易陷入杂乱无章的状态。统计图形界的大佬Antony Unwin去年在ASA的一份Newsletter中写了一篇文章Getting into hot water over hot graphics,当时我读的时候对其中一句话印象比较深刻:让严谨的数学家远离数据分析是件好事(后半句我就不翻译了)。

无论如何,谢谢分享观点,闲暇之余,还想请张老师在这里写两篇小文章,推动咱们学院老师的上网工程啊:)
曾经有过以下的发生在TEXAS的故事:
几个经济或管理系的研究生在大学书店里翻看了LEHMANN的两本专著后说,这书一点儿都不好读,我们的统计教材那么清楚,谁读这破书!话音刚落,一个数学系的学生愤愤道:你读不懂也罢不需要读也罢,但是你不能贬低它们!
我想说:因为对数学,概率和统计系思想的了解不足导致我们生出那些所谓的WEIRDNESS,我们的无知使我们对这些理论生出许多不切实际的幻想。实际上那些先贤比你我要严谨的多!顺便说一句,不懂数学才会产生数学无用的感慨!
即使是频率学派也没法摆脱主观判断,比如说同样的数据,如果检验的效力不够,也依然可以让互相矛盾的假设通过检验。这时岂不是可以说统计的结论有时取决于人所希望出现的结果了?
所以我认为统计只是人类在不能认识真实世界的时候,迫不得已才使用的一种工具,它与真实的世界图景无关,而只与人类对世界的感受有关;或者说统计本来就是纯粹的主观的方法,只要它符合人类的经验,并证明了对人的实践活动有用,那统计就是有意义的,去追求纯粹“客观”的统计学,根本是不可能做的到的。
以前有一位老师跟我说过四个字“有胜于无”,我想这就是统计的全部意义。即便是统计推断的结果离真相相差甚远,但至少我们比没有统计的时候知道了更多的信息,我们的信心就会更足,即便是可能有错误的信息,也比完全没有信息更好。
这也是统计与数学的不同所在。数学所追求的是真正的世界的真相,而统计学不是。
[未知用户] 我道听途说(听我们一位老师说的),说UC Berkeley的统计系研究生现在也不用Lehmann的那两本教材了(如果这里有UCB的学生可以验证一下)。关于理论的用处,我比较同意上面张景肖老师的看法。另外我还有一个很傻很天真的想法,那就是人生太短,测度太长,这也是我总是不情愿花太多时间在太源头的知识上的原因,尽管我在本文体现的意思是要注重源头上的理论,但我的源头定在概率论上,再往前,我就吃不消了。各人有各人的研究兴趣,贬低别人当然是不对的。

关于先贤的严谨,我们自然得同意。人们生出数学无用的感慨,我想也不是全无道理,可能主要是因为严谨只能存在于数学的世界,在一套公理化结构下,结论都是严谨的。统计学里包括理论研究和应用,一旦到了应用,我们不可避免要呲牙咧嘴:因为实在是很难追求数学那样的严谨。最典型的问题就是理论假设很难严格验证,很多时候都只能是凭经验(就比如读一幅QQ图,你无法“严谨”)。这些争论其实都无关紧要,有用也罢无用也罢,重要的是拿捏好科学与艺术的平衡,知道理论在哪里可以让步,哪里必须坚守,哪里可能有危险以及危险是否能承受。大隐隐于市。
我们可以这样想,如果没有对随机现象的基于概率论的精确表达,统计推断的方法从何而来?难道都给予感受和直觉?统计之所以有受人之诟的不精确的一面就是由于他一开始就放弃了对机制的准确认识而仅仅想从观察中认识机制。所以,没有对统计推断原理的良好理解是不可能驾驭好统计方法的。正向眼下的美国人在滥用统计一样!
[未知用户] 这番话说得相当在理。
[未知用户] 是啊,好久不见。
挺好的吧?
7 天 后
我居然现在才看到这篇好文章!前后读了两遍,受益匪浅啊~很多东西原来只知其然不知其所以然,比如delta方法,现在终于知道来源了。
我统计学学的不多,不好对文中大多数观点评价什么。只是yihui提到了一个例子跟我本专业有关,所以来说两句:
“我相信大多数人不会玩(除非你实在太有钱了)”
从最近的行为经济学的研究来看,我们对于这种行为的解释是人们除了有“预期”之外,还有风险厌恶的情形。简单的说,“输掉100万”是他们最不爱看的情况,从效用论的角度来说这种“负”效用会远远大于“赢得100万”的效用。这样的解释是建立一个新的效用函数,把“货币收益”map到“效用”。稍复杂的模型设计到regret aversion等等,总之就是人们不喜欢后悔。
所以从我的观点来说,“期望”并不一定不可取,只是这个期望到底是怎么算出来的有待考量。这就牵扯到经济学中对于“期望效用理论”这个foundation的争论,可算是说来话长了。