统计学的领域(写给在统计学院学习的学弟学妹之一)
每次看都有不一样的感受啊!
直到前两天一位南京财经大学统计系的学生给我写邮件我才觉得有人看懂了我的意图。sigh,本学院的学生在与别人交流专业知识上做得真是远不如一些外校学生,看来环境太好对学生的成长并不好……
我也看过几遍,谢兄的这些看法已经先入为主了,讲得清楚简练,很有裨益。谢兄说的一条龙式的统计工作,每个环节都很重要。当然各个环节对于不同应用学科,难度大不一样。谢兄文章内容实在丰富,在此我仅就其中两点发表一下读后感。不对的地方还望指正。
说起收集数据,社会学的就更恐怖了,他们的田野调查一搞可能就是就是几年,甚至十几年。有个外国的社会学家为了研究罪犯心理,上街故意砸东西,迫使警察将其关入,然后融入其中,不动声色的观察,采集数据。北大好像有个教授效仿,但是没砸东西,而是联系警察局。而我们的数据似乎都是官方的,可信度有多大,谁都不知道。我很敬重的经济学家张五常在做实证经济时就是亲身调查,不仅走遍大街小巷,仔细观察,而且经常自己亲自做买卖,获得到数据。他说当年也是研究官方或者别的学者的数据的,但是后来发现这样很容易被蒙蔽欺骗,所以就自己出马了。反观如今的实证经济学,竟然实在象牙塔里进行的!数据是统计分析的原材料,一旦原材料有问题,那么无论模型如何漂亮,算法如何先进,得到的都只能是垃圾——因为进来的就是垃圾,还能指望得到什么有价值的结果?
统计学本身无价值,必须要和其他学科交叉,这才是统计学本身的价值所在。但是事实并非如此——有时没有被合理地利用,而有时却被泛滥而又无耻地滥用。计量经济学,我觉得这门学科很难搞,因为因为经济本来就很复杂,有时定性分析都很困难,更何况定量了,当然如果有朝一日真能差不多精确地定量就好了。放眼望去,现在的计量经济学可谓统计学的天下,一个几乎不懂经济学原理而数学、统计功底扎实的学生可以把计量经济学搞的看起来很漂亮,但是有实际意义吗?
抛开了实际背景和理性分析,而单纯拿数据来操练,实在不妥。另外,鄙人认为经典的协整分析在数理统计中可能有点小用,但放在实际中,却完全是胡扯。温室里培育的花朵,哪里经得起大自然中的风吹日晒呢?而医学统计、生物统计、数据挖掘、机器学习却很好地体现了统计学的存在价值。
说起收集数据,社会学的就更恐怖了,他们的田野调查一搞可能就是就是几年,甚至十几年。有个外国的社会学家为了研究罪犯心理,上街故意砸东西,迫使警察将其关入,然后融入其中,不动声色的观察,采集数据。北大好像有个教授效仿,但是没砸东西,而是联系警察局。而我们的数据似乎都是官方的,可信度有多大,谁都不知道。我很敬重的经济学家张五常在做实证经济时就是亲身调查,不仅走遍大街小巷,仔细观察,而且经常自己亲自做买卖,获得到数据。他说当年也是研究官方或者别的学者的数据的,但是后来发现这样很容易被蒙蔽欺骗,所以就自己出马了。反观如今的实证经济学,竟然实在象牙塔里进行的!数据是统计分析的原材料,一旦原材料有问题,那么无论模型如何漂亮,算法如何先进,得到的都只能是垃圾——因为进来的就是垃圾,还能指望得到什么有价值的结果?
统计学本身无价值,必须要和其他学科交叉,这才是统计学本身的价值所在。但是事实并非如此——有时没有被合理地利用,而有时却被泛滥而又无耻地滥用。计量经济学,我觉得这门学科很难搞,因为因为经济本来就很复杂,有时定性分析都很困难,更何况定量了,当然如果有朝一日真能差不多精确地定量就好了。放眼望去,现在的计量经济学可谓统计学的天下,一个几乎不懂经济学原理而数学、统计功底扎实的学生可以把计量经济学搞的看起来很漂亮,但是有实际意义吗?
抛开了实际背景和理性分析,而单纯拿数据来操练,实在不妥。另外,鄙人认为经典的协整分析在数理统计中可能有点小用,但放在实际中,却完全是胡扯。温室里培育的花朵,哪里经得起大自然中的风吹日晒呢?而医学统计、生物统计、数据挖掘、机器学习却很好地体现了统计学的存在价值。
样本量太小,不能代表总体水平。
魏兄跟我一样成了统计愤青了,哈哈 :) 我个人对统计学在预测方面的模型抱有信心,对解释型的模型持相当大的怀疑态度,但相信结合了其它专业知识的解释型模型是有用的。统计应该和具体的实战学科结合才能做出有用的结果,而不能闭门造车,外面的世界未必那么“精彩”。
另:我这篇文章也是在温室里写出来的,大家小心不要上当受骗
另:我这篇文章也是在温室里写出来的,大家小心不要上当受骗
我对预测更没信心,认为解释是预测的基础,解释不了,谈何预测?最常用的线性回归分析我也十分质疑,至于时间序列中的ARIMA等模型,我觉得比简单的曲线拟合高明不了多少,当然拟合方法也有很多。不过它们都很有理论意义的,其存在的价值是毋庸置疑的。All models are wrong, but some are useful. 当然还得加一句 just on some cases. 尤其是把理论往实际中套的时候。
另:我也有点纳闷,最近随便一发牢骚就上千字了,排在3号的评论我还删简了许多呢。胡适曰,多研究些问题,少谈些“主义”,主义是骨头,问题才是血肉,看来我需要反省一下了。
另:我也有点纳闷,最近随便一发牢骚就上千字了,排在3号的评论我还删简了许多呢。胡适曰,多研究些问题,少谈些“主义”,主义是骨头,问题才是血肉,看来我需要反省一下了。
To 6号:我认为预测不一定需要解释,我之所以相信预测模型,是因为预测模型是可以经受检验的,比如,在没有新的样本的情况下,我们可以用训练样本和测试样本来获得模型预测性能的估计,这样我们对模型的可用性能有一定的了解,而不像解释型的模型,怎么解释都行,看你模型的变量怎么选、数据怎么来,只要最终结果P值显著,那么就皆大欢喜;至于解释是否真的成立,谁都不知道,因为我们不知道什么是真实的解释,公说公有理,婆说婆有理。(相比之下,预测模型要是预测错了我们是可以知道的)
机器学习领域有些方法压根就没法解释,例如Bagging方法集成了多个预测模型来一起预测,你说这样的集成模型过程如何解释呢?里面的关系已经超出人类的想象了……
机器学习领域有些方法压根就没法解释,例如Bagging方法集成了多个预测模型来一起预测,你说这样的集成模型过程如何解释呢?里面的关系已经超出人类的想象了……
1 个月 后
谢益辉----感谢你为统计增益了无限光辉!!! 我顶 !
2 个月 后
这篇文章感触很大,因为本人不是专业学统计的,对里面的很多知识还有待补充学习,但是大侠建议上网少料聊天,确实感触很深!
10 天 后
我想请教各位,有谁知道因子分析的详细发展历史过程?感激不尽!
你可以参考“维基百科因子分析页面”。
1 年 后
偶然路过,看过,觉得很有意思。虽然本人不是学统计学的,但是现在对统计学有点兴趣了,特别赞同“统计是用来说明问题的,不是用来吓唬人的”,这样我联想到大学数学抽象理论的教学,嘿嘿,确实有点吓人!像谢同志学习,能把专业学习处理的这么生动有趣,还有关心同路人的情节情怀,感动哦!
3 个月 后
引用"最后,不要惧怕高年级的学长们,他们都知道吃人是犯法的,因此大可放心去请教、取经,让自己少走一些弯路。只可惜,当年没有学长对我这样说,以至于我一直惧怕学长会吃了我……"
这条很有意思呢...
这个 师兄多笑笑就不会有人怕拉~
这条很有意思呢...
这个 师兄多笑笑就不会有人怕拉~
3 个月 后
精辟又幽默~好文!
8 个月 后
[未知用户] 反观如今的实证经济学,竟然实在象牙塔里进行的!
--------------
国内的经费恐怕是个麻烦事……
--------------
国内的经费恐怕是个麻烦事……
3 个月 后
有没有哪位高手知道使用经验似然方法求均值的置信区间怎么用R语言实现?
4 个月 后
为什么不要没日没夜的自习,要学好,要干什么
[未知用户] 意思是不要为了考试分数而上自习,这东西毕业即失效,还有很多更重要的问题要考虑。
4 个月 后
请问博士,两个变量,均只能用阳性阴性表示,如何比较相关性?谢谢