- 已编辑
yihui 我大三时初接触计量,最大的震撼是通过抽样在群体层面上验证因果关系实在是太厉害了。这与历史学以及政治学主要依靠案例研究(aka讲故事)来做因果有很大区别。老朱是做时序计量的,所以当时讲到Granger causality时我简直想献出自己的膝盖。到了芝加哥大学,我又系统学习了在截面数据里怎么做因果检验的一系列技术(我的恩师Robert Ralonde是通过随机控制实验进行因果检验的新浪潮的始作俑者之一)。所以到了研二的时候,学成了一个toolbox,大有屠龙之技已成的慷慨之志。
就在那个时候(2011),我开始接触machine learning。在统计系和计算机系蹭课时我遇到了一个困难:我无法给非计量经济学背景的人讲明白啥叫工具变量(instrucmental variable)。这促使我反思,计量里面的这些技术,到底是屠龙宝刀,还是杀鸡牛刀。这个反思让我意识到一个非常可怕的问题,那就是整个计量经济学事实上是建立在对于一个看不见的变量(aka epsilon)的结构假定上的。大家吵来吵去,颇似当年基督经学里一个指头上能站四个天使还是五个天使的辩论。所以计量经济学(即使不考虑所有regression torture的技巧)也是一个比讲故事的学科,只不过这个故事是用数学符号和程序代码写成的,而历史学和政治学是靠自然语言写成的。
当然学计量经济学也不是没有收获。计量在抽象建模上还是很有两把刷子的(与machine learning相比)。不是所有问题都可以通过调库和调参解决的。All models are wrong, but some are useful.
碰巧这个时候,我恩师的身体从不佳变成了病危,他也没空管我了。在我mentor的影响下,我开始努力用数据去描述和解决现实问题,而不纠结于这事儿是不是在计量上离经叛道。然后我就选择了教育数据这个领域。