因果推断简介之四：观察性研究，可忽略性和倾向得分

COSeditor

https://cos.name/2012/04/causality4-observational-study-ignorability-and-propensity-score/

yihui

统计可以是良药，也可以是毒药。好孩纸看见这篇文章可以去事后分层，让观察性研究变得像随机化试验；坏孩纸也可以去吭哧吭哧选择特定的协变量，想方设法让Y(1)和Y(0)有所谓的显著差异。

yihui

yihui 唉，这位同学不知天高地厚，偏偏又喜欢指指点点、说话还这么不中听；十年后再看真是汗颜。

yuanfan 这篇的公式我看着是好的啊。

dingpeng

[未知用户] 说得在理。所以，我对那些黑箱子似的方法或者统计软件保持高度的警惕。统计要解决问题，最后还是要回答实际问题本身，把统计推断的方法改进得更加的复杂或者精细，似乎倒在次要。

按照你的说法，大部分社会科学的研究者都是“坏孩子”。

cloud_wei

很喜欢那一段哲学的论述，很多问题放在哲学层面上几乎只有吵架的份了

dingpeng

[未知用户] 是的。数学可以用定义-定理似的方式推理下去。但是哲学用日常的语言进行定义和推理，每一步都有“误差”，多推几步常常都不靠谱了。

Tao-tao.79.shi

[未知用户] 虽然我自己也是试图建黑箱子的和试图打开被人作的黑箱子，我还是很同意丁鹏的说法：“我对那些黑箱子似的方法或者统计软件保持高度的警惕。统计要解决问题，最后还是要回答实际问题本身，把统计推断的方法改进得更加的复杂或者精细，似乎倒在次要。”

倒是不太同意”大部分社会科学的研究者都是’坏孩子‘。“ 的论断。我看到的很多社会科学的研究者还是很用心的去相让”让观察性研究变得像随机化试验“，但是实践中有太多的限制条件没法克服。

Tao-tao.79.shi

[未知用户] 再回到黑箱子上，我个人感觉大多数做”黑箱子“时压根就没有想去做因果关系分析，也没有心情关心因果关系，因为数据收集过程就没有经过设计。大多数黑箱子要解决的还是预测问题，

简单的 ”X 导致 Y “ 在有些复杂的实际问题中本身意义就不大，因为我们没法控制其他 A, B, C, D, E, ...，相反，找到一个合适的 A, B, ... , X 的组合更有实际效果。

但既然方法提出了，总有好事者船载已入，就想用这些方法来做其他事，比如因果关系。

Tao-tao.79.shi

[未知用户] 挺喜欢丁鹏写这个系列的。能否在系列快结束时也加入些多样化的观点，比如评论一下 David Freedman 的最后一本书：
Statistical Models and Causal Inference, A dialogue with the Social Sciences. 摘选两句：
"Causal inferences can be drawn from nonexperimental data. However, no mechanical rules can be laid down for the activity. Since Hume, that is almost truism. Instead, causal inference seems to require an enormous investment of skill, intelligence, and hard work."...

"Naturally, there is a desire to substitute intellectual capital for labor. That is why investigators try to based causal inference on statistical models"

dingpeng

[未知用户] 也是，不能一句话把社会科学打死了。其实很多做经济学、社会学和政治科学的人，统计的功底都非常的好。

我会努力加一些其他人的观点。比如因果图，工具变量等等。如果有可能，也会讨论 James Heckman，David Freedman，James Robins 等人的观点。不过，有时候不知道从哪里讲起，就采用了我自己觉得能够一以贯之的术语和观点。

fisheat

"按照 Don Rubin 的说法，我们应该根据倾向得分来“设计”观察性研究；按照倾向得分将人群进行匹配，形成一个近似的“随机化试验”。而这个设计的过程，不能依赖于结果变量；甚至在设计的阶段，我们要假装没有观察到结果变量。"

事后随机化的理念对于许多医学研究非常重要啊！

Jolyn-jolyn.he

文中貌似有个小笔误。ACE_unadj和ACE_adj估计式后，貌似应该是Z indept of {Y(0),Y(1)}及 Z indept of {Y(0),Y(1)}|X

dingpeng

[未知用户] 已更正。多谢！

李晓矛

刚开始接触因果推断，有个小问题没太明白，“原因的结果”和“结果的原因”有什么不同呢？

dingpeng

[未知用户] 多念几遍。

Tao-tao.79.shi

[未知用户] 我读了几遍也没搞懂。能否举个实际例子呢？

dingpeng

[未知用户] 我想写一篇文章来解释。

Tao-tao.79.shi

[未知用户] 没有个简洁明快的例子吗？好像很深奥啊。

dingpeng

[未知用户] 之前想简单提一下，现在突然想多说几句。。。呵呵

cloud_wei

[未知用户] 我的粗暴理解是：原因的结果是讨论发生一件事情会导致什么事情，而结果的原因是一件事情发生了去回溯这个事情产生的原因。

firelife

最好用简单的语言描述一下，那些公式我基本上看不懂哎