肚腹 虽然你的回复已经是四年前了,但是还是忍不住想回答一下,因为这是一个非常经典的问题。你提出的这个问题是包含在因果推断教材里面的,具体而言,属于Simultaneity/Reverse causality问题。这个问题非常普遍,在我们看到一组数据,变量X与Y显示了‘相关关系’的时候,我们一般会认为是X→Y,但是实际上,也有可能是Y→X,甚至有可能是X与Y互为因果。哪种是对的,取决于数据生成流程(Data Generating Process)。具体到本文这个问题上,我们认为是吸烟(X)导致癌症(Y),其具体的DGP是:吸烟→增加癌症的发病率→癌症,但是为什么不能反过来是癌症(Y)导致吸烟(X)?我们完全可以说真实的DGP是:得了癌症→轻生从而自暴自弃→吸烟。这也完全说的通不是吗?因为从数据集的角度来看,从这两个DGP得到的数据结果可以是完全一致的。因果性的黄金准则就是纯随机实验,哪种是对的?做一个实验。我本人不是学医的,但是为什么癌症导致吸烟这个因果关系没人去研究呢,我猜想可能有两个原因,第一,一般人很难想到这一层因果关系,且这个研究没有什么实际价值,第二,把癌症与否作为treatment是不道德的,你可以控制人抽烟不抽烟,但是控制人得不得癌症,这个想法很危险,有人可能会问可行性问题,我大概想了想,这是可行的,将实验组的人放到具有高辐射的环境下一段时间,使得他们得癌症。但是实际中,又有谁愿意来作为这个小白鼠呢,对吧?虽然过了这么久不知道你是否还在意这个问题,但仍然希望这个回答解决一个你当年的困惑吧:)