tctcab 在统计之都这样的论坛,我觉得承认无知没有什么好丢脸的啦:)
(1)关于原子性,我觉得你的帖子加深了我对原子性的理解。
Heterogeneity 讨论因果性的时候有一个前提,就是原因和结果都具有原子性,即清晰可辨、不可再分。
这句话说得过于理想化,而且带来了原子性应该是有或无两者必居其一的误导。
我是从以下两句话体会出来的:
我说的是
Heterogeneity 可是在吸烟和肺癌的例子里,这两个事件的原子性都不可细究。
而你说的是
tctcab 第二段又主要论述吸烟和肺癌两者都没有原子性,不满足“讨论因果性的前提”
所以在你看来(或者说,从我原先的论点出发),原子性是一个二值变量,一件事要么有要么没有;但是我觉得这是一个连续变量,所以会“不可细究”。在事件的原子性越清晰,越可能得到确凿的因果性关系。或者说,决定了这个研究所能取得结果的漂亮程度的上限。
举几个例子:
(1)吸烟有害健康。
(2)吸烟导致肺癌。
(3)每周吸卷烟20根以上,60岁以后患肺癌的概率比没有吸烟史的人高出8倍。
(4)每周吸中华20根以上的东亚地区男性,吸烟史每延长1年,60岁以后患肺癌的概率与没有吸烟史的东亚地区男性相比,平均上升25%。
(以上例子中的数据是我杜撰的。)
我不会说(1)中的事件没有原子性而(4)中的事件具有原子性,但我会说从(1)到(4),事件的原子性是不断上升的,从而得到的因果性关系也越来越确凿,判断每句话的真伪也越来越容易,可以浑水摸鱼的空间越来越小。