dingpeng
[未知用户] 是的,单单靠统计,是不能建立其因果关系的;但是没有统计,建立其因果关系就更困难了。比如,牛顿的力学中,力是改变物体运动的原因,他的结论是通过实验验证的,最后收集数据分析数据,就是统计。当然,这个例子不是很好,因为经典力学中,测量的误差很小,统计的用处展示不出来。流行病学就不一样了,它基于整个人群的研究,变异性是非常大的,很多时候规律并不像牛顿力学那样确定,所以流行病学和统计是分不开的。其实,从文字的起源上,“流行病学”和“统计”有某种同源性。
你提到的“有时间先后关系,强度、剂量变化关系,终止效应,预测效果,特异性、重复研究的一致性,与相关知识是否匹配等”都非常重要,这些东西都是探索因果关系的手段。
正如我在第三讲中提到的,统计并不助于我们“发现”因果,而是帮助我们“验证”因果;统计学研究“原因的结果”,而不是“结果的原因”。
firelife
[未知用户] 呵呵,非常期待,我也好好复习一下这个概念
crazyfun
[未知用户] 是不是就是说 如果这里我们在设计试验时treatment和control的人数都控制为20,此外在再treatment和control各组中保证男女比为1比1,即treatment和control组中各有10名男性和10名女性。这样我们就可以避免掉性别对treatment在生死上effect的影响了(就是消除了性别的confounding)?
但是因为我们对很多未知的covariates无法控制,所以这个因果推断还是无法继续?
谢谢
PS为啥统计之都现在无法注册了嘛?(另外我明明记得之前注册过的,这会又登不上了=。=!)
dingpeng
[未知用户] 是的。这就是观察性研究的缺陷。这也是很多人对观察性研究很悲观的原因。
但是,完全随机化的试验,理论上可以消除所有的混杂。
crazyfun
[未知用户] 完全随机化就能消除这些因素了嘛?但是intermediator和output的共同未测confounder不是仍然会存在干扰而不发测准direct causal嘛 还在入门中,望指教
谢谢
dingpeng
[未知用户] 这里暂时没有讨论mediator的问题。
江小青
怎么没有人晒扩展问题的答案?
我刚计算了一下,如果保持男性吃药康复的比例为18/12,但是略微改变一下,变为6/4(规模变为原来的三分之一),其余均不改变,此时只有总体的吃药康复率有变化,吃药康复率为(6+2)/(8+12)=40%,与对照的康复率持平,再进一步减小男性康复样本,则可消除悖论。我也认为这和交互没有什么关系,是性别这个混杂因素同时对结果和处理的影响导致的。
这是用平板电脑的回复,可能打字有错误,见谅,有电脑时,我晒一晒对扩展问题的个人回答~并等待丁鹏的答案~
dingpeng
[未知用户] 是的,本质上就是性别同时与处理和结果强相关。
悖论确实可以消除,但是讲这个悖论,只是说有这样的可能性,需要在做统计推断的时候谨慎。
montecarlo-zusongpeng
[未知用户] 更一般的,数学模型都是要考虑推广性的。我们建立模型,实际上包含两部分,一部分是对已知数据学习是否能学的好,另一部分则是这种推广性。MSE只是前一部分,而并非后一部分。
@小雍子
[未知用户] 关于这个问题可以看这里的一篇博客(科学上网)http://zjz06.blogspot.com/2009/04/blog-post_7569.html
我摘出来:
“三、交互影响与共同影响之区别:两者是完全独立的两个概念,不要搞混了。(当然,你即不是世上第一个、也绝不会是最后一个混淆两者的人。)由于经常与人辩论这个问题,我最后找到一个简单而又有力的例子:含A和B两个自变量的factorial experiment(正交实验),在此条件下,A和B是完全无关的(为什么?考考你),即两者对因变量只有独立影响而无共同影响(即 Δ3= 0);然而,分析正交实验数据时,我们一定要检验A和B之间的交互影响,结果有时显著、有时不显著,这就不说明交互影响与共同影响是无关的两回事吗?(我好像写过一个类似的帖子,但一下子查不到了。知道的读者帮帮忙吧)
四、共同影响是什么东东:我写过N个帖子讲交互影响,你的上述理解是对的。这里讲几句什么是共同影响。首先,这个名词容易误导。英文中不是“common effects”,而是confounding effects, overlapped effects, shared effects(干扰、重合、共享等等)。它并不是什么好东西,甚至连“东西”都不是,因为它不含任何信息,只是一个即属于A也属于B的混沌世界(但真正的混沌是有信息、可以解的),也许称为“灰色地带”更准确(相信很多读者对在政策灰色地带中生活有深切感觉)。
当然,“灰色地带”有多种来源,如A和B缺乏discriminant validity(差异效度)、A和B受到第三者变量的影响下、A和/或B中含有偏向对方的系统性误差,等等。不管来源为何,其直接影响了模型的理论解释力(当然并不影响模型的预测能力),所以一般是想方设法减小(而不是“研究”)AB之间的“共同影响”。”
dingpeng
[未知用户] 上面“小雍子”的回复,和Simpson‘s paradox并不是直接相关。
crystal228
[未知用户] 很厉害!是R专家!
希佳
[未知用户] 好奇因果推断和统计学怎么和复杂体系结合
希佳
[未知用户] 不记得在哪儿看到过,说一件事可以有很多causal effect;统计研究的不是cause of the effect 而是the effect of the cause。跟你这个说的有异曲同工之妙