- 已编辑
如果实验者的目的不变(探索25个饮食变量和乳腺密度的关联),分25次实验,每次都单独对一个变量进行假设检验,这样是否也应该使用多重比较?如果每次实验都对结果进行显著性(p<0.05)判断,是否同样不能以这25次实验的结果(是否显著关联)下结论?
是的,这就是标准的多重比较的定义: 对“同一个实验目的进行了条件不同的多次检验”
如果是25个团队分别对这个25个变量先后进行试验,团队1的结果是total calories和乳腺密度有显著关联(p<0.05),团队2的结果是,团队2参考团队1的结果,能下total calories和olive oil和乳腺密度都有显著关联的结论吗?如果不能,团队2合适的结论应该如何?
如果25个独立团队测了25个变量,我们可以预计的是有1~2个团队会获得显著性的结果,比如olive oil。 这在学术界发表的论文中是正常而且广泛存在的, 所以理论上科学论文的结论要做到客观严谨,都要加限制条件:“在XXX的统计检验下olive oil和乳腺密度有显著关联(p<0.05)”。
学术论文的结论并不是真理,而是在当前条件下我们对实验中提炼出来的知识的正确或不正确的总结。这还是理论上运转良好的学术体系的理想状态,实际上人性是复杂的,因愚蠢而错用统计方法,为毕业而不择手段地p-hacking, 追逐热点灌水等等问题都普遍存在,多重检验只是诸多常见错误中较轻的一个。
补充
多重检验校正的核心思想就是将低估的P值调高,从而降低把随机结果当成“显著结果”的错误率。 具体的校正方法也有很多, 截图里提到的Bonferroni correction比较常用,但算最保守的校准方法。 其他方法可以参考R自带的p.adjust()函数的帮助。