第一眼世界
我有个问题要请教一下,举个简单的例子:
a种类型(含18个样本) g与h的相关系数为0.23 不显著
b种类型(含22个样本) g与h的相关系数为0.15 不显著
c就是a和b混在一起(共40个样本) g与h的相关系数为0.33 显著
我不知道这个相关性该如何解释?
park
是不是跟样本含量有关呢,样本量小的话变异就相对较大,样本量大一点的话,使变量间的相关性得以体现。
请赐教
第一眼世界
可能是吧
但除过这个原因,就没有其他解释吗?
rtist
另外一个原因是你在看两种不同的数量——一个是条件分布下的,一个是边缘分布下的。
论坛/主站都中有很多simpson's paradox的例子/讨论,你可以读一下。
tupian
加大样本量有时确实会改变显著检验, 这也是为什么我门需要加大样本数来减少认为误差