light_knight 问题是这样的,在我的科研课题中我想区分两个自变量对一个因变量的贡献。我用SPSS对数据进行了回归分析(样本量约200)。但是这两个自变量有很强的相关性(spearman 相关系数0.95左右)。不知道这样再进行多元回归分析得到的结果是否还有意义? 另外就是我的这些数据不是正态的,虽然取Log以后比较接近对称分部。不知道这样使用回归分析得到的p value是否还有意义?我在其他人的研究论文中看到有人使用partial spearman rank correlation分析类似的问题(其中一些文章发表于世界顶尖期刊,如nature系列的子刊)。但是我导师说非参数的偏相关检验并不好,所以很多软件中都没有这种检验方法。不知道像这种非正态的数据,应该用什么检验进行多元分析才合适? 谢谢!
rtist 发什么期刊和方法好不好没多少关系,除非发的就是研究方法的文章。上次那个nature genetics里面的统计错误我都快说腻了。。。 方法不是没有,问题是两个自变量告诉相关的时候,说明他们两个基本上提供的是差不多的信息,除非研究目的就是区分他们两个,否则根本没有什么必要把它们区分开。
light_knight 谢谢楼上两位的回答。我也是在nature genetics上看到有人用非参数的偏相关分析。 我研究的目的的确是区分这两个因素,因为这两个因素有不同的生物学意义。能否介绍一下我的问题应该如何做分析才合适呢?谢谢!!
nan.xiao 这事本质上在回归框架下其实是解决不了的,因为回归做不了因果,只能做预测。对这类 true positive 却又高度相关的变量,在回归(或者假设检验)方法中能做到的最好程度就是让它们都能进入模型里,而不会选不中或者被随机筛掉。 "想区分两个自变量对一个因变量的贡献" 这首先是一个生物学问题,其次才是一个统计学问题。正确的打开方式是使用生物学的知识和假设来设计实验拿到数据,结合统计学对这类问题的求解框架(因果推断),来获得结论。