18811378613 我的原始数据如图1所示: 研究目的是在前面9个属性中选出对因变量影响较大的5-6个,之前用二元logistics回归分析直接判断的,但老师说这种方法不对,不适用于这个数据集的数据特点,让我先对数据做白化处理,再用pearson相关分析法分析,但是我做完白化处理后得到的数据(如图2)又做pearson相关分析,所有的因素直接都相关系数都为0.00.请各位大神帮忙看看,老师说的那种处理方法对吗?或者为实现我的研究目的,针对这样的数据集应该用哪种方法更合适? 谢谢!!!
Cloud2016 为什么逻辑回归不合适?加上逐步回归筛变量怎么样?或者你用岭回归处理多重共线性呢?从变量来看,很多是分类型,甚至有些是有序的,这个要注意编码为 factor 或者 order factor 类型
nan.xiao 做任何变换都只应该针对前 9 个变量 (X),不应该包括 y。 whitening 变换是把变量间的协方差矩阵变成单位阵,如果包含 y 的话,那之后 y 和 x_i 的相关系数一定都为 0。