zcx519112
求助:一系列虚拟变量能做因子分析或主成分分析吗?
通过调查得到了14个变量,每个变量只能选择是或否,那么能做因子分析吗?
看了一下因子分析的要求,要求数据服从正态分布,
那么做主成分分析可以吗?
多谢啊.
yihui
这是哪位老大告诉你要求数据服从正态分布的?……
anita_jiu
"每个变量只能选择是或否" - dummy variables are not appropriate for factor analysis, I think.
"要求数据服从正态分布" - this is one assumption widely applied on multivariate analysis techniques, I think.
zcx519112
谢大哥,
那到底能不能用因子分析啊.?
直接说一下吧,小的不太明白.非统计学专业.
yihui
后来我想了想,你这个问题问得也不太清楚,你的“一系列虚拟变量”指什么?到底是离散变量还是虚拟变量?
abel
猜到你的数据情况了,我的建议是千万不要用因子分析哈;当然一定要用我也没有啥好意见。
zcx519112
嘿嘿.
那我把数据情况再说一下吧.
总共有14个变量
每个变量都能选择0或者1.
这样就组成了14个虚拟变量.
不知道这样表达是否清楚.
yihui
那应该称之为dichotomous variable(或者discrete),而不是dummy variable,这是不同的概念
如anita_jiu所说,离散变量确实不适合做因子分析(但不是因为不服从正态分布的原因),因子分析在数学上的处理是对原始数据的协方差阵作分解,我认为离散变量不适合求协方差,这应该是它不适合做因子分析的原因吧。
zcx519112
同意楼上的说法.万分感谢。
但是,这14个变量之间应该是有信息重合的部分的。
问题是,既然不能用因子分析,那有没有别的方法把这14个变量进行综合分析啊?
pigtail
有亚变量主成分分析方法,但还没看过相关内容,不知道如何处理的
zcx519112
嘿嘿,
不知道应该去哪里查"哑变量主成分分析"呢?
谢谢哦。
anita_jiu
[quote]引用第7楼谢益辉于2007-01-06 13:05发表的“”:
那应该称之为dichotomous variable(或者discrete),而不是dummy variable,这是不同的概念
! Ha, agree entirely. Made a big mistake! It is a dichotomous variable or at least, not a continous measure.