keke.hunhun
在做主成分分析时,如果出现样本协差阵有两个最大特征值,那么改如何选取主成分呢?请各位大侠发表高见。
laterstudent
看特征值的累计贡献率,一般取大于等于80%的前几个。
shunqinature
如果我理解的正确的话,楼主的意思是两个最大的“相等的”特征值。这种情况比较麻烦。因为这个特征根对应的特征子空间是2维的,也就是说这个子空间内任意两个线性无关(互相垂直)的向量都可以构成特征向量。所以这两个特征向量有无数种选法。在这种情况下你是没有办法选取“一个”主成分的。
在这种情况下,我的理解是,你必须同时选取两个主成分(那个子空间内任意的一对基底)而不可以分开选,否则没有任何意义。这样的话数据在这两个主成分所组成的2维空间上的投影是唯一确定的。这样就不影响任何接下来的分析。
我同学跟我提过好像泛函里边的算子特征根理论会讲,这种情况出现的概率是0,所以一般不用担心。
不知道我说清楚了没有
shunqinature
Actually this problem is sort of like the estimability problem in linear regression when the design matrix is not convertible.
keke.hunhun
如何投影?我是在做硕士论文,所以有些东西还是要说清楚的。谢谢