主成分分析。研究一种病,其中一个相关的变量是地区,那么地区这个概念我怎么转变成能量化能编程的变量?还有年龄,性别 之类的变量。

主成分分析针对的是连续变量,所以你的这个数据不能用 PCA 。

地区,性别 属于 分类变量 (categorical variable),无法转化。

只有 年龄 可以勉强算作 连续变量。

回复 第2楼 的 mengchen:

那么,是不是可以也把地区转成连续变量的对吧。比如用坐标什么的概念?

回复 第3楼 的 sillymoon:

我想不到方法,对于这类变量更直接的思路是用 ANOVA 分析

可以用MFA,加载FactoMineR包。谷歌一下会发现一个很详细的说明网站

回复 第5楼 的 crouchred:

MFA 适用于有多个数据表的情况,lz 这个应该是不可以的