数据集如下: 链接: https://pan.baidu.com/s/1d4W3B-jcx9x3QlqDw5F3FQ?pwd=cosx 提取码: cosx
row: 样本 column: 基因 0代表无表达,1代表有表达。 经过尝试pheatmap,complexheatmap,自带hcluster功能等,查了这些包自带example和网上教程,都是使用连续变量做聚类分析。。 请问这种0和1的分类变量能否做聚类分析呢?
Latent Class Analysis (LCA)可能可以满足你的要求。这个模型就是假设存在一个分类潜变量,决定了其他分类显变量的概率分布。
这是我之前简记的文档: https://rpubs.com/Plumber/851181
一个简单的解决方案是改用余弦距离,算一个距离矩阵,as.dist() 带入 hclust() 就可以了。
as.dist()
hclust()