pengchy
芯片数据聚类结果分析
步骤如下:
matrix为待分析的差异表达基因数据矩阵
dis<- cor(t(log2(matrix)),method="pearson")
dis <- as.dist(dis)
tree <- hclust(dis,method="complete")
plot(tree)
cutree(tree,h=0.9)
请问:
cutree返回的结果是与某一项相关系数大于0.9的项的个数吗?如果我想返回与某一项相关系数小于-0.9的个数该如何操作?如何取得各个集合呢?
另外:R中关于聚类的包很多,不知它们的区别是什么?
谢谢!
pengchy
哈哈,我的问题太基础了,回去自己好好看吧
yihui
自己依据hclust结果中的heights就可以cut了吧
bjt
topic help?
h : numeric scalar or vector with heights where the tree should be cut.
pengchy
谢谢两位老师!问题已经解决。
gs12 <- cutree(tree,h=c(0.5,0,-0.5))
table(gs12[,1],gs12[,2],gs12[,3])
然后选择合适的类数目再进行分析。或者根据k数目选择,分析感兴趣的目的基因所在的类。
yihui
贝吉塔老师好!
pengchy
在用hclust聚类出来结果后,用cutree分析,请问:
怎么判断选出来的类内的各成员之间的距离都是小于某个值,或者大于某个值的?
比如说,我用pearson相关系数作为聚类的距离矩阵,在cutree(tree,h=(0.9,-0.9))分析时,我想把tree中所有组内距离大于0.9或者小于-0.9的类选出来,不管它们类的大小,该怎么做?
很迷惑!
谢谢!