我最近在对1389篇文档进行文本聚类,打算使用层次聚类和KMeans聚类,层次聚类的代码如下:
# 计算矩阵之间的cosine距离
abstract_dis<-dissimilarity(abstract_dtm_ns, method = "cosine")
# “离差平方和法”计算聚类集合之间的距离
abstract_fit<- hclust(abstract_dis, method="ward")
# 层次聚类图
plot(abstract_fit,hang=-1)
</p>
如何根据层次聚类的结果确定最优聚类个数?有没有方法或者代码?
我的1389篇文档聚为多少类比较合适?万分感谢~