• R语言
  • 请教:在tm包中如何计算term间的cosine距离

如下,我想使用以下方法计算词间的cosine距离

<br />
corpus=Corpus(VectorSource(text))<br />
tdm = TermDocumentMatrix(corpus,control = list(stopwords=stopwords("mesh"), weighting = weightTfIdf,tolower = FALSE))<br />
tdm_dist = dissimilarity(tdm, method = "cosine")<br />
</p>

但是算出的结果是文档之间的相似度,请问如何才能计算词之间的cosine?

希望各位老师帮助,感激不尽!

因为我想对词进行聚类,想用cosine计算词之间的距离,但是好像在tm包中实现不了,我是R初学者,这个问题快困扰我一周了,搜索各个资料都没有解决方案,期待各位高手的指点!

proxy::dist(as.matrix(tdm), method = 'cosine')

但不建议用,因为item太多了

回复 第3楼 的 刘思喆:刘老师你太牛了,太感谢了,非常感谢,非常感谢[s:11]

确实感觉到计算速度慢,不过我想测试一下这几种距离算法, 看看哪种效果好。