Simon_Chen 不知道论坛上面的各位大神有没有遇见过,就是原本用segmentCN函数切完的字段,一个字符的,两个字符的都有,但是用DocumentTermMatrix()得到的文档-词频矩阵所列的字段只剩下3个或三个以上字段的字段的频率。希望知道的人给个解答,如何设置才能得到完整的文档词频矩阵,先谢谢各位了。
qxde01 回复 第1楼 的 Simon_Chen:有个参数wordLengths,DocumentTermMatrix(corpus, control = list(wordLengths = c(3, Inf))) </p>
Simon_Chen 回复 第2楼 的 qxde01:非常感谢,真的可以,我之前在哪个博客里看到,dtm = DocumentTermMatrix(ovid,control = list(minWordLength=1))这么设置。。。就是出不来结果,非常感谢。