taohuadaozhu 文本分析,做dtm <-DocumentTermMatrix(ovid),我的ovid是用空格隔开的文本,以前做的时候,出现的词都是单个的。这一次,统计的词都是一对一对出现的,“儿童 学校”“200元 老师”,不知道为什么,可否赐教? ovid <- Corpus(VectorSource(data[,1])) dtm <-DocumentTermMatrix(ovid) inspect(dtm[1:5,15:25])
taohuadaozhu 回复 第2楼 的 ricklovelisa:谢谢!好像确实是这个问题。我换了R3.0.1,就没有这个困扰了。 不过我的dtm太大,现在的问题是result would be too long a vector。 thank you !