Richard1314
library(rJava)
library(Rwordseg)
rwordseg=segmentCN(user.text$text,nature=T)
rwordseg.n=rwordseg
for(i in 1:length(rwordseg.n)){
rwordseg.n[]=rwordseg[][which(names(rwordseg[])=="n")]
}
#创建词条——文档关系矩阵,作图
library(tm)
ovid=Corpus(VectorSource(as.vector(rwordseg.n)))
ovid=tm_map(ovid,FUN=removeWords,"\n")
#dtm=DocumentTermMatrix(ovid) #创建词条——文档关系矩阵
dtm=DocumentTermMatrix(ovid)
qq.matrix=as.matrix(dtm)
创建关系矩阵之前的rwordseg.n的部分值
[[25]]
n n n n n n n n n n n n n n
"工程师" "地点" "年限" "学历" "本科" "程序员" "工资" "范围" "福利" "待遇" "公司" "员工" "行业" "区域"
转换之后qq.matrix结果就出现问题了。。。。部分值如下
Docs 招\n手工 主\n动作 主\n美术 住宿费\n员工 总经理\n司机
1 0 0 0 0 0
2 1 0 0 0 0
3 0 0 2 0 0
4 0 0 0 0 0
为什么会出现合并的词呢,那个‘\n’是啥啊。。。求大神指教 :-)