xinguanxk 哦。我想起来了。我已经分好词,但是有新问题:我分完词由自己输出了新的txt,是在读入然后想建立矩阵的时候,首先读入的词全部都变成乱码,(因此建立矩阵的事情就堵在这里),后面可能会遇到的另一个情况,是不是必须把分出来的词都向量化了,才能建立文档矩阵?
星星-1286230469 [未知用户] 添加自定义字典,出现这样的错误> cutter=worker(user='字典.txt') Error: buf.size()<1 DictTrie.hpp : 158 (bad dictionary file) 如果直接粘贴到library/jiebaR/dict/ 目录下的 user.dict.utf8,也会这样报错,但我最后做分词的结果,好多需要的词都被分开了。另外,Rwordseg包分词后的词频文档矩阵里的词类项,一行有好几个词,是版本问题吗?谢谢~