锋子子子 [未知用户] 可以的,新建引擎的时候设置保留标点符号 cutter = worker(symbol = T),这样符号“ . ”就不会被预处理掉,在用户词典(library/jiebaR/dict/ 目录下的 user.dict.utf8 或者 其他自定义路径)中加入这个词 工业4.0 ,就可以了。
xinguanxk 哦。我想起来了。我已经分好词,但是有新问题:我分完词由自己输出了新的txt,是在读入然后想建立矩阵的时候,首先读入的词全部都变成乱码,(因此建立矩阵的事情就堵在这里),后面可能会遇到的另一个情况,是不是必须把分出来的词都向量化了,才能建立文档矩阵?