leejian 回复 第17楼 的 sociology: 如果是分析网络上的文本,可以直接读成DOM树,提纯分析什么的都很方便,中间或者最终结果存入DB可能更好管理。不过如果来源本来就是文本文件就没什么问题。
linkinbird 最近在试这个,发现RQDA包里好像没有文本相关的函数,是因为都在RQDAtm或RQDA2tm里吗?windows版本的这两个包貌似还没推出。想问下tm中是只有英文的文本处理功能的,RQDAtm的中文分词功能是源自哪里?