某医院有一个词库(见附件,只含部分数据),词库里面的数据是树形结构的,第一列是病名(即节点名),第二列是病名的父节点ID。从一个根节点到一个叶节点决定了一种病情。现在医院想根据此词库,来自动检索医生处方单(数量很多)上病情诊断文本在上述树形结构中所处的位置,也就是自动诊断病情。敢问各位大侠:这个问题需不需要先对处方单上的诊断文字进行分词处理,以期分词结果与词库尽量吻合(但是词库里的词汇很专业,有些还很长,里面的圆括号和方括号等标点符号还有特定的含义,这样分词起来可能很麻烦啊),然后再进行匹配搜索;或者不需要分词,而直接进行匹配搜索?这是昨天我导师扔给我的一个问题,我不太会,所以来跟大家探讨一下 :)