bear 求教:安装rJava时,老是安装不成功,w? 报错如下:install.packages('rJava',rep='http://ftp.ctex.org/mirrors/CRAN/') Installing package(s) into ‘D:/My Documents/R/win-library/2.12’ (as ‘lib’ is unspecified) Warning in install.packages : package ‘rJava’ is not available
linkinbird 问下R里面能实现自设词库吗,还是需要整体更新R包? 在开发资料里看到: “默认在 classpath 中加载 data 目录(词库目录),找不到再找 user.dir/data 目录。但是优先 mmseg.dic.path 系统属性指定的” “外部程序可以使用 wordsFileIsChange() 和 reload() 来完成检测与加载的工作. (内部不实现自动检测与加载,留给外部程序去做。)” 但是貌似函数不存在╮(╯▽╰)╭
linkinbird 回复 第41楼 的 刘思喆:找到了哈哈多谢,现在觉得词库的作用比算法更重要啊。我们最近在做电子商务产品的分词,发现“酒意”经常出现,这按理是个很常用的词,但是其实原本是“酒意大利产”,被分成了“酒意 大利 产”,打算在做这类分词的时候直接把“酒意”从词库里去掉了
sociology 回复 第44楼 的 lwgg523: 有很多不同方法。这里是一种可能。 使用readLines等函数可以读入文本。 paste可以将多行合并。 一旦有了character vector,就可以对其进行中文分词。