xinguanxk
[未知用户]
很巧昨天已经找到这俩包,上传方式能否告知,也可以让大家不用花太多时间找······
xsp
跪求啊 :cry: ,为了这个真是翻遍了
outqin
rmmseg4j : http://cran.r-project.org/src/contrib/Archive/rmmseg4j/ 这个包2012年以后就没更新过了,旧版的,不确定能不能和新版本的R兼容。
Rwordseg :http://jliblog.com/app/rwordseg 在R-Forge上的,可以试试。
xinguanxk
[未知用户]
就在你回复我的时候,我刚好正在R-Forge上面下东西来装,可惜又有新的报错,哎,为什么不同版本的包不能一起继承!!!!!!!哪怕没有更新过自己的包让它原封不动装下来也好啊·····
shuishoufighter
[未知用户]
唉,我也一样诶。。 安装Rwordseg时显示3.1.2版本不能用
xinguanxk
[未知用户]
我按照有人提供的各个包手动安装的方法,现在居然还提示“错误: 没有"web.search.content"这个函数”,连网上的实例都不用做了····
outqin
好吧...可以试试jiebaR,https://github.com/qinwf/jiebaR
可以直接装,比较方便
install.packages("jiebaR")
library("jiebaR")
cutter = worker()
cutter["你要分的句子,或文件路径"]
xinguanxk
[未知用户]
我已经下了包然后装上了,但是现在在做微博的抓取遇到更大的问题,原先lijian写的那些方法试了都无效——新浪现在不允许不登陆就用了,然后我试了去做开发者,在调取登陆页那里一直被新浪显示有错。
outqin
没用过这个包,你可以试着联系一下作者。或者可以看一下包里面的相应 R 代码,这个包是开源的,可以看源代码,知其所以然。根据新浪的最新 API 改一下这些代码。
改好了,如果可以用,还可以在 GitHub https://github.com/lijian13/Rweibo 上进行合并请求。把你的修改告诉作者。
经常看到有人在知乎上面吐槽 R 黑箱.....都不想看源代码,肯定了解得少了。
shuishoufighter
[未知用户]
把Rwordseg包下载下来,本地安装就能安装上了
ricklovelisa
[未知用户]
你好,想请问下一个问题,jiebaR,总是报错Error: std::bad_alloc
是什么问题呢?内存分配吗?
outqin
[未知用户]
运行的机器内存是多少呢?是不是输入的文本很多?太大的文本可能会内存不够用,lines 设置小一些的值就可以了。
http://qinwenfeng.com/jiebaR/param/worker.html
lines 读取行数
每次读取文件的最大行数,用于控制读取文件的长度。对于大文件,实现分次读取。