强烈建议楼主,从新整理一下代码,让我们可以学习!!
新浪微博文本分析初探v0.1
[未知用户] 是啊,是这样的。。
除了盼望楼主加上那句以外。。。
还有这句:(这个词频是我人工清理过的,但是只删除了一些符号)
楼主肯定手动删除了,我,的,看 这样的词语
在英文里这些叫stopword是可以用tm包自动删除的,中文有没有类似匹配的东西呢?谢谢啦
还有这句:(这个词频是我人工清理过的,但是只删除了一些符号)
楼主肯定手动删除了,我,的,看 这样的词语
在英文里这些叫stopword是可以用tm包自动删除的,中文有没有类似匹配的东西呢?谢谢啦
赫兄弟的代码没写得很清楚,实际上处理中文的流程有些不一样的,有好几个人都跑来问我tm为啥出错,估计都是看你的代码被坑了。如果是先分词,再进tm包建立corpus就不会出错。
[未知用户] 我这个代码缺失了一部分,所以有很多人来问。不过我最近事儿实在事儿太多了,过一阵子我会重新整理一下代码。各位实在是对不住了。
[未知用户] 楼主辛苦,静等楼主更新:)
4 天 后
[未知用户] 楼主共享这些代码已经不错了,其他的自己去学习添加吧
郝兄弟,代码赶快重新整理一下,都说是tm包的问题啊
强烈建议楼主重新整理代码!
[未知用户] 当时第一版代码是发在人人网上,那一版貌似是全的。后来转到豆瓣上的时候就少了一些,再放在统计之都的时候就又乱掉了。这个还是我的能力问题啊。我争取5.1假期期间把代码整理出来,并且进行一些更新。文章发在主站上,我会负责到底的。:)
6 天 后
v<-sort(v,deceasing=T)
应该是
v<-sort(v,decreasing=T)
应该是
v<-sort(v,decreasing=T)
[未知用户] 多谢,已改正
4 天 后
你们说的Rweibo软件在哪下啊
23 天 后
两类是自定的吗?
PAM有什么可以检验k值大小的方法没?
PAM有什么可以检验k值大小的方法没?
为啥不用cluster包嘞?感觉比较好用诶。pam适合大数据么,clara是否更好?
有问题的码是分词的事情,好像不是clustering的问题吧?
有问题的码是分词的事情,好像不是clustering的问题吧?
>plot(pamResult,color=F,labels=4,lines=0,cex=0.8,col.clus=1,col.p=pamResult$clustering)
Error in princomp.default(x, scores = TRUE, cor = ncol(x) != 2) :
cannot use 'cor = TRUE' with a constant variable
请教各位大侠,这是什么原因呢?
Error in princomp.default(x, scores = TRUE, cor = ncol(x) != 2) :
cannot use 'cor = TRUE' with a constant variable
请教各位大侠,这是什么原因呢?
4 天 后
> install.packages("Rwordseg")
警告信息:
package ‘Rwordseg’ is not available (for R version 3.0.1)
>
警告信息:
package ‘Rwordseg’ is not available (for R version 3.0.1)
>
4 个月 后
我也出现了一样的错误!!!有解决方案么
1 年 后
你好 请问Rweibo这个包现在还可以用吗?为什么我在关键词搜索的时候就出错了,没有内容
res<-web.search.content("R语言",page=2,)
1 pages was stored!
警告信息:
In web.search.content("R语言", page = 2, ) : Error in page 1
res<-web.search.content("R语言",page=2,)
1 pages was stored!
警告信息:
In web.search.content("R语言", page = 2, ) : Error in page 1
4 个月 后
res <- web.search.content("泰囧", page = 10, sleepmean = 10,
+ sleepsd = 1)$Weibo
1 pages was stored!
警告信息:
In web.search.content("泰囧", page = 10, sleepmean = 10, sleepsd = 1) :
Error in page 1
请问怎么解决,谢谢
+ sleepsd = 1)$Weibo
1 pages was stored!
警告信息:
In web.search.content("泰囧", page = 10, sleepmean = 10, sleepsd = 1) :
Error in page 1
请问怎么解决,谢谢