现在看到的例子都是以月为粒度来处理,但是目前需要以日为单位,对收益率做计算,这中间的时间间隔如何处理?
- 各位好,本人现在要做一个关于期货的时间序列分析,但是因为交易日期不是固定周一到周五(有时候又放假),时间变量在R环境里面要怎么做呢?感谢有经验的人介绍一下~ :-) :-) :-)
- svm里面的说明文档有些参数是怎么来的?比如type,v4~~~请教各位~
- 是的,现在都要认证,我之前在1月份做过~~~微博这么做也很难说对不对,认证是可以,但是操作起来真的很坑爹!
- > rhive.connect("172.16.153.128")
Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, :
java.lang.NoClassDefFoundError: org/apache/commons/configuration/Configuration
这个问题貌似很多人都遇到过,请问有人完美解决了吗?我的环境是3.0.1,按照R的极客理想里面3.0.1应该没问题,至于包的版本:RHive 0.0-7,Rserve_0.6-8.tar.gz,rJava_0.9-3.tar.gz。 - 请教一下,目前公司服务器要搭Hadoop,我准备用hive跟R链接,但是又想在自己的机器上操作以免出问题伤到服务器。能不能再自己机器上远程连接Hive然后在自己的R控制台操纵RHive? :-) 感谢大家给建议,新手就碰到这样的问题真是棘手啊~
- 自己再顶一次:或者说把涉及到的源代码用map跟reduce方式重写也OK?
- :cry: 请教各位大神,R现成的包跟封装好的东西在Hadoop上面能够怎么跑?还是需要重新用“R语言”再次实现一遍?谢谢各位了
- 分词结果如果直接输出,会出现外“\n生\n变量”这样的情况,现在想要用数据框或者列表或者向量存起来,请问能怎么解决?如果有其他方法但是能够实现同样目的的更欢迎~
- [未知用户]
手动装。而且在这里还想请教一下,目前新浪已经不能够实现对自己的微博内容免验证抓取,但是呢申请了开发者账号后面经常报错。请问有谁能够正常验证? :cry: - [未知用户]
我读取的分完词的更死,都是乱码~~~ :cry: - [未知用户]
哦,那个会议的pdf版ppt我有,里面很不清楚的因为太精简,作者的个人网站貌似几个月没登陆或者发东西了 - [未知用户]
这样子啊,因为到时候公司要用Hadoop,应该是放Linus上面所以应该可以,但是目前在自己的机器上面做点demo就比较难看了,只想问如果空格只是涉及到输出美观程度不影响分类结果吗?还有你用过tmcn包没?这个包我一直在本身的文档还有网上都找不到完整的说明····· :cry: - 分出来的中文词有这样的情况“产总值\n就业 声称 失业
3 6 3
实际 实验 使\n数量
10 5 7
使用 示\n计量经济学\n 世界
”
相信很多人做分词都遇到过,想请教一下有什么方法语句能够消除 :-) - [未知用户]
《R语言实战》、《学习R》(如果你只要买一本,《R语言实战》就够了,《学习R》性价比不高但是比较轻巧),如果是尝试各类挖掘,就买《R语言与数据挖掘》 - 非常感谢! 解决我的一个问题
- 试了很好。只是我后面需要建立词项文档矩阵,必须向量化所有的分词结果,看来如果不行就只能用词典来统计然后直接作为关键词反映出来。tm包貌似是不能直接用的对于输入的数据操作。
- [未知用户]
你最后怎么解决的?我现在也遇到这样的情况,貌似有另外的tmcn包,有谁知道这个中文版的包参数要怎么用? - 好的。我看了github的说明,不过出来的都还是字符,这后面就能够直接建立矩阵了还是需要我提到的所有都向量化?
- 哦。我想起来了。我已经分好词,但是有新问题:我分完词由自己输出了新的txt,是在读入然后想建立矩阵的时候,首先读入的词全部都变成乱码,(因此建立矩阵的事情就堵在这里),后面可能会遇到的另一个情况,是不是必须把分出来的词都向量化了,才能建立文档矩阵?