cos123 公司想用R语言对一些数据进行分析,单机跑得太慢,因此想让R用分布式的方法运行. 目前已经有一个hadoop/hive集群, 我的理解是直接安装Rhive就行了. Rhive能将R语句转换成map reduce过程在hadoop/hive集群上运行 那么这种情况下,是否还有必要安装Rhadoop?
bjt 回复 第3楼 的 波波头一头:RHive 将R代码转化为 Hive 代码,然后Hive 代码转化为map reduce,从这点来说,没骗人。但——不是将R语法转化为 Hive,而仅仅是封装和连接,这点上来说,骗人不轻
cos123 回复 第5楼 的 刘思喆: 版主,求助啊. 现在我不清楚Rhive和Rhadoop有什么区别 我们现在已经有了一个hadoop/hive集群 我是只需要安装Rhive呢? 还是Rhadoop也要安装了?
512002855 RHadoop是一个项目名称,它由三个包组成。 编写MapReduce应用的rmr2、用于R语言访问HDFS的rhdfs以及用于R语言访问HBASE的rhbase. 可以参考张丹先生的技术博客 http://blog.fens.me/series-rhadoop/