• 机器学习
  • 已经安装了hadoop,是否还需要安装rhadoop?

公司想用R语言对一些数据进行分析,单机跑得太慢,因此想让R用分布式的方法运行.

目前已经有一个hadoop/hive集群,

我的理解是直接安装Rhive就行了.

Rhive能将R语句转换成map reduce过程在hadoop/hive集群上运行

那么这种情况下,是否还有必要安装Rhadoop?

Rhive能将R语句转换成map reduce在hadoop/hive集群上运行

这个是骗人的吧。。。

Rhive是R调用hive的一个接口封装,我理解和thrift,odbc是一样的

回复 第3楼 的 波波头一头:RHive 将R代码转化为 Hive 代码,然后Hive 代码转化为map reduce,从这点来说,没骗人。但——不是将R语法转化为 Hive,而仅仅是封装和连接,这点上来说,骗人不轻

回复 第5楼 的 刘思喆:

版主,求助啊.

现在我不清楚Rhive和Rhadoop有什么区别

我们现在已经有了一个hadoop/hive集群

我是只需要安装Rhive呢?

还是Rhadoop也要安装了?

大家都没有回答我的问题啊.

我是想问已经有了hadoop/hive集群,是否只需要安装Rhive就行,Rhadoop还需要安装吗?

RHadoop是一个项目名称,它由三个包组成。

编写MapReduce应用的rmr2、用于R语言访问HDFS的rhdfs以及用于R语言访问HBASE的rhbase.

可以参考张丹先生的技术博客

http://blog.fens.me/series-rhadoop/

回复 第7楼 的 cos123:完全看需求。。。用得到就装,用不到就不要装。就是这样。