[quote]引用第71楼qxde01于2009-10-29 20:16发表的 :
期待R在数据挖掘方面有着更好的发展
有些公司有意愿使用R做BI
但他们有两个困惑:
大型数据的处理,内存一直是瓶颈
另一个是不知如何给员工做培训
.......

[/quote]
刚才看到BI,险些理解成报表,唉!现在这个时代,大家把 BI 概念炒太烂了,难怪 SAS 和 SPSS 都要和 BI 划清界限。
R 在数据挖掘上发展已经相当不错了,比如我去年在 R 会上介绍的
《数据挖掘过程在 R 环境下的应用》。当然这只是一些皮毛,如果结合业务,会衍生出很多有价值的应用,稍稍整理一下,就可以出非常漂亮的成果。
内存问题的确是瓶颈,但实际业务中的内存问题不会太多,谁也不会没事老去跑什么bagging,boost,randomforest。即使遇到了不是还有抽样技术可用么。
多线程计算能提高效率,有的算法完全可以通过多开几个进程最后合并计算的方法来做。如果算法的结果不能合并,还有曲线救国的办法。
R 的学习曲线很陡峭,但如果系统了解统计学原理,英文ok 的话,凭借 R 强大的帮助,上手会非常快。如果统计学原理不太熟,英文一般,那是得花些时间。到了企业级培训这层,COS 上卧虎藏龙,组个团队,系统的讲授 R 绝对可行。估计也就是 5 天的课程。