回复 第10楼 的 iger:
嗯,看具体问题了。个人观点,能算还是都算吧 。。。
有些问题利用技巧可以解决,参考邱怡轩在第五届 R 语言会议上的报告《R 中大规模数据的整理和分析》:
http://cos.name/wp-content/uploads/2012/05/4-qiuyixuan-bigdata.pdf
对于技巧也绕不过的问题,R 的可扩展性足够,通过升级硬件一般不难解决。这里有一个例子,使用 R 在 5 节点(各 16G 内存)的微型集群上做 12 亿观测的 Logistic 回归:
http://blog.revolutionanalytics.com/2011/07/fast-logistic-regression-big-data.html
硬件花费仅 5k 刀。而文中提到的 SAS HPC 使用的 Greenplum 集群则不是一般人负担得起的了。