kuanguang 今天,用R实现了以前用python写的东西,解析1万个文件,将数据提取到数据库。 谈谈感受, 1.R是一门比python还高级的语言 不适合底层的处理,写出来的代码只有python的80% 2.运行速度 慢,大概只有python的80% 3.内存占用 不得了,这个程序跑着跑着就死机。 python的版本根本不出现死机速度慢的问题。 R需要优化呀,^_^
yihui 回复 第6楼 的 twinsken:推荐工具结合使用,我们可以选择利用好各个工具的优势,也可以选择吐槽各个工具的劣势。大量的文本数据处理,可能还是用awk/sed/grep之类的比较合适,预处理完之后再派R上场。 顺便说一句,我的knitr包从某种程度上可以整合这些工具,R/python/awk/bash/ruby/haskell/...,都可以放在同一个文档中,示例参见 http://yihui.name/knitr/demo/engines/