这里大部分是工具链的问题...看这情形Windows是不太搞得定的。
- 数据库连接: external: MySQL, R: sqldf 等包
- Data clean: external: python/perl, R: reshape/reshape2 and others
- 建模: 略
- 可视化: R: ggplot2
- 模型验证: debug/microbenchmark/Rprof/lineprof等
- 模型修改: 自己看着办吧
- 上线: 其实这个最麻烦。php/asp动态调用后台脚本倒是简单,但是要求你的Rscript有足够丰富的API而且要(无数次的)调试。或者采用R后台写入数据库,php调用数据库。这个和统计一点关系都没有,但是你要想上线大约就是这么麻烦。
- Robustness: 新手容易忽略的,这么多工具链组合起来调试可是...
上述工具要么使用API(不见得都有),要么使用Linux下的bash(shell)等CLI。
所以说,大约R可以做的只是读入数据、数据清理(只能做很简单的,特别复杂的,设计binary的只能依靠外部程序)、统计建模、出图表等结果。你要做[大型]项目,R的使用只是一个很小的方面。其它东西需要完整的IT支持。
完整的可用项目大约都能直接卖钱--由于操作系统、CLI环境配置不同,本来就不适合移植。一个完整的流程会花费很长时间。
对于线下standalone GUI,也是吃力不讨好的:
- Tcl/Tk 框架: 这个玩意儿有多么的不靠谱,tcl/tk内部的库消亡的太快了,很多widgets在不同版本中就像薛定谔的猫一样,而且接口都能变(哦,QT5也是这个样子的)
- Gtk框架: 挑战一下那个烂得一坨的官方文档?其实你要是本来就用Gtk会发现其实很好懂啦。
- wx/Qt: Rcpp/inline等的功能,链入wx/QT等C++工程毫无压力,但是首先要确定你知道这是啥。