COSeditor
ypchen-ypchen_cos
什么时候才是R的临界点呢
lixiaoxu
代码开源不等于服务免费、开发者无报酬。linux和Open Office是开源的。基于linux的服务器搭建与维护是很大产业,已经有成功的上市公司从事这方面主业。目前,Linux和Open Office主要的代码量是由受雇于大公司的程序员开发完成。SAS研究所大可反客为主,投资于R相关的产业。
胡江堂
有厂商在行动啦,据说IBM就有一个内部版的R,不知其可。
sgsong
说R用户象apple迷实在是太离谱了。R代表的是自由精神(所以在学术界更容易被接受),与Linux, Emacs等自由软件神似;Apple则不过是另外一个专有软(硬)件供应商,Apple的用户则花大把银子购买并以此为荣。这二者哪里相象了?
zstbee-zstbee
正好去年一年间,我们公司也在选型数据挖掘和处理的平台。
当时也算是比较完成的衡量了SAS和R的SWOT,摘一小段,供大家消遣:
R的最大优势,便宜!
R的最大劣势,单机,内存计算
综合评价:大学里的教学利器,或者公司实验部门的探路者;
SAS的最大优势,完善的商业服务体系
SAS的最大劣势,贵得要死!
综合评价:有钱人的面子货,或者真正需要海量数据处理、并且能赚到大钱的商业公司
胡江堂
呵呵,我说“R的支持者似乎有一种类似Apple迷的气质”,说的自然不是免费或收费。我的观察,R的支持者跟Apple迷的类似之处,是在网络上非常活跃,非常有激情去捍卫这个东西,这种激情可能会忽略一些东西,比如对竞争产品的关注。
-----
这次纽约时报事件,除了广大用户,SAS、SPSS、S-Plus(被Tibco收购)等公司都非常关注。在上面提到的记者博客里,有这几个公司的高级员工的留言,不妨一看:
http://bits.blogs.nytimes.com/2009/01/08/r-you-ready-for-r/?apage=2#comments
bjt
现在是假期,不然又是一场血雨腥风,嘿嘿。
eijuhz-eijuhz
我个人的感觉是:
如果你要找好工作,那应该学好SAS;
如果你要读统计PHD,那应该用好R;
有了R+SAS+EXCEL打遍天下都可以
wensui
in my view, a general-purpose scripting language, such as python or perl, can be used to do data processing or reporting instead of SAS.
R alone can not replace SAS. However, a combination of several open-source languages is able to take care of 80-90% of major functionality in SAS.
Just my $0.02.
胡江堂
FYI:SAS将引入R的接口
IML是SAS的矩阵语言。SAS/IML Studio(现在的名字叫SAS Stat Studio)是基于IML的可视化矩阵编程环境,将要在今年加入跟R交互操作的接口。具体见:
http://support.sas.com/rnd/app/studio/Rinterface2.html
好消息。IML是跟R类似的矩阵语言,它们的融合应该很被看好。还有,传说中的PROC R的推出,也指日可待。
lovebluesky
r啊r
yiyuanfushi
我觉得R比SAS容易学~~~
mkao006
The Associate Professor Ross Ihaka at the University of Auckland正在開發一個叫做"L"的新軟件,請期待。
yihui
[未知用户] 有没有更详细的信息啊?L是干什么的?我看Ross Ihaka对R的速度和数据处理能力似乎有所不满,难道是要改变这个状况?……谢谢!
mkao006
神人你好:D
教授他說他已經對R沒有太大的興趣了,他說R好像沒有太大的進步空間,所以he's working on something new.
我明天問問看他吧,你有什麼想知道的嗎?我順便問問。
yihui
[未知用户] 我从他的个人主页上也了解到他对R的一些看法了,不知道他开发L是不是为了克服R的缺点。现在有没有测试版放出来?
biostat
我还是比较支持在SAS里融合R,正如上面所说外加一个过程,PROC R...
mkao006
今天問過教授,他說他覺得R運算太慢,在目前的測試中,新的程式大概是R的400~600倍左右(同樣的function)。
他說因為R現在用的是"Call by value",他想改成"Call by reference",這樣在運算上會加快很多
他還說在data handling上面,現在只要data set超過大概1GB,R就跑不動,他希望在這點上面加強。
不過他最後也說了,要在等10年(that's how long R took).......不過新的程式也會是免費的。
yanlinlin82
[未知用户] 如果用“Call by reference”的话,的确能够省掉很多拷贝数据的时间,尤其是很大的数据。但是恐怕今后写函数时就得注意修改了参数的值以后,外部的变量也就变化了。
我没有研究过现在R的源码,不知道它是不是每次调用函数都会把每个参数都拷贝一份。如果它使用了“Copy on write”机制的话,应该也能省掉很大一块时间,估计能跟“Call by reference”差不多。
不过,即使它现在没有用这种方式,我想也完全可以在底层实现上改进为这种方式的,对上层应用也不会造成影响。大概不需要单因为这个就重新设计一个语言吧。