山水
匆匆过客.我是统计学本科毕业的,现在工作三年了,大三开始学习SAS.现在陷入SAS疲惫期,毕业第一年做临床试验数据分析,现在在银行业做了两年数据挖掘.在校期间用过所有数学软件(不精).看到中国统计学的大家们,还是有一点小小的感慨,毕业第一家公司老总是美国政治学教授,我应聘时问了我一下LOGISTIC回归,争论R,SAS,MATLAB...我也曾想过.我也没有答案,不过这里,我想要说的是,请诸位大家,多学学美国CRO LISTING的美观与严谨,多学学美国统计学这个专业为什么能够列为第一(至少曾经),多学学人家每周都会讨论新的统计学方法...
SAS有它的弊端(比如IML),但是我至今所接触到国内学习SAS的人(包括我在美辉瑞用SAS工作十五年),对SAS的了解程度(不单SAS),对该门语言的机制,对SAS sas help==>proc **==>details的了解...我想说的是,没有人让我满意过,不管是研究生还是博士生,治学要严谨,不要浮躁...
R,SAS,有人研究过统计学的算法吗?如果我说我崇拜美国的统计学家们,各位莫要生气....
有人研究过R的并行算法吗?有人读取过上十亿条观念上千个变量的数据吗?
软件是门很深的学问,特别是统计学,...它需要统计学理论,IT知识(数值计算等)...看看人家SAS的研发团队再说...所以不要单纯的来比较R与SAS,有功夫多去研究统计学理论,如果你上不了高度,多学学R或者SAS别人是怎样将统计学应用于实践中的,再甚者多看看行业的解决方案,
银行业信用评分复杂吗?理论并不复杂,但是标准很好.再回过头看看中国银行业的信用评分...不敢苟同.
多做些实际的工作,同志们,不要老让外国人给我们提供解决方案...
多看看人家的一个软件的架构,看明白了再来提升我国的水平...
我希望转向基于R的BI架构...但是路还很长很远...
不要待在学校里谈理想谈抱负,也不要因为学校资源的优势拿到一些社会上的项目就以为自己有多了不起...
做些实事.希望我以后不要困惑于只能通过google外国网站才能找到帮助.
ghxandsky
[未知用户] 有外国的bioconductor:http://www.bioconductor.org/
ghxandsky
呵呵,有争鸣才好了,通过比较,才会发现同类事物的差别。Unix和GNU/Linux|*BSD,GIMP和Photoshop,Matlab和GNU Octave,SPASS和PSPP,AutoCAD和QCAD(Free Version),Inkscape和Coreldraw,都存在类似的关系。今天的R和SAS,其实没有什么特别,如果有以R为服务的公司出现,那就是R走向工业界的开始。例如RedHat,银行也大规模部署此系统了,尽管1991年Linux内核比起正统Unix如此幼小。我个人比较倾向“学院派”:理想化为现实,with Clever Way.
ghxandsky
[未知用户] Fortran is one of All Evil Things.
ghxandsky
[未知用户] 1991年,Linux面对Unix、*BSD等辈时,不见得当时的人能预见今天的Linux大规模应用。如果出现以R服务的企业推出Enterprise Version,我相信,SAS只能成为下一个SGI。
ghxandsky
[未知用户] dapangmao兄,很抱歉不能访问你的Blog,Google blogspot.com,Wall了。
oloolo-dynamicpanel
本菜SAS,R双修,深感此类争论没有必要。。。。
任何一个用好了,皆是屠龙刀。
请诸位埋头仔细研究理论和算法。
Sonnets-xijia_012
[未知用户] 同意,工具就是工具,我们应该主导工具,而不是工具主导我们。该用什么就用什么,学起来都挺容易的。不过可以把SAS和R同时列为我们的“业余爱好”
bootstrap
[未知用户] 悲剧,我们学校只开R,不过上课的老师是SAS高手,从J&J出来的...
bootstrap
[未知用户] FDA保守是有最基本的考虑,即食品与药品产生问题时的致命风险更高,而人的生命是最为宝贵的,所以对新方法的态度宁可保守一点。至于发信用卡的,就激进多了,反正破产了有政府救市,没太多根本的顾虑,这也是工业界对于所谓数据挖掘方法兴致盎然的原因之一。
bootstrap
[未知用户] R在应对工业界随处可见的large-scale数据集时力不从心,这个问题在短期内也无法解决,毕竟是免费维护的。另外大部分“丰富多彩的”R-package,其可靠性和稳定性都没有经过专业的测试,我想短时间内R想在工业界流行起来有困难
bootstrap
[未知用户] 你不会是我师兄或同班同学吧?
cloud_wei
[未知用户] 他是你的师兄,呵呵:)
fatalerr-cybull
[未知用户] 我想“基本上没有什么单位主要用R来做统计分析”的主要原因一是R缺少或甚至没有专业的技术支持服务,商业领域所有人都希望出钱买稳定和平安;二是推广的原因,商业软件有大量的资金去推广去公关,而免费软件则基本没有推广的资金,即使有也难以与商业软件相比。其实免费软件大都有类似的情况。但随着现在开源软件的盛行,专门做开源软件支持服务的公司也越来越多,我相信有一天R也会出现在商业领域的!
我在想不久的将来,咱们的谢老大有没有可能成立一家专做R支持的顾问公司呢?:)
yihui
[未知用户] 那是极有可能的,哈哈,其实我觉得基于开源软件做商业还有另一点优势,就是这些人(写代码的)基本上都是自我驱动的,这种精神价值应该好好研究一下转化为更强大的生产力
hunter_lee
我以前一直用SAS,后来接触过R后基本上不怎么用SAS了,只是偶尔需要的时候用一下,把以前SAS写的一些宏也用R改写了。的确在使用上,个人感觉R灵活方便,还免费,SAS的费用不是一般人能承受的起的,一般的高校用的SAS也是经常改改日期,不是每年都掏钱的,没有几个能够每年掏的起那么多钱的。
从找工作的角度看,本人曾经找过几个postdoc position,尽管最后各种原因拒掉了offer,但是发现能够有offer的其中一个原因就是会用R。
如果在windows下批处理文件中调用SAS,经常会自动打开sas窗口,这个很讨厌,R没有这个问题。
萝卜青菜各有所爱,当我一接触R时就喜欢上了R,可以说一见钟情了。
Jiazhong Guo
就我的经历和感觉而言,学习R主要还是因为开源;另一方面也是因为R容易上手,使用者能够快速掌握相关library的使用!就个人的兴趣而言,我一直也想学习SAS,我的出发点是SAS是行业认可的金标准软件!
以下为题外话:坦率地说,SAS之所以能够成为今天行业统计分析的金标准,一方面是因为她确实强大(例如SPSS没法比),已被无数事实所证明;但是另一方面,可能和他是美帝国的公司是有关系的,因为FDA也是美国人的,在科研界包括医药界唯美国马首是瞻的时代下,美国人当然会运用其影响力,扩大自己的产品!当FDA将其当做唯一标准的时候,SAS强行推广到全世界了!
一家之言,请勿人身攻击!
yihui
[未知用户] 不造谣不信谣不传谣,参见胡江堂的报告:
http://cos.name/2011/05/4th-china-r-beijing-summary/
shehuixue
[未知用户] 顶,现在的学生就是fickleness,我不是统计学专业的学生,不过看着论坛里就SAS和R无休止的争论感觉还是蛮有意思的,统计学在应用上有这么多的争论,这点起码能反映出学科内还是蛮活跃的,但是似乎缺少一些统计学原理的探讨,这点很遗憾。
sasuser-bangliu80
这是我在saslist.net上发的贴子,转于此。
大部分人都是从统计学的角度谈SAS和R,而且对统计也不太熟。你一小伙子和我这50多岁的老头相比,我当然不如你灵活,可是在职业上我会比你值钱的多。年轻人喜欢宝马的驾驶感,有身份的人喜欢劳斯莱斯的庄重,他们之间是不可替代的。SAS上百种产品岂是一个R能比得了的?Nie就是做梦。做SPSS 40多年也没做出什么名堂,他自身的思路有问题,Revolution根本就救不了他。如果比较SAS和R,就是美国和中国。美国现在变化慢,经济增长慢;中国快。美国人感到了压力:美国真笨,看中国变化多块,多有钱。如果一项一项来比,中国80%不如美国,教育,军事,社保体系,文化,环境……。中国能威胁到美国什么?SAS的领导头脑很清晰,晚安同学就是SAS创新的推动力,SAS R&D的头可不是好当的,压力很大。社会上任何风吹草动,马上就有评论出来,也就一天到两天的反应时间。学院派的有很多特殊情况,他们用什么都是可以理解的,毕竟玩错了,再玩一遍就是了。
大家都以为SAS变化慢,或没有新东西。其实是客户不希望变化大,就像有的人说的,20年前的知识,也一样使用SAS。科学的东西有定势,不会有大的变化。另外,比起算法来,SAS更关注高速计算,系统的稳定等大的方面。新算法解决问题的能力如何还要看,什么也不是越全越好。很多评论者其实是学院派的背景较浓,希望SAS包括他们了解的新算法。作为商业客户,对此不是那么关注。SAS是两个人的公司。这两个人都是关注技术胜于任何方面的人。利润不是他们的关注点。公司300英亩的园区,各种设施齐全,就像一个小社会。这些都是那些上市公司无法比的。华尔街的大佬们(真正的老板)是不会让他们养那么多的服务人员的。SAS员工不存在没有动力,养老的思维,否则也不会站住行业的最前列。SAS接下来的战役就是对IBM,可以说是生死决战。