Think SAS(一)
以前只学R,昨天刚刚装上sas,想了解一下,楼主说的是挺有道理,尤其是强调不是讨论而这之争,只分析实际,两者都有两者的优势,就目前情况来说感觉sas还是没法取代的
支持一下!所谓兼听则明,COS不能只有一种声音。计算机语言这类事物,最佳的状态就是在互相的竞争中不断发展,最终有利于用户本身。期待后续的文章。:)
做一些方法已经很成熟的统计分析,尤其是biostatistics方面,SAS确实比较方便。比如我做重复测量的方差分析,就直接用 SAS proc mixed 完成,比R方便。但是,SAS的作用也就仅限于做这种早已经存放于博物馆中的统计方法。
萝卜和白菜
谢老大的影响力太大了……
我认为R并没有抢走SAS很多的高校用户,事实上,大多数统计专业的学生都开SAS这门课,但几乎没高校开R,学R的大都是自己折腾的。
据我观察,国内高校学生(至少在能代表统计学一般水平的CSU),无论对R还是SAS都相当冷漠。即便是R和SAS之间发生的各种我们以为很激烈、有趣的、有意义争论,绝大多数人并不关注——关注、学习、使用SAS、R的目前都还只是小圈子。它们之间应该不存在此消彼长的关系。
很喜欢这样活泼生动的文章,期待续文:)
据我观察,国内高校学生(至少在能代表统计学一般水平的CSU),无论对R还是SAS都相当冷漠。即便是R和SAS之间发生的各种我们以为很激烈、有趣的、有意义争论,绝大多数人并不关注——关注、学习、使用SAS、R的目前都还只是小圈子。它们之间应该不存在此消彼长的关系。
很喜欢这样活泼生动的文章,期待续文:)
SAS的职业搜索数据中掺杂了一些硬件工作,因为SAS还有另一种含义:Serial attached SCSI。我看第一页搜索结果中至少就有三条跟后者相关的工作。
就免费与年年收费而言,我个人有个韩复渠式的想法:东家拿买SAS的钱发给大家吃火锅,岂不更好?
话说FDA的保守吧,有其道理,但这个问题在逻辑上是有冲突的。如果真的要保守,一方面,FDA的官员应该要求SAS开源才对,或者派人去SAS一行行检查源代码,确保软件没有Bug;另一方面,就统计方法而言,FDA不仅该禁用贝叶斯,而且大部分频率学派方法都要禁了,诸如假设检验方差分析,有哪个FDA官员能从实际中找出一例独立同分布(正态)的数据来?所以他们的保守也是有一个尺度的,那我们就要问了,为什么你们恰好保守到33%,我就不能到35%呢?新方法并不代表着危险,老方法也不一定安全,所以我常说这两个软件之争的背后,统计是更本质的问题。学界的象牙塔,和工业界的保守,在外人看来,都有其可笑之处。(注:保守行事可以看作是一种贝叶斯方法,即给历史经验一个大的先验)
据我所知,R的一些开发者如Douglas Bates,也是很关心他们的结果与SAS结果的比较的(如混合效应模型lme4),SAS是一种标准,但不是金标准。关于这一点,R界有大量的论述(如 https://stat.ethz.ch/pipermail/r-help/2006-May/094765.html )。
对我个人而言,我要做的工作都能用免费的工具有效地完成,这一点就够了。我并不关心程序语言的流行程度,也不关心FDA要求大家用什么方法(我不一定在医药行业工作),我只关心能抓老鼠的猫,至于找工作嘛,各人也有各人的喜好,有人喜欢
不过我可不希望有人会因为“谢益辉在用R”而用R……将来没饭吃可不要找我……
就免费与年年收费而言,我个人有个韩复渠式的想法:东家拿买SAS的钱发给大家吃火锅,岂不更好?
话说FDA的保守吧,有其道理,但这个问题在逻辑上是有冲突的。如果真的要保守,一方面,FDA的官员应该要求SAS开源才对,或者派人去SAS一行行检查源代码,确保软件没有Bug;另一方面,就统计方法而言,FDA不仅该禁用贝叶斯,而且大部分频率学派方法都要禁了,诸如假设检验方差分析,有哪个FDA官员能从实际中找出一例独立同分布(正态)的数据来?所以他们的保守也是有一个尺度的,那我们就要问了,为什么你们恰好保守到33%,我就不能到35%呢?新方法并不代表着危险,老方法也不一定安全,所以我常说这两个软件之争的背后,统计是更本质的问题。学界的象牙塔,和工业界的保守,在外人看来,都有其可笑之处。(注:保守行事可以看作是一种贝叶斯方法,即给历史经验一个大的先验)
据我所知,R的一些开发者如Douglas Bates,也是很关心他们的结果与SAS结果的比较的(如混合效应模型lme4),SAS是一种标准,但不是金标准。关于这一点,R界有大量的论述(如 https://stat.ethz.ch/pipermail/r-help/2006-May/094765.html )。
对我个人而言,我要做的工作都能用免费的工具有效地完成,这一点就够了。我并不关心程序语言的流行程度,也不关心FDA要求大家用什么方法(我不一定在医药行业工作),我只关心能抓老鼠的猫,至于找工作嘛,各人也有各人的喜好,有人喜欢
for (day in year) {print("报表")}
的工作,有人喜欢plot(x,y); lines(lowess(x,y)); fit = lm(y~x); plot(fit); update(fit, .~.+I(x^2)); ...
不过我可不希望有人会因为“谢益辉在用R”而用R……将来没饭吃可不要找我……
不过掌握SAS比掌握R更容易找到工作,(至少现阶段在国内)那是真的。所以我也重新开始学习SAS,争取赶快找到个糊口的饭碗。
精彩!期待续集 :)
我就属于那种建议大家都好好学的类型。
我问过SAS总部那边开发的家伙们了,api是绝对不会开放的,晚安老头儿也是这个意思。所以局限性比较大。而且有些的东西现在有些混乱。
但是sas/iml 现在支持R(有条件的),也算是一个进步,但是还是不够用的。
而R虽然包多,但是bug也不少,而且模型导出使用是个问题。
matlab那个东西我看着还是别扭。
现在我倒是看好statistica 9.1 x64
但是sas/iml 现在支持R(有条件的),也算是一个进步,但是还是不够用的。
而R虽然包多,但是bug也不少,而且模型导出使用是个问题。
matlab那个东西我看着还是别扭。
现在我倒是看好statistica 9.1 x64
SAS什么都好,就是太贵,当然它有贵的理由。
我现在想学下Fortran,好多强大的科学计算代码都是用它编的。
我现在想学下Fortran,好多强大的科学计算代码都是用它编的。
在校的学生,想工作学SAS,想读博学R,任何一个学入门就可以了。至于SPSS和Excel相对简单,工作中学就可以。想学精还得本科或硕士毕业后若干年。
数理统计理论知识才是王道,程序员永远是可以替代的,国外公司来中国开厂就是看中国内廉价的硕士统计程序员。在校的学生有时间还是全面看看统计知识吧,这个才是工作几年后的核心竞争力。SAS或者R入门就可以了,但想入门也不容易啊,各种软件诱惑太多,缺乏坚持学习一种软件的决心。
工作用什么软件学什么,学得才快。我建议学SAS,读博还是少数。
In a word, do not waste all your time learning SAS or R in the campus.
数理统计理论知识才是王道,程序员永远是可以替代的,国外公司来中国开厂就是看中国内廉价的硕士统计程序员。在校的学生有时间还是全面看看统计知识吧,这个才是工作几年后的核心竞争力。SAS或者R入门就可以了,但想入门也不容易啊,各种软件诱惑太多,缺乏坚持学习一种软件的决心。
工作用什么软件学什么,学得才快。我建议学SAS,读博还是少数。
In a word, do not waste all your time learning SAS or R in the campus.
现在进药厂啥的还是得靠sas,要考个sas证,但是有的来招聘的公司也开始鼓励r了,原因只有一条,那就是免费。
其实,走出学校,基本上没有什么单位主要用R来做统计分析。但是许多单位不允许用R。在学校里为什么许多学生自动选择用R的原因1.免费2.容易入门3.导师在用。走出学校,许多人都很快忘记R,因为R没有应用的市场。另外,在学校里所学的,除了某些牛人(们),一般人无论R还是SAS,技能都不足以应付日常的工作。所以往往是工作中所需要的所使用的软件,才算是你真正得心应手的工具。所以说实话,对于一般的学生来讲,不算真正懂R。只是个入门而已。
[未知用户] 我想知道什么单位不允许用R呢?(FDA要求的除外,世上的数据分析工作中,医药只是一块而已)
再三重复小马过河啊小马过河,所有人的意见都只能是偏见……
我曾经给某重量级政府部门(不便透露名称)做过R的程序,人家一样用得好好的,也没说R咋的了,相反,人家倒是对R很感兴趣。还有,如果你觉得我太书生气、接触实践不够的话,也可以问问实战派的刘大版主的经验( http://www.bjt.name/ )。这问题从某种程度上来说只是软件诞生的先后次序而已,SAS出世早,赢得了一批老统计学家和FDA,从而有了发展的根基,并不意味着它不可取代或不会被取代。
“1.免费2.容易入门3.导师在用”这个排序应该加上“0.功能灵活强大”,“2”也不太合适,我觉得R相对来说并不太容易入门。
“R没有应用的市场”这个论断几乎等价于“统计没有应用的市场”。如果你有论据,小的愿洗耳恭听。
新生事物遭受一些挫折是正常的,没有人愿意看见自己熟悉的饭碗被别人抢掉,但从大局来看,这种“竞争”只是表象,人人都觉得自己明白在争什么,但其实很多人都栽在自己的使用习惯上了。抛开用户习惯或假设所有工具都不存在,再给你一批数据,你如何分析?
再三重复小马过河啊小马过河,所有人的意见都只能是偏见……
我曾经给某重量级政府部门(不便透露名称)做过R的程序,人家一样用得好好的,也没说R咋的了,相反,人家倒是对R很感兴趣。还有,如果你觉得我太书生气、接触实践不够的话,也可以问问实战派的刘大版主的经验( http://www.bjt.name/ )。这问题从某种程度上来说只是软件诞生的先后次序而已,SAS出世早,赢得了一批老统计学家和FDA,从而有了发展的根基,并不意味着它不可取代或不会被取代。
“1.免费2.容易入门3.导师在用”这个排序应该加上“0.功能灵活强大”,“2”也不太合适,我觉得R相对来说并不太容易入门。
“R没有应用的市场”这个论断几乎等价于“统计没有应用的市场”。如果你有论据,小的愿洗耳恭听。
新生事物遭受一些挫折是正常的,没有人愿意看见自己熟悉的饭碗被别人抢掉,但从大局来看,这种“竞争”只是表象,人人都觉得自己明白在争什么,但其实很多人都栽在自己的使用习惯上了。抛开用户习惯或假设所有工具都不存在,再给你一批数据,你如何分析?
从来没听说不准用r的噢。上次air force的人过来讲座,我看他那些图全都是r画的。军队的人都没说不准用。。
我觉得对国内初学者来说最大的麻烦是:
第一,这文件很大,下起来要很长时间
第二,无法完全破解(实话实说,中国特色的问题,毕竟你要小孩掏个多少刀买这个是不可能的)
第三最主要的还是市场的需求,我找工作时还留心了下,要求会sas的没要求会spss的多,国内尤其是官方还没严谨到像FDA那样非sas报告不认的地步,sas的推广需要外部因素的,毕竟其他几个大商用软件正常应付是够了
最后,sas是个好软件,但要专业,要扎实,要长时间刻骨学习,类似气宗和剑宗的差别。
第一,这文件很大,下起来要很长时间
第二,无法完全破解(实话实说,中国特色的问题,毕竟你要小孩掏个多少刀买这个是不可能的)
第三最主要的还是市场的需求,我找工作时还留心了下,要求会sas的没要求会spss的多,国内尤其是官方还没严谨到像FDA那样非sas报告不认的地步,sas的推广需要外部因素的,毕竟其他几个大商用软件正常应付是够了
最后,sas是个好软件,但要专业,要扎实,要长时间刻骨学习,类似气宗和剑宗的差别。
[未知用户] biostatistics方面有应用面虽窄但很方便应用软件的,一般都和基因芯片,数据库之类一并开发了,sas真不见得有优势