Feng-no_spam
[未知用户] 好久不来,居然发现这里还有这么多评论,那么我就当一回粪青,指点指点那些迂腐的老东西们。说归说,大家该干嘛干嘛,该学SAS学SAS,有时候理想很丰满,现实也很骨感。
@胡江堂
第一句,你说的很对,是“现在的大公司”确实是那么做的,因为他们变聪明了,不想让SAS拴住腿,你回去学一下SAS的历史,顺带看看有多少老公司,政府统计数据还在SAS数据库里,你要是找不到,我帮你去SAS要去。
第二句,我说的不透明是”不可重复性“,你在Matlab里写一段程序,我可以用C,R,随便什么东西都可以重复实现,你用比如 Photoshop 的虑镜功能,那是Gaussian blur算法,你知道统计,我想给你张照片你能用R做出同样的效果来,只不过是时间和复杂程度而已。还有网银的加密算法是公开的,你即使有源代码也不会得到权限,因为你没有秘钥。简答的说就像工匠制锁,大家都会,大家都可以制造,但是一把钥匙开一把锁,这是为什么Linux的密码指明了就放在/etc/shadow里你也打不开。扯远了,回到SAS,我现在有这么段SAS代码,
PROC AUTOREG DATA = mydata;
MODEL Y = X2 Y_1 / LAGDEP = Y_1; *
RUN;QUIT;
他给我打出个 durbin-h statistic = 0.5 我翻遍SAS帮助文档也没有找到。你回去问问你们的头这是怎么算出来的?你别说我用同样数据用其他软件得到同样的结果,那么SAS就是正确的。这是Black-box testing。科学实验是需要 White-box testing。
@sasuser
“学好sas确实需要正常的逻辑思维” 我没有说不喜欢SAS的人都没有学好SAS.
“但是目前还没有替代者,差距不是一点点” 你想让开源世界的人们给SAS列一个“SAS can't do list”?搞笑。
@xin
你先把概念搞清楚,我们讨论的是SAS软件的利弊,我们不关注SAS是哪里的什么性质公司,既然我们付费了,那么我们指点指点又怎么了?你读过毛主席语录吧,不要就记得激昂文字,顺便回去学学毛主席是怎么教育下一代的。”CRAN里的PACKAGE有多少是中国人贡献的?“ GPL协议没有这个要求。顺便,PACKAGE应该用复数。
xin-comeandgo_2007
[未知用户] "总的来讲,SAS是一种很过时的软件,已经应该到被淘汰的地步了" 这个是你说的把, 这是评论软件的利弊吗? 软件公司的发展自有其规律,SAS做不好也自然会被淘汰, 再多的老公司也用他也是白搭。你大刺刺地说一个福布斯第一的公司明天就要被淘汰, 那还排在后面的GOOGLE是不是今天就要关门?
你那个什么durbin-h statistic, 我加上SAS, AUTOREG一 google就出来了啊, 第二条, http://support.sas.com/documentation/cdl/en/etsug/60372/HTML/default/etsug_autoreg_sect005.htm
你为什么不查查这个durbin-h statistic的原始文献然后用fortran,C 验证一下, 如果结果不一样像SAS举报BUG, 在论坛散播不就行了, 你要是有本事查出了错再抱怨你家不透明也可以啊。 谈到OPEN SOURCE, 有多少人用R之前是先把R SOURCE CODE检查一边的,那么多人贡献的所谓“PACKAGE", 写法逻辑奇形怪状(当然也有很多好的, 比如RMA和ANIMATION),又有谁有耐心和时间给他们差错? 还不是拿来就用, 信不信由你。我亲见的某些牛package也就牛了一段时间, 结果BASE R一升级他就彻底歇菜了,啥时候修好取决于人家啥时候从休假回来,如果是公司的核心系统依赖这些PACKAGES, 那后果会怎么样? 所以诸君大力强调的OPEN SOURCE, FREEDOM也要打个折扣了.......
邱怡轩
看大家争论了这么久,想必也累了,希望不要伤了和气。:)
我一直的看法是,争论不一定是坏事,其实上面这些SAS和R之间的你来我往跟当年老Pearson和Fisher的恩怨颇为相似,都是在权威与新秀之间产生碰撞。但是一场有意义的辩论不是说一方要压倒另一方,事实上这也不可能,就像老Pearson和Fisher并没有只留下一个。
我觉得前面xin说的一句话非常中肯,与其在口头上较个高下,不如静下心来搞点研究。对于useRs,可以多给CRAN贡献几个包,或分享一些自己关于R和SAS的经验(例如谢大哥的
这篇);对于SASers,我们也非常期待你们为我们带来SAS的实际应用案例,丰富大家的视野(例如胡大哥的这篇)。
我觉得既然我们都是统计之都中的布“道”者,那么所使用的“器”不同又有何妨呢?:)
xin-comeandgo_2007
应该不会伤和气把, 大家对事不对人, 呵呵。 最后再贡献一个牛人的blog,
http://statcompute.spaces.live.com
据我所知, 博主这样的牛人根本不会去参加什么R/SAS的辩论,也不会去列什么XX软件的cannot do list, 人家就是埋头写code, 不论是R, SAS 还是PYTHON.....
胡江堂
[未知用户] 呵呵,这位博主,eBay的Wensui Liu,在SAS论坛SAS-L可是活跃得很。
胡江堂
[未知用户] 关于SAS与数据存储。在早期,一些临床试验和农业数据会用SAS专有的数据格式存储。那阵子,关系数据库的概念和产品也都有了,跟SAS几乎在同一个时代,SAS也无意在存储方面与它们一较高低。说“很多大公司”或者“有多少老公司”的数据“都在SAS数据库里”,可能真要麻烦你提供更多的证据。或许,能看到大量的SAS数据格式的数据,但背后也会有各种存储介质,除了数据库和一些专有文件系统,还有文本、磁带等等。
况且,即使所有的原始数据都用SAS专有的数据格式,这也不能构成这个机构依赖SAS的理由。因为把SAS数据格式转化成其他数据格式或者导入数据库也是很方便的。
关于不透明,如果它是“不可重复”的意思。如果SAS计算出来的结果不能用其他工具复制出来,它早就垮了,用不着我们在这里讨论。我想,对SAS,我们这点基本的信心还是应该有的。
wensui
[未知用户] I can't agree with you.
Your view is from the old school and out-dated.
In the world of modern statistics, computing skill is playing more important role than ever.
Take a look at websites of J. Friedman @ stanford and B. Ripley @ oxford. They all are world-class statisticians and also have top-notch computing skills.
yihui
[未知用户] 说曹操曹操到——Wensui老大驾到:
http://cos.name/2010/04/think-sas-1/#comment-1453
和气嘛,别人我不清楚,应该没啥问题,江堂肯定是“线上打架,线下喝酒”,回头照样去他家“煮毛豆论英雄”
xulearn
[未知用户] Hi,
I agree with you up to a point that the computing skill is playing more important role than ever. Perhaps I didn’t make myself clear.
Actually, I am interested in Computational Statistics, especially MCMC. To understand this discipline better, theoretical knowledge of Markov Chain and Bayesian Statistics are needed. The essence of them is still Probability and Statistics. On the other hand, Statistics is combined with computer, Data Mining or Machine Learning seems popular. Maybe computer courses such as data structure and algorithms are worth learning for students major in statistics or mathematics.
In my option, campus is a precious place to learn these theories and social is a better place to learn software. Statistical Software and Program Languages are tools. We learn them quickly in job.
This is a good place to exchange points of view.
BTW, I visited your MSN Space before, and I got many learning.
Thanks.
胡江堂
[未知用户] SAS的社会需求,用SAS软件本身或许就能分析出来。中华英才网(chinaHR)就利用SAS Text Analytics套件来对它们的工作岗位和简历进行自动分类和匹配。同样可以利用SAS的文本挖掘技术对社会上已经发布的SAS相关的工作机会进行分析。
dapangmao
现在我国还没有SAS User Group吧?
亚洲这边,日本2000年成立,韩国2004年成立,新加坡2009年成立。我们也得要一个。
要不,大家组织一个SUG-C吧?明年在北京开一次年会看看。
有赞成的举手
crackman-epidatasas
其实SAS来说
热爱编程的人来讲 R更具有成就感
对于寻找工作来来说 SAS更有优势
tobeso
其实中国院校用R的可能应该是人大几个学校在用,我们学校根本就不提,当然可能是我们学校的统计学这个专业不怎么样,但是我们学校用SAS的人很多,很牛B,他们用SAS来编程解决遗传方面的问题,用SAS来做多元统计分析,他们只用SAS,在学校的时候,第一次听说R,是吴喜之的非参数统计里面讲的,说R很流行云云,什么世界上很多人用啊,什么的,当时看了这些也是被忽悠的心动了,也去学了下R,学了几天,就不了了之了,学的时候就觉得R很像MATLAB,因为matlab就可以编一个个的function再调用,其实SAS,R,SPSS等统计软件,不就是像练功人用的武器吗?有的人喜欢用剑,有的人喜欢用刀,有的人喜欢用鬼子刀,有的人喜欢用枪,但有的人很牛B不喜欢用武器,用手,有的人用武器还不如别人用叶子,武器在牛B又能怎么呢?还是要自己的武功高
皮皮米菲兔
[未知用户] 武功高是基础,不过有件趁手的兵器也挺重要的。工欲善其事,必先利其器,这个器包括很多,当然也包括工具啦~~~
Conan-natal
FDA真的只认SAS报告?不能吧,我虽然不是做medical statistics的,不过可以看看Stata网站上的说明 http://www.stata.com/whystata/accurate.html
soporaeternus
RDBMS在笑,SPSS在哭......
kimboo
问个外行的问题,请问SAS和R在处理大型数据(上G的),哪个更有优势?
lynne-lynne_ylee
I want to know you. Is there any other way to communicate except this? I am a undergraduate student and major in finance. But now still no idea about SAS. while it may not be suitable to say that because I have read few of your articles. I want to learn SAS. Is there any suggestion? If you say learn by myself, please recommand some books the is easy and useful for a beginner.
liuxin9023
只用两个语言Python+Matlab(计算机技术在精不再多),我坚信这两个语言是无所不能的。
libaobao2009
您好,想咨询一下SAS能与其他语言混合编程,并提取SAS的统计结果显示在系统界面上吗,非常感谢