cloud_wei
对了,这次可以请一下杨老师啊,这个任务就交给你了。你上次参会没?
cloud_wei
大家敲定一下时间吧,当然要考虑到学生的考试安排时间;敲定之后,就紧锣密鼓的张罗安排吧。
G_will
要不来厦大?
让DMC组织?
yihui
刚上传了:
http://yihui.name/en/wp-content/uploads/2009/05/ISU.Stat500-Yihui-Xie.pdf
这个报告的背景是:我们Stat500课的老师是一个SAS老用户了,所以经常讲SAS是如何如何powerful,我对此深感不能认同,于是花了好几天时间,啥事都没干,专门准备了一场反击。
现在是21世纪,不是打孔机跑程序的时代了,我们不需要那种定制的不管有意义没意义一股脑全部输出的统计软件,我们不希望一个软件来定义一个学科(应该反过来才对),我们需要自由。
tangyh
只是个软件,喜欢用就用,不喜欢用也不必这么反对,做学术的有些风度嘛。解决同一个问题的统计方法那么多,也没见哪个大牛的统计学家无礼的痛恨其他做法,可以相互挑毛病,互相改进,一起进步,但是谢益辉带头的这种想法不敢苟同。什么反SAS, SAS党徒,听着很幼稚,争些没用的东西。就没有谁想想怎么结合两者所长做出更好的统计软件供后人使用。。。。。。
tangyh
SAS软件,不管SAS公司赚了多少钱,存在这么多年,为整个工业界,整个学术界,整个社会做出的贡献,是R所不能比拟的,这点大家应该没有异议吧。所以大家努力学习,充实自己,相互促进。
tangyh
预祝第二次R会议取得成功!
Ihavenothing
呵呵,如果你仔细看了那份讲稿的话你应该能发现里面讲的内容重在介绍和对比,最多是引用了一些大牛的话,何来攻击而言?况且报告的通篇我也没发现什么anti-SAS,什么SAS党徒之类的,互相陈述理由然后辩论是好事啊,单纯地说××不好才有问题。
当然了,谢师兄对于R确实有着特殊的感情,难免会带有一些主观的情感,但绝对没有到那种否定一切的地步,至少我从报告的内容来看都是很理性的。
tangyh
[s:13]
cloud_wei
“SAS党”这个词是我来调侃你们的,不要生气;其实SASor 某种程度上应该感谢R,R的出现使得SAS更觉得有必要加速自己产品的更新发展;
我没有反SAS,可能还会学学;至于统计大牛,那可真的好多是反SAS的,只不过你没有仔细查阅而已,开源软件爱好者对SAS的感情就更不用说了;
至于SAS创造了价值,这个承认(但是学术界它并没多大贡献),但是某种程度上是因为他垄断了行业,它攫取的庞大的利益也就是这个原因,我们不能因为它仅仅创造了价值就歌功颂德;中国移动从我们腰包里赚了多少钱,但是我没见过谁赞扬中国移动的;从经济学角度来分析,行业需要竞争,垄断不是好事,产生不了较高的性价比。
所谓R user反SAS,只不过是列出它的弊病,逐一批评而已,SASor们应该感激涕零才是;如果不是之前大家使劲批评SAS的绘图、结构语言、矩阵运算的话,SAS在这方面不会很快改进的;R user很多事开源软件爱好者,这个阵营是高尚无私、乐于奉献的阵营,他们开发的东西全人类都可以无偿、修改、传播。很多东西是统计学家们发明出方法、算法之后,各个商业公司拿过去写成软件开始卖钱;其实我们最应该感谢的使这些算法的创始者,而不是商业公司。很多人诟病商业软件,就是这个原因,目前来看他们在某种程度上阻碍了技术的发展。
最后,争议是必须的,所有的争议都是有意义的,矛盾是社会发展的动力;没有矛盾就没有发展,我们争议的不是“没用的东西”。做学术的不要什么所谓的风度不风度,尊重客观事实,敢于批评,敢于创造才是真正的风度。三缄其口、保留意见的做法不是学者的风度,而是商业公司的一贯做法。
cloud_wei
DMC这么快就开始活动了?去厦大也是个很不错的主意,不过希望能在经费上多多支持,外地学生的车费、住宿费问题得考虑一二,毕竟是穷学生嘛 [s:13]
cloud_wei
还有,如果谢兄来不了,可以远程来讲,最好再拉几个国外的牛牛 [s:13]
yanlinlin82
万一谢老大赶不回来,可以像第一届那样用视频给大家搞个网络开幕致辞,只不过这次是在视频另一边而已。 [s:11]
我原本还想学习谢老大,今年也贡献点不务正业的R代码,不过怕是接下去准备考研没多少空闲时间了。
Ihavenothing
如果你上的话绝对是亮点啊!
yihui
抱歉,我承认我言辞激烈,但这是有特殊原因的,我也不想被人看作一个极端分子。
大家都是站在统计的战线上,这一点我想各位都没有异议。我个人受自由软件思想毒害太深,因此采取了矫枉过正的方式,如果有人把SAS吹得神乎其神,那么我只好借其人之道了。
之所以“反”SAS,正是因为我认为它限制了统计的发展,它里面处处是打孔机时代程序的特点,更加让人不满的是,它给用户一种印象:我就是行业金标准,大家都要向我看齐。这不是我主观臆测,你在R-help里面经常见到这种人的身影:什么什么SAS里面有,R能否考虑加入。一个典型的例子就是Type III sum of squares(以及4种可估函数),你去搜一下Bill Venables的文章exegeses on linear models看看就知道了,这种没有意义的计算让多少人奉若神明,还有什么lsmean,本质就是简单的各组均值,却非要叫做least square mean,加上一个“最小二乘”就让人觉得均值的身影顿时伟岸了起来。还有字符图形(character-based graphics),你觉得现在哪种软件中还能找到用ASCII字符画统计图形的模块?而SAS卖这种劣质图形模块又有多少钱流进了腰包?还有glm模块,统计学家都知道GLM是广义线性模型,而SAS中是General liner model,就像Venables说的,不就是个普通线性模型么,它能有多general?
我的报告的背景是,老师本人偏好SAS,因为他是几十年的SAS用户了,这一点我没有意见,我感到不满的是,他总是强调SAS如何强大,而写R程序的时候会在注释中说,此处R会卡壳(如果你不用add-on package的话),我想说的是,那SAS用户可否只用一个模块去做所有的事情呢?明显是对R不公平。再者,SAS作为一个一两千兆的软件,和一个二三十兆的R,有可比性么?如果你想把R改写为SAS的输出,我觉得并非难事,但R core们坚持原则,以统计学的发展为指导,而不是盲目向SAS看齐。
仍然是我前面的话,作为统计人,我不希望某种软件来定义学科,这绝对是本末倒置。
自由软件真正给了用户自由,但如果你用SAS写了代码,其他用户需要使用的话,他们就得被迫(花大价钱!!)购买SAS,等这一批人成长起来,他们为了保住自己的地位不被边缘化,只能重复前人,垄断的雪球就是这样滚起来的。当用户连个t检验的源代码都没有查看的自由时,你觉得这是对一门学科的贡献么?或者开个玩笑,SAS每年拿着Gossett发明的t分布和Fisher的方差分析卖得那么贵,它有没有想过跟Gossett和Fisher说声谢谢啊——统计学家贡献了统计模型和方法,被人拿去藏在程序里年复一年卖,情理上是不是就有点说不过去呢。
最后一点偏见:统计程序需要开源,因为统计的发展太快太多样化了,我不确定SAS公司的程序员是否可以跟上学术界的发展,是否有能力读懂所有统计模型以及写出正确的代码(也许SAS公司有一帮万能的程序员吧)。在这一点上,我看到的是,SAS说它数据挖掘强,可是Trevor Hastie、Robert Tibshirani、Jerome Friedman用的是R;我不知道SAS有没有说过它图形强,我只知道(我所知道的)统计图形尚在人世的元老之一Michael Friendly是一位SAS老用户,但晚年仍然转向了R(如heplots等包,我估计他应该还在使用SAS吧)、Grammar of Graphics的作者Lee Wilkinson自己开了SYSTAT公司,但也出现在R阵营中(如scagnostics包);UCLA统计系的chair,Jan de Leeuw,是R用户(同时是Journal of Stat Software的主编,大家可能知道JSS基本就是R包的天下);Vanderbuilt大学生物统计系的chair,Frank Harrell,是坚定的R用户(作为23年的SAS用户最终放弃了SAS),每次骂SAS呼声最高的就是他;也许还有人知道范剑青(某年COPSS奖的获得者),R用户(如SIS包)……没错,SAS的势力是很强大,但为什么这帮人要用R呢?我想主要原因不是他们没钱所以用免费软件吧。
我要说抱歉的是,由于我学识浅薄,判断力不够,在部分评论上只能采取引用的方式。
无痕
学术上还是R的天下。老大你要体谅不是人人都那么熟悉统计理论和编程的。
我倒是觉得SAS这个公司也只是拿SAS software当作推销服务的工具。。。就没有定位在学术方面。
G_will
不能否认SAS是成功的商业软件。
商业用户为了程序的健壮和完善的服务而花大钱用SAS,在这方面R当然不能提供保证。
所以,作为学生,使用R是为了更好的为学习和完善理论思想。
而学SAS是为了更好的交流,或者更简单为了就业。
我不觉得这有什么矛盾。
就像我一贯支持并且尝试linux的应用。
但是不会排斥windows在日常的使用。
tangyh
对,我喜欢你这样的论述方法:
1.一个典型的例子就是Type III sum of squares(以及4种可估函数),你去搜一下Bill Venables的文章exegeses on linear models看看就知道了,这种没有意义的计算让多少人奉若神明,还有什么lsmean,本质就是简单的各组均值,却非要叫做least square mean,加上一个“最小二乘”就让人觉得均值的身影顿时伟岸了起来。
2.还有字符图形(character-based graphics),你觉得现在哪种软件中还能找到用ASCII字符画统计图形的模块?而SAS卖这种劣质图形模块又有多少钱流进了腰包?
3.还有glm模块,统计学家都知道GLM是广义线性模型,而SAS中是General liner model,就像Venables说的,不就是个普通线性模型么,它能有多general?
但是34页的ppt里面有6页是“So take a look at what they said”,和这里的“统计图形尚在人世的元老之一Michael Friendly是一位SAS老用户,但晚年仍然转向了R(如heplots等包,我估计他应该还在使用SAS吧)”这样的论述就不太合理了。
前者让人感觉作者的出发点是:恩,SAS这个软件做的不够好,这么多该死的错误。
后者让人感觉作者的出发点是:MD,SAS这个垃圾软件,太恶心了,实在是恶心,我就是不喜欢它。
当SAS公司老总看到前者时,会叫来工程师,你们赶紧瞧瞧,怎么这么多错误哪,你们整天都干了些啥事情啊?
另外,你再找几个工程师,R不是给咱泼墨水嘛,你也让他们给R点厉害。
当SAS公司老总看到后者时,可以用DELL 和 HP之间的口水战来描述一下。
DELL说:那个HP啊, 真的是垃圾,拉里·埃里森前几天就公开指责hp什么什么的,史蒂夫·乔布斯前几天回答《时代》采访时就号召大家不要使用HP。。。。。还有,彭明盛前几年一直在使用HP,现在都转向DELL了,全球最大的软件制造商微软现任CEO史蒂夫·鲍尔默也郑重放弃了HP,大力支持dell啊。
HP说,你个垃圾,老子做电脑的时候,你还没出生吧?
DELL说,你个老不死的,牙都掉没了,赶紧进棺材吧!
HP说,我靠,我们公司的员工比你们公司员工都年轻好不,你看看你们公司那群病秧子。。。。
DELL说,晕死,你们公司的才是病秧子。。。。
HP说,你们是。。。
DELL说,。。。。
我不是SAS公司的员工,SAS公司也不会因为我的争辩给我薪水。我只是想说,这么个软件,存在即有其合理的地方,当然它不可能是完美的,所以我们大家应该做的哪,是努力给它挑毛病,迫使它改变,以更好的服务社会。而不是口水战。
太云也跟我解释了,我能理解你对R的深厚感情,当然作为个人喜好,想说什么就说什么,还轮不到我这么个小屁孩来对你说三道四。所以那,我的一切言论,如果觉得不合理的话,完全可以跳过这个帖子,继续讨论第二次R会议。
另外,谢学长(如果我够格这样称呼的话),礼数很周全,我很惭愧。我说话用语什么的很尖锐,但本意不坏,还请谅解一下。
cloud_wei
我觉得你太注重语句的表达方式,太喜欢分析或者臆测里面的感情色彩。呵呵,我臆测一下,希望你待会儿不要过来K我 [s:13]
fan
我也理解SASor Tang对SAS的深厚感情。不过接下来我们还是言归正传吧,毕竟时间很紧了,会议的主题、时间、地点等要赶早敲定。 [s:13]