zhjx_19 我承认我没忍住,还是逐一回复吧。
我是《R语言编程:基于tidyverse》的作者张敬信,我来唱点反调。
你这不像是唱反调,更像是在歪楼。又自己树靶子,然后叫人来一起打。
zhjx_19 我想,谢益辉如果牵头扛起Quarto的大旗,Posit欢迎还来不及,干嘛要解雇?
但凡你有看Quarto官方开发仓库,你就会发现它采用的技术栈和 @yihui 有不少出入,而且又新的架构师加入了,这又大又复杂的项目,不仅需要技术还需要调动大量资源的权力。为什么要在几乎不可能的基础上做这样的假设?
zhjx_19 你处处跟公司唱反调,那被解雇也是自己的选择而已。
「处处唱反调」是不是急不择言了,即使与 Quarto 理念有不同,也不能说明处处与公司唱反调吧。
zhjx_19 我其实很不理解,谢益辉、包括y叔,还有国外的一些base R顽固派,到底在顽固和抵制什么?
你是不是想把所有用 Base R 的人都当作了靶子,只要看到就想打。有的人愿意用 Base R,有的人愿意用 tidyverse ,我们都尊重好不好?尊重每个人的自主选择性。
zhjx_19 base R上生长出来的tidyverse,就不是R了?
这应该还是你自己树的靶子,我没看见本楼其他/她同志这么说。
zhjx_19 摸着良心说:如果没有tidyverse所引领的(国外)R各科学研究领域蓬勃发展,如今R会没落成什么样(国内的R地位可见一斑)?
摸着良心说,各科学研究领域蓬勃发展不是 tidyverse 所能引领的。科学研究领域不乏 tidyverse 的用户,其中不少只是用了 dplyr 和 ggplot2 包,还有很多是用 Base R 来作图、搞模拟和分析的。
我近距离接触过 R 会的组织者,与其说中国 R 会没落,不如说在顺应环境的变化。这种环境包括市场(AI 风头正劲)和资源(组委会人力、财力)。
zhjx_19 谢益辉开发和发展了R markdown为代表的文档沟通生态,这个生态也是一点点地扩大到很多方面。
我们回到 10 年前来看这个影响力不断变大的事。那时候,knitr 和 rmarkdown 都很年轻,rstudio 公司相当于刚开张,拢共才 7-8 条枪。公司却有 rstudio + rmarkdown + shiny 三条线,而且后来都成功了。可以说,投入很少,产出很高。因此,可以慢工出细活,一点点慢慢地积累。现在,我估计 Posit 研发人员 100+,要大转型,从小而美的烟囱式开发向系统级的解决方案转变,Quarto tidyverse tidymodels 都是这样,而且还要全面拥抱 Python 社区。人力成本很高,没有时间了,1-2 年内如果没有很好的产出,公司就面临转型失败的风险,更别说做大做强了,我觉得这是公司发展阶段和相应战略定位决定的。
zhjx_19 Hadley 开发和发展了tidyverse为代表的数据科学生态,获得统计学领域的最高奖项COPSS奖,以表彰他在统计应用领域做出的卓越贡献,是不是指的他在R语言上的贡献?他的那些包、那些书受到全世界的推崇和赞誉,唯独受到你们的抵制?就没想想是不是自己的想法有问题?
我看到本楼好些人 Base R 和 tidyverse 都有用。你是不是见不得有人继续使用 Base R? 只要有人使用 Base R,就视作一种抵制?
zhjx_19 你的生态扩大就是对的,别人的生态扩大就是垄断?都是对R的巨大贡献,为什么不能兼柔并蓄?
这句话是不是可以同样给你?
zhjx_19 担心RStudio和tidyverse软件臃肿庞大,能大过 Anaconda?
我想 yihui 不会去担心 RStudio 和 tidyverse 软件臃肿庞大,毕竟没啥参与,决策是这两团队的事。Anaconda 我不熟,但我知道这背后的公司同时提供 miniconda,就是你想装多少就装多少,臃肿不在于人家,而在于你的选择。
zhjx_19 作为对比,Python怎么就没有人天天提倡什么base Python,抵制numpy、pandas、sklearn ?人家都是热烈拥抱这些库(甚至作为Python的代名词) ,享受数据科学、机器学习所带来的红利。
Python 和 R 都是类似的,软件本身都只有一些标准库,都需要扩展包来提供独特的功能,R 也从来没有抵制过 tidyverse 呀?你可以都装上。至于说,没有赶上机器学习,特别是深度学习和人工智能的浪潮,我觉得是脚底板带三颗痣的那个人还没出现。RStudio 出品的 torch、keras 和 tensorflow 始终未能形成和 Python 社区并肩的影响力,首先受限于 R 语言社区本身的基数,其二,是效率不够高,借助 reticulate 总感觉不是 native (亲生的),其三,没有 pytorch、keras 和 tensorflow 那样的社区资源和影响力,因为配套的东西比较欠缺,不过, rstudio 最近两年已经开足马力做上下游了。还是那句话,完全不成比例的战斗,红利很难吃上了。
zhjx_19 他们有着高超的R技术和国内尊崇的R地位,也因此他们的观点影响了国内众多的R语言爱好者。他们曾经是国内R语言发展的推动者和先驱,但近些年来是国内R语言发展不折不扣的阻碍者。
谁什么时候在哪里怎么阻碍的?
zhjx_19 关于我,可能给很多人的印象是tidyverse推崇者,其实我是只推崇tidyverse吗?
不是!
我的R书第一章就是从 base R 讲起。
R机器学习包,我为什么不推崇与tidyverse一脉相承的tidymodels,而是推崇mlr3verse?
因为我从来都是因为真的好用而推崇。
tidyverse是专为数据框而生的,就跟 R markdown 是专为文档沟通而生的一样,接受它才能感受到它强大的魅力,而不是一味的抵制。
硬广,鉴定完毕。