erStern 我们大学学的是卫生统计,我自己对于数据处理的入门是靠大鹏的博客(晴耕雨读),看Hadley的书对于整个数据处理流程和思路大有裨益,对我当时应聘SAS程序员的工作也有帮助。从这个角度说,tidy的确起到了传道的作用,只不过本人不太喜欢一家独大,总要允许不同的声音存在啊。虽然我也非常喜欢 %>% 命令和ggplot2,但这几年断断续续用下来,还是认为base学好才能打下更深的基础,当然这也跟个人喜好和需求有关系,身边确实也是tidy用户更多,更多人认为跑出来结果就好,没必要追究更深层次的东西。学农的、生物的同学想必也有类似的想法,能用、好用、实用,更为关键。
同意老哥的看法,我学微生物的,用R肯定不如搞数学统计等相关专业熟练,但是处理测序数据还是经常要用到R进行数据清洗和可视化。之前摸索了很久的 base R 始终也没办法上手,一方面因为语法不统一,想实现的功能不知道从哪个帮助文档查。tidyverse统一语法很方便记忆,即使长时间不用,稍微回想一下也大概知道某个函数大概在哪个包里,很容易就翻到帮助文档。《R数据科学》这本书我个人认为写的也很棒,很有条理,而base R似乎没有类似的书籍,经常是讲着讲着就跑到统计上了。这大概也是想我一样的外行更青睐tidyverse的原因。说实话如果不是RStudio确实好用,真逼着我用base R从头分析到尾,我可能转去用Python了。
感觉对于交互式分析的使用者来说,tidyverse确实相对好用。而对于R包开发和维护者来说,可能 base R确实更易维护一点。
我之前在使用 Knitr 和 RMarkdown 时也有类似的感觉,功能有点碎片且一些功能相互重叠,不太好理清关系,文档有比较繁琐,分散在多个地方。Quarto感觉统一了不少,学起来容易很多。