jylin

  • 2024年1月8日
  • 注册于 2024年1月8日
  • zhjx_19 我之前和益辉争论的出发点和你类似。但是益辉其实都回应了(散落在论坛),而且我觉得他的回应非常君子,就我网上和人争论这么多年,我没看过第二个。而且,你如果就事论事看比如他对 Quarto 的评价,我觉得也没什么问题:客观、中立、有信息。

    再说回 Tidyverse。其实我同意你,初学者大部分的需求用 Tidyverse 的确更快、更方便。但我的经验里,代价有两个:

    1. 如果要深入的话,尤其要往 programming 走,而不只是初级的 data analysis,会有长期的学习成本的问题。我印象中,这方面的知识的书更多是基于 base R 的,那么最终绕不过要学它,要适应两套系统。当然,很多人可能没这个需求。

    2. Tidyverse 的便利背后也是有代价的。就比如上面说的 non-standard evaluation,如果你要用变量名来指称变量,需要面对一系列的补丁,比如 {{}}!!。相比之下,在这点上,base R 就非常直接、易懂。而 Tidyverse 把背后的脏活包裹起来,代价就是绕。

    再退一步看,到底哪种体系更好,可能要放到更大的时间尺度上看,现在可能说不清。你没法说 Tidyverse 更流行了,就说未来就是它的。