Liechi yihui 对圆环套圆环那种多层套娃来说,管道确实方便阅读,层数越多越有利。然而据我观察,用户养成习惯之后,即便是两三层,管道顺手就来了,挡不住。这个小东西表面似乎是技术层面的改动,然而底层碰的是哲学层面,或者说是思维方式。俗称洗脑。
Cloud2016 tctcab 像 ggplot2 这样的包名还算是好的,dplyr 已经到我记忆的极限了,“噗啊啊啊”包完全靠拼音才记得住,而专管管道那个包的名称……我放弃治疗了。@yihui 不要嫌弃,如果换我,我也加载 'tidyverse',而不是 'mag...'——臣妾实在记不住啊!
包名和函数名是我转用 tidyverse 的最大障碍,纯属人为制造,完全没必要。str_c()
如果叫str_paste()
,select()
如果叫 df_subset()
,那么对 base R用户就会友好很多。而像summarise()
,猛一看还以为是 summary()
,其实它是tapply()
,这就让人很割裂,似乎跟 base R 有不共戴天之仇,拼命任性地划清界限,而不计对 base R 用户习惯的忽视。换位思考一下,如果 R 初学者先接触了 tidyverse,那么让他从 summarise()
往 tapply()
过渡肯定也是内心一百个不情愿。正如我在前两天的吐槽帖 里所说:
生活在秦国的人,不需要知道周天子。
至于 tidyverse 函数输入和输出的一致性,它确实是一个卖点,然而我觉得并不是很大的痛点,有人为炒作的水分。“输入数据框,输出也必须是数据框”,这个前提是 tidyverse 很多函数存在的合理性之一,然而推敲一下,这个前提的基础并不那么坚实——它把“一致性”偷偷限定在了“数据框”层面。这样,管道出口入口处倒是一致了,可是得先把数据转成 tidyverse 接受的形式才能进管道,而管道里出来的不一定是你要的最后结果,还得进一步转换。可是别忘了,base R 的一致性也很好啊,只不过是体现在维度更低、结构更简单的“向量”层面。如果说 tidyverse 是对数据进行分子层面的改造,那么 base R 就是进行原子层面的改造。
作为一个普通用户,我上述看法可能都是片面甚至是错误的。不过,就像秦灭周一样, tidyverse 的野心若隐若现。未来,tidyverse 会不会跟 base R 分道扬镳,就像 openoffice 和 libreoffice 呢?
如果是这样,那就干脆把 base R 跟 tidyverse 当作两门不同的编程语言来学习和使用吧。