dapengde 专管管道那个包的名称……我放弃治疗了

我也是放弃治疗了,不知多少次我要先找 dplyr 然后找那个包,为啥不直接叫 pipe 我绝对 1 秒钟记住它

这些大神都有个习惯,取一个颇有深意的名字,在我看来最接近内容的是好名字

yihui

隔一年把某大包作者来出来炮击一次啊

    dapengde summarisetapply 的一大不同是它们处理的数据形式不同,summarise 要求数据符合 tidy 风。我觉得 Hadley 提倡的 tidy data 是极乐净土的灵魂:不管是数据整理,还是哥哥作图,如果觉得操作不顺手了,往往是由于数据不够“整然”造成的。Tidy data 的要求使得极乐净土处理的数据基本单元是数据表,而 R base 处理的基本单元是向量,这导致了两者在数据分析过程中的一些逻辑差异。这差异当你用 summarise 处理 iris 数据时就能体会到。

    我觉得极乐净土和 Base R 在具体操作的不同只是形而下的器的差异,但是对数据形式要求的不同则属于形而上的道的殊途了。进化领域有句话叫做:

    Nothing in Biology Makes Sense Except in the Light of Evolution.

    在极乐净土世界似乎也可以说:

    Nothing in Tidyverse Makes Sense Except in the Form of Data that is Tidy.

      dapengde 楼早歪了,我们又雪上加霜了而已。那就此先打住。

      17 天 后

      社区大佬 Norm Matloff 开始喊话 Tidyverse 了

      Language unity

      Horrible loss for R.

      Python is currently undergoing a transition from version 2.7 to 3.x.
      This will cause some disruption, but nothing too elaborate.

      By contrast, R is rapidly devolving into two mutually unintelligible
      dialects, ordinary R and the Tidyverse. Sadly, this is a conscious
      effort by a commercial entity that has come to dominate the R world,
      RStudio. I know and admire the people at RStudio, but a commercial
      entity should not have such undue influence on an open-source project.

      It might be more acceptable if the Tidyverse were superior to ordinary
      R, but in my opinion it is not. It makes things more difficult for
      beginners. E.g. the Tidyverse has so many functions, some complex, that
      must be learned to do what are very simple operations in base R. Pipes,
      apparently meant to help beginners learn R, actually make it more
      difficult, I believe. And the Tidyverse is of questionable value for
      advanced users.

      摘自 <https://github.com/matloff/R-vs.-Python-for-Data-Science>

        Cloud2016 这篇喊话实在不值得一看,尤其是对极乐净土的评价,敌意满满,但太空泛了;不像我们这个帖子,谈的都是具体的东西。我看了一遍,建议大家不要浪费这个时间,既不会有知识增量,还有钓鱼之嫌(语言大战通常都有钓鱼的嫌疑)。

          yihui 确实不及我们这个讨论帖。

          dapengde 我最近浏览了下,发现 magrittr 是一个复杂的法语发音,反正我不懂法语,就照字面汉化一下,叫玛格丽特或者玛格里特,这样你至少会记住前三个字母 mag 然后根据自动补全的提示补全拼写,这种方式对我的效果还不错

            Cloud2016 嗯嗯,如果动用自动补全功能的话,再古怪的包名也是没问题的,只不过是交流时困难,比如在手机上回答别人提的问题。

            Cloud2016 magrittr 好像是得名于画家 René Magritte,他在一幅下题了一句 "This is not a pipe(烟斗)",但是他画的实际上就是一个烟斗(pipe)。之前我一直随大流把 pipe 翻译为“管道”,现在看来叫“烟斗”似乎更合适:pipe 将烟%>% 到嘴里。

            《茶花女》的女主名字叫玛格丽特(Marguerite),这是我最喜欢的一部法国小说,我之前觉得这个包似乎和《茶花女》有关,所以比较容易就记住了这个包名。不过现在才知道这是个先入为主的误解。

            不过烟斗也是一种管道,这样看来之前也没有翻译错。

              Liechi
              管子是本意,烟斗是因为构造也是个管子,其实直译还是“吸烟的管子“吧…

              Liechi 我好像在是某个 R 包的六角边 Logo 里见过这个烟斗图,不记得具体在哪见过。总之,还是你这个解释好,我权当这就是 magrittr 背后的故事,赞赞 👍

                Liechi 我不懂法语,直到今天你解释了我才知道那个烟斗下面的一句话是什么意思……这幅画的作者有点恶作剧啊。

                  Cloud2016 有个疑似旁证:在玛格丽特包的网站上有这么一句 “Or even shortr: make your code smokin’ (puff puff)!” 之前没有留心这句话,看了那幅画后才意识到可能有所指。

                  yihui 我也不懂法语,我是在谷歌上溜狗的时候看到的。

                  这句话让我想起加勒比海盗上关于钥匙的台词。看完维基百科上对这句话的解释,似乎作者要表达的也就是这个意思:)

                  一开始也是习惯了tidyverse系列包,但是在使用data.table之后,只剩下ggplot2

                  6 个月 后

                  Liechi 最近我注意到一个现象,就是 reshape, reahspe2, plyr 包 和 tidyr 包里的 gather()spread() 仍然有人使用和学习,并且给出的理由我无法反驳,就是它们很稳定(作者不会动它们了,只是维护可用)

                  GGally 包在使用 reshape 和 plyr
                  ggplot2 在使用 reshape2 最近似乎要把它移除出去了 <https://github.com/tidyverse/ggplot2/pull/3639>

                  2 个月 后