蜿蜒崎岖的ggjoy图
我觉得这个图很炫, 但找个足够有意思的数据就有点难了....
要有横纵坐标的差异, 再比较分布才有意义...(拿着图找数据有点揪心)
我给出作者的github主页 https://github.com/clauswilke/ggjoy
- 已编辑
xuening 雪姨犀利!你说的一点也没有错,把密度曲线替换为简单的散点图或者箱线图基本上都能表达同样的信息。问题有二:
曲线加阴影填充更有艺术效果,用散点图或箱线图就感受不到“秋山万点盆门西”或者“神奈川冲浪里”的效果了。
如果是散点图,则需要考虑点的重叠问题(overplotting),拿电影时长来说,可能大多数电影都在2小时附近,这样会有很多点聚集在同一个坐标处,导致看不出来那里到底有多少部电影;解决办法可以是把点随机稍微扰动位置(jitter),或者换成蜂窝图(hexbin)。如果是箱线图,当箱子太多的时候,每个箱子只能被压得很扁,也许几乎会变成一条线,可能会看不清上下四分位数和中位数在哪里;而且箱线图的概括度太高,如果是双峰或多峰的分布,箱线图就表现不出来了,密度曲线则没有这个问题。
此处应该 @ 闫晗,但我不知道她是否有论坛账号。应该让她写文章的时候同时试一下散点图和箱线图,你去跟她讲一下,召唤她来批折子。
dawei_lang 拿图找数据的确是逆行,有些揪心。也就是传说中的拿锤子找钉子。
- 已编辑
高涛师兄放的图怎么实现的坐标轴label 在中间?
我发现包里的example例子(如下)坐标轴名称都跑到最边上了,困扰,应该咋把他们居中呢?求助。。
yihui 关于怎么减弱overplotting,多元时间序列里面的horizon plot (http://timelyportfolio.blogspot.com/2012/06/horizon-plot-already-available.html) 的想法是设置透明度,把山峰的头分级消掉,然后放在山体的肚子里。。。但貌似对直方图这么做就失去其直观性了。
我又找到一个类似的,https://www.reddit.com/r/dataisbeautiful/comments/6m0wo7/peak_time_for_sports_and_leisure_oc/,我最近可能也需要画一个类似的图
dawei_lang 我手头就有现成的业务,比如看不同销售人员的成长曲线。
- 已编辑
请问这种图是怎么做到的啊,有范,
- 已编辑
gaotao 谢谢,我还有很长的路要走,,今天还看到一个非常帅气的图是Hadley Wickham的照片使用ggplot2输出的一张图,好想亲自做一张自己的头像。
基础绘图函数仿一个,展示的是每年生物量的逐月变化规律。