- 已编辑
xuening 雪姨犀利!你说的一点也没有错,把密度曲线替换为简单的散点图或者箱线图基本上都能表达同样的信息。问题有二:
曲线加阴影填充更有艺术效果,用散点图或箱线图就感受不到“秋山万点盆门西”或者“神奈川冲浪里”的效果了。
如果是散点图,则需要考虑点的重叠问题(overplotting),拿电影时长来说,可能大多数电影都在2小时附近,这样会有很多点聚集在同一个坐标处,导致看不出来那里到底有多少部电影;解决办法可以是把点随机稍微扰动位置(jitter),或者换成蜂窝图(hexbin)。如果是箱线图,当箱子太多的时候,每个箱子只能被压得很扁,也许几乎会变成一条线,可能会看不清上下四分位数和中位数在哪里;而且箱线图的概括度太高,如果是双峰或多峰的分布,箱线图就表现不出来了,密度曲线则没有这个问题。
此处应该 @ 闫晗,但我不知道她是否有论坛账号。应该让她写文章的时候同时试一下散点图和箱线图,你去跟她讲一下,召唤她来批折子。
dawei_lang 拿图找数据的确是逆行,有些揪心。也就是传说中的拿锤子找钉子。