yihui “真正”二字一出口就输了,统计在很多地方都是笑而不语的。非参的书都花大量篇幅讲如何选窗宽,我觉得那只是学者为了研究而研究而已。直方图本是一种描述性质的图形,把它放在密度估计的框架下有点抬举它了。具体用的时候你根据具体的问题自己试试不同的窗宽,看看不同的故事,完事。如果不同的窗宽能画出完全不同的形状,那表示这数据有点意思,你得思考为什么会这样。
liuyanyxy 前段时间用了很多 hist 和 density 函数。 如果数据量足够多的话,窗口越小,hist越逼近真实值。 数据不多的话, hist经常会有误导性……有时候窗宽不同,mode的位置和高度都会改变 关于density,数据是symmetric的话还可以用用。数据skew越大,density效果越差 总之,这两个函数给你的结果,要谨慎使用