[未知用户] 感谢您如此深刻的见解。
我倒是没有怎么跟踪过,就是自己瞎整一下,惭愧。有个
corrgram(作者就是Michael Friendly),也是关于相关阵的可视化的,在MATLAB、R、SPLUS、SAS上实现了的,不过都没有多少新奇之处。
correlation map就是个颜色图加上个聚类,颜色图在高维方面是最好用的,椭圆图、前面提到的corrgram、我的圆圈图其实在较高维(比如大于40*40)时几乎没有什么表现力了,因为此时椭圆(或圆)太多了,这些本想给人带来信息的东西(椭圆的形状、圆的面积)在高维时不仅自己表现不好(因为圈太多不利于肉眼观察),反而影响到了颜色的表现力。
其实可以这么说,表现相关阵的颜色、形状两个元素不是独立的,它们会有交互影响,应该在具体情况下采用什么色彩、几何架构是一门很深的学问,这个要涉及到数据本身的特点、色彩学,还和人的感官息息相关,而人的感官又是有差异的。我觉得这个应该是可视化看重的一个问题。所谓可视化就是把大量的信息用我们肉眼能迅速获取的方式展现出来,而什么东西最容易被我们的肉眼所接受。其中一个无法逃避的问题就是基础作图元素的选择,最起码的有:颜色、几何形状等,它们又应该如何搭配。
在中维数据(比如10~40左右)中,椭圆图、圆圈图还是有一定的市场。因为图就是想给人们最充分的信息,而颜色图仅仅利用了颜色,椭圆图、圆圈图还利用了形状或面积,此时维数不高,这些形状、面积本身可以带给人们不少信息,又不足以对色彩造成很大的冲击。还有,我觉得相关阵的可视化的目的不总是看variables之间的关系,同时在中维时,圆圈图的表现力也不错。此外,咨询一下大家:大家都想从相关阵中得到什么?不一定总是想聚类吧?
不过第二个图在item response models上的应用已经开始popular。他们用这个图来同时展示很多个假设检验
可否提供一下相关资料,我还没有注意到,如果有案可稽就好了。我觉得只要椭圆图能做的,圆圈图就一定能做好,并且圆圈图天生突出相关系数较大元素。这个版上的圆圈图不太好看,我又整了些变种,可以看看
MyPicasa。