《数据可视化基础》:多面板图形需要注意的问题

  当我们的数据集包含很多种元素的时候,如果把这些信息都可视化到一张图上就会显示十分的凌乱。因此,为了更好的可视化这个庞大的数据集,我们可以创建一个分面的图形。这个图形包含多个面板,每一个图形面板上显示了数据的某一个子集。这类多面板图形的有两种不同的分类。

  统一的多面板图形(small multiples)是在一个规则的网格当中排列了多个图形。每一个图形显示了数据的不同的子集,但是所有的图形可视化的内容是一样的(例如X,Y轴代表的变量是一样的)。

  多面板图形的关键思想是根据某一个数据集当中的一个或者多个变量将数据进行分割。然后分别可视化每个亚数据集。最后把可视化的图形放到一个网格当中。

  这种可视化为泰坦尼克号乘客的命运提供了一种直观和高度可解释的可视化。我们清楚地看到,大多数男人死了,大多数女人活了下来。此外,在死亡的女性中,几乎所有人都乘坐了三等舱。

  然而,这样的调整容易产人误导。因为人们对于不同亚图的解读的时候。经常默认的是Y轴的单位是一样的。当然如果真的想要使用不同的坐标轴范围的话,最好在图片的标题当中让读者注意到这个问题。例如:添加一句:“注意:这个图的每个面板的Y周缩放不同”的话。

  最后需要注意的是,在排列各个面板小图的时候,按照一定的逻辑来进行排列是很重要的。这个对于读者对于图片的解读至关重要。

  请注意,与多面板图形示例不同的是,复合图形的各个面板是按字母顺序标记的。传统上用小写或大写的拉丁字母。因此可以使用标签来唯一地指定一个特定的面板。例如,当想谈论图21.5中显示授予学位比例变化的部分时,我可以参考图(b)。

  同时,需要注意,拼图当中的标签最好还是匹配图片的设计。如果不匹配的话,就显得十分的违和。例如????这个图。

  我们还需要各个图形的“视觉语言”最好统一。所谓视觉语言指的是我们用来显示数据的颜色、符号、字体等等。简而言之,保持语言的一致性意味着,相同的东西看起来是相同的,或者至少在实质上是相似的。

  上面的图就没有使用相同的可视化语言。首先a当中男女运动员使用了相同的蓝色,b当中的男性使用了相同的蓝色,同时c当中女性使用了相同的蓝色。此外,(b)和(c)引入了额外的颜色,但这些颜色在两个图之间是不同的。因此,如果男性和女性运动员一致使用相同的两种颜色,并将相同的配色方案应用到a中,情况会更好。第二,在(a)和(b)组中,女性在左边,男性在右边,但在(c)组中顺序颠倒了。因此(c)中的箱线图的顺序应该转换一下,以便它匹配(a)和(b)。

  下面的图修复了所有这些问题。在这个图中,女性运动员一直用橙色表示,男性运动员的左边用蓝色表示。同时由于使用了相同的颜色标注。所以这三个图就可以使用一个图例来说明颜色的含义即可。

  最后,我们需要注意拼图当中各个小图的对齐方式。各个小图的轴和其他图形元素都应该彼此对齐。下面的图相较于上面的图而言就对齐的就不是很好的。

关键词:数据可视化

相关推荐