这篇文章把数据讲透了(五):数据可视化(下)
编辑导读:随着“数智化”时代的到来,我们生活中的方方面面都离不开数据,而你真的了解数据吗?本文作者将为大家重新解读数据的概念和价值,以及数据的价值是如何在“数智化”时代下一步一步得到运用与升华的,一起来看看~
一、前言
上几期文章中,我们已经了解到“数据”是一个庞大的体系(如下图所示),并用了菜市场的例子,为大家讲解数据来源的含义;用买菜的例子,为大家讲解数据采集的步骤;用洗菜、择菜的例子,为大家讲解数据清洗的方法…
而今天小陈主要给大家讲解,我们学会做菜以后,怎样把烹饪方法简单易懂的传授给他人,即数据可视化的过程。
二、可视化图表的选用原则(参考麦肯锡系列书目——《用图表说话》)
先上图表选取原则干货(见下图),下面我们再针对每个表格的使用进行逐一讲解!
图片来源——公众号【高端商务报告】
1. 成分类
(1)饼类
一般情况下,我们会选择饼图来呈现成分的对比关系。而饼图使用也存在下面这些“潜规则”
a.遵循阅读习惯,饼图成分重要性需要呈顺时针顺序
在阅读饼图时,人们都会下意识的从12点钟方向,顺时针读下去。所以,为了迎合人们的阅读习惯,我们需要将数据的占比大小、重要性按照顺时针方向切片展示。
b.切片数量不要超过7个,如果饼图类别很细,对于受众而言,对比起来是非常困难的。所以,当你发现切片数量将超过6个时,将其余不那么重要的分支整合归为“其他”项。
c.尽量避免使用立体饼图,除非你真的有信心避免视觉错觉。
如下图所示,从受众的角度看这张立体饼图,是不是很难分清楚两个占比最小的扇形究竟谁大谁小?而如果我们采用“俯视”的视角看这张饼图,就会好区分很多!
2. 项类对比
首先,我们需要明确项类对比的含义是什么,以及它指的对比维度是什么?一般来说,常见的维度对比无外乎数据大小、占比这两类。而就图表类型而言,项类对比最常用图表类型为条形图,下面我们来谈一谈条形图使用的原则。
(1)符合尝试的默认排序(从大到小、从高到低、从好到差),除非你需要遵循其他逻辑排序
一般来说,人们看条形图比较想要获取的是头部项类对比讯息,没有人会特别注意尾部项类的占比和对比。所以为了迎合人们的阅读习惯,我们需要按照从大到小、从高到低、从好到差的默认条形图排序实现绘制。
当然,遵循其他特定的逻辑排序也是可取的。例如,某公司对比业内竞争者市场占比时,特意按照进入市场的时间长短进行条形图排序。如下所示,是按照品牌逻辑对条形图进行展示。
(2)条形图间隔<条形图本身宽度
麦肯锡条形图的分类间距一般设置为本身宽度的20%-50%;而经济学人的分类间距则为50%-80%,保洁等大型公司的报表中也呈现10%-30%不等。如下所示,是经济学人一篇文章中的散点图和条形图。
虽然,间距不一,但不难发现,业内几乎没有分类间距>条形宽度本身的。
3. 时间序列、频率分布
时间序列,顾名思义,就是一条时间线下数据类别、变量的变化;而频率分布可能会稍微难懂一点,但我相信看到下面这个例子,你就不陌生了!
相信大家大学上《概率论》的时候,都看过这个函数!概率密度函数,没错,他就表示了频率分布!
时间序列、频率分布制图时,通常选取柱形图、折线图两类,而这两类值间应该怎样进行选取呢?
在麦肯锡的《用图表说话》一书中,建议以8个时间点为区分界限,当时间点>8时,采用折线图,减少视觉对比疲劳,当时间点<8时,选取柱形图。以下是柱状图、折线图两种图表的使用规则。
其次,柱状图和折线图的选择还和数据特征有关,当你想凸显特定时间段内产量、销量等数据指标的时间序列变化,用柱状图比较合适,因为它还能够凸显程度、数量;而折线图则更注重变化、变化趋势,在表现数据发展趋势和时间序列预测分析中较为常用。
(1)柱形图
a.柱形图间隔<柱形图本身宽度
这一点其实和条形图类似,此处就不做赘述了
b.堆积柱状图使用有度,避免对比混乱
堆积柱状图适用于对比多个项目、类别的成分关系,是表达成分对比关系的重要方式。
但需要特别注意,百分比堆积图尽量不要对比每个类项超出3个细分成分,否则会带来对比混乱。如下所示,堆积柱状图的类项已然超过3个,对比起来就会很混乱。
(2)折线图
a.趋势线要突出(颜色、粗细等)
折线图是以上图表中,最能够直观展示上升、下降、波动、维持原状趋势的图表,它侧重于勾勒变化和变化趋势,用于表达数据的发展趋势。
但,趋势线作为折线图中的主体,一定要突出。而这个突出,可以是颜色上的突出,使用红色等重点色;也可以是粗细上的突出,比如,我们一定要注意到折线图趋势线比网格线、刻度线粗!
4. 相关性
相关性分析中,我们常使用散点图直观地显示变量间的相关强度、相关方向,并用于探索性数据分析,做出拟合曲线和回归方程,对未来趋势进行探索性预测。
(1)散点、气泡图
a.散点、气泡大小需要直观
人都是视觉动物,而图表需要做到就是把人的视觉利用到极致!散点图、气泡图中,每一个散点、气泡就代表着一个样本个体,而散点、气泡的大小就能只管的展示出该样本的大小。所以,我们在制作图表时,需要充分利用这一点,用散点、气泡大小直观的展示样本间的关系。
三、结语
以上,就是本期可视化图表选取原则的全部内容!我们【这篇文章把数据讲透了】系列到这里也就完结了!撒花!!
接下来,你想看哪方面的文章呢?