未来已来,变革中的数据可视化
据可视化是一门同时结合了科学,设计和艺术的复杂学科,其核心意义始终在于清晰的叙述和艺术化的呈现,这些需要依靠数据分析师和设计师的精心策划而不是只有炫酷的效果,最终达到帮助用户理解数据和做出决策的目标,才能发挥它巨大的价值和无限的潜力。
今天,大数据已无所不在,并且正被越来越广泛的被应用到历史,政治,科学,经济,商业甚至渗透到我们生活的方方面面中,获取的渠道也越来越便利。通过本系列的前面几篇文章,我们已经了解了数据可视化的必要性,而目前市面上也已经具备了非常多成熟的BI绘制工具,如画面,QlikView的的和魔镜等等。虽然这些工具正在变得越来越自动化,然而,随着大数据时代的来临,信息每天都在以爆炸式的速度增长,其复杂性也越来越高;其次,随着越来越多科学可视化的需求产生,地图,3D物理结构等技术将会被更加广泛的使用。
所以,当人类的认知能力越发受到传统可视化形式的限制时,隐藏在大数据背后的价值就难以发挥出来,如果因为展示形式的限制导致数据的可读性和及时性降低,从而影响用户的理解和决策的快速实施,那么,数据可视化将失 其价值。
然而,所幸的是,技术的快速发展和不断变化的认知框架正在为人类打开新的视野,促使艺术与技术相结合而产生新型的数据可视化形式。
数据可视化的演变历史
一. 为什么数据可视化形式亟待改进
我们每天都在说大数据,那数据到底能“大”到怎样的程度也许你已经听说过以下结论:世界上90%的数据是在过去几年内产生的事实上,过去三十年中,全世界的数据量大约每两年增加10倍,有专家估计,到2020年的时候,数据的年度产出量会达到4300%甚至更多,这已远远超出了著名的摩尔定律理论;所以,面临着这样的巨大挑战,大数据的时代的数据可视化给我们提出了以下要求:
1. 以更细化的形式表达数据
首先,让我们来看一个相对简单的静态可视化图表:
图1.不安全流产率百分比估计(SciDev.Net 2016)
再来是一个更复杂的可视化图表:
图2.1986到2013年间172个国家的移动电话、固话和互联网的订购数量与容量(SciDev.Net 2015)
图1是一个数据量较少的静态可视化图表,我们可以通过4根柱状图的对比快速得到信息,而显而易见的,图2的数据量大大超出了图1,不仅有一百多个国家的数据变化,还包含不同的年份对比。更庞杂的数据量要求设计者通过更加细化的方式来呈现数据,所以我们可以看到图2以折线图为基础,结合了气泡的动态变化、语音说明,还包括让读者通过交互操作来选择展示哪些数据,才得以恰当和全面地展示这份数据,从而更完整的讲述一个故事。
2. 以更全面的维度理解数据
“随着大数据技术成为我们生活的一部分,我们应该开始从一个比以前更大更去全面的角度来理解事物。”
这句话来自《大数据时代》,作者的原意是在大数据时代我们应该舍弃对数据精确性的要求,而去接受更全面但是也更混杂的数据,笔者认为它同样可以用来形容未来在数据可视化方面可以进步的方向。
众所周知,人类的视觉认知能力是有限的,类似下图这样的高密度可视化图形,虽然看似丰富和具有“艺术感”,可中间重叠连接的数据往往导致图形变得复杂和难以理解。
每个节点代表一个Wiki页面,每一根线代表页面之间的连接(维基百科链接结构可视化)。
但是如果像下面这两个宇宙科普项目这样:你可以通过放大或缩小星系、调整视角、甚至像飞进了这些星球之间一样去观察它们,点击它们查看详细介绍等等。这样一个更”立体”的数据展示是否能更好的帮助你去理解这些信息呢?
通过交互式3D可视化展示探索宇宙中超过十万颗星球(100000 Stars)
如今,人们逐渐已不再满足于平面和静态的数据可视化视觉体验,而是越发想要“更深入”去理解一份数据,传统的数据可视化图表已不再是唯一的表现形式,现代媒介和技术的多样性,使人们感知数据的方式也更加多元。
3. 以更美的方式呈现数据
艺术和数据可视化之间一直有着很深的联系,随着数据的指数级增长和技术的日趋成熟,一方面,用户们对可视化的美学标准提出越来越高的要求;另一方面,艺术家和设计师们也可以采用越来越创造性的方式来表现数据,使可视化更加具有冲击力。
纵观历史,随着人们接受并习惯了一种新的发明后,接下来就是对其进行一步步的优化和美化,以配合时代的要求, 数据可视化也是如此,因为它正在变得司空见惯,良好的阅读体验和视觉表现将成为其与竞品所区分的特征之一。
二. 大数据时代的数据可视化具有哪些特征
在这里,笔者大概将其整理归纳为以下三点,当然它们并非都是必备特征:
三. 典型应用场景
那么,这些运用新技术的数据可视化目前主要是在哪些场景和形式下使用呢?
1. 大屏
首先,不得不提到的一定的是大屏了。什么是大屏?
顾名思义,就是指通过整个超大尺寸的LED屏幕来展示关键数据内容。随着许多企业的数据积累和数据可视化的普及,大屏数据可视化需求正在逐步扩大,例如一些监控中心、指挥调度中心这样需要依据实时数据快速做出决策的场所,以及如企业展厅、展览中心之类以数据展示为主的展示场所,还有如电商平台在大促活动时对外公布实时销售数据来作为广告公关手段等等,而具体的展示形式又可能分为带触摸等交互式操作或只是作单向的信息展示等等。
双十一购物狂欢节采用实时数据大屏,带给观众更加准确、震撼和清晰的体验。
2. 触摸屏
作为实现交互式数据可视化的方式之一,触屏设备常常用作控制大屏展示内容的操作设备(其中也包括手机和平板),也可以兼顾显示和操作一体来单独展示数据,大大增加了用户与数据之间的互动程度。
3. 网页
目前应用于数据可视化方面的网页技术可以说是琳琅满目,如D3.js、Processing.js、Three.js、ECharts(来自百度EFE数据可视化团队)等等,这些工具都能很好的实现各类图表样式,而Three.js作为WebGL的一个第三方库则相对更侧重于3D方向的展示。
1992-2010年内世界小型武器和弹药的进出口贸易数据展示(armsglobe.chromeexperiments.com)。
4. 视频
有数据显示,人们的平均注意力集中时间已从2008年的12秒下降到2015年的8秒,这并不奇怪,当我们在面对越来越多的信息来源时,会自然倾向于选择更快捷的方法来获取信息,而人类作为视觉动物天生就容易被移动的物体吸引,所以视频也是数据可视化的有效展示手段之一,并且视频受到展示平台的限制更少,可以应用的场景也更广。不过因为其不可交互的特性,视频展示更适合将数据与更真实、更艺术的视觉效果相结合,预先编排成一个个引人入胜的故事向用户娓娓道来。
四. 数据可视化的未来
可惜,仅有以上这些展示方式是不够的,人眼仅仅透过平面的屏幕来接收信息仍然存在着限制,VR、AR、MR、全息投影…这些当下最火热的技术已经被应用到游戏、房地产、教育等各行各业,可以预见的是数据可视化也能与这些技术擦出有趣的火花,比如带来更真实的感官体验和更接近现实的交互方式,使用户可以完全“沉浸”到数据之中。
可以想象一下,当我们可以以360ᵒ全方位的角度去观看、控制、触摸这些数据时,这种冲击力自然比面对一个个仅仅配着冷冰冰的数字的柱状图要强得多。而在不远的未来,触觉、嗅觉甚至味觉,都可能成为我们接受数据和信息的感知方式。
结语
感谢技术的飞速发展带给了我们更多元的选择,使我们可以运用前所未有的创造性方式来展示数据,但这并不意味着传统的数据可视化形式会逐渐消逝,毕竟这些新的展示技术和形式目前仍然面临着较高的制作成本,而传统的展示形式仍然是解决需要快速输出的可视化需求时的理想选择。
数据可视化是一门同时结合了科学,设计和艺术的复杂学科,其核心意义始终在于清晰的叙述和艺术化的呈现,这些需要依靠数据分析师和设计师的精心策划而不是只有炫酷的效果,最终达到帮助用户理解数据和做出决策的目标,才能发挥它巨大的价值和无限的潜力。
参考资料
“大数据时代” – Viktor Mayer-Schönberger
数据可视化的目的是有两个:一个是更好地分享和传达数据信息,二个是通过设计之美有效地缩短信息的传达。这是可视化的最根本的目的,可视化的定义在不同人眼中是不一样的。
近日星巴克与微信推出的社交礼品功能“用星说”,可以说刷遍了朋友圈。无论你爱不爱喝咖啡,星巴克似乎都成为了一种文化象征。上班族青睐,小清新喜欢,基本上大家看到绿色的人鱼标志就能马上认出它来。
虽然一直也有喝咖啡的习惯,但至今不知道星巴克菜单版上列的【摩卡】、【拿铁】、【美式】、【卡布奇诺】等等有什么区别。直到看到下列图,才很直观的了解到每个咖啡类别的区别是什么。
类似上图示,针对内容复制,难以形象表达的信息,通过图形简单清晰地向受众呈现出来,这种图称之为信息图。
信息图
信息图本身是一个合成词,由信息和图两个词组成多称之为(Infographics或Infographics Graphics),在40年代的时候就开始出现,使用在报纸及新闻类杂志方面,其中杰出的代表阿根廷的信息图先驱Alejandro Malofiej,在1993年西班牙设立了以他为名的主要针对信息图表设计的Malofiej奖。
在报纸、杂志等纸质媒体中,为了让读者感到新奇且直观容易的理解,运用了大量的信息图解的表现。
如下图所示:
信息图早已融入我们的日常生活中,目的为了创造方便舒适的生活环境,使人们的生活变得更加更加安全舒适。
为什么人们会对信息图的传播内容更有效呢?主要原因是因为视觉是人类最强的信息输入方式,人类感知周围世界最强的方式,在Brain Rules《大脑法则》一书中,发展分子生物学家John Medina写道:“视觉是迄今我们最主要的感官,占用了我们大脑中一半的资源。”信息图提供了一种语境的方法(Language of Context),通过展示多个维度数值并且相互比较来为受众提供语境,使我们更高效的把内容反射到大脑中。
后来随着技术的发展,除了传统的纸质媒体出现了以互联网为主的电脑,电视,手机,大屏终端等更多类型的电子媒体。信息图的分类也逐步划分为:图解(Diagram) 、图表(Chart) 、 表格(Table) 、统计图(Graph) 、 地图(Map)和图形符号(Pictogram)这几部分。
图解Diagram – 主要运用插图对事物进行说明
图表 Chart – 运用图形、线条及插图等,阐明事物的相互关系
表格 Table – 根据特定信息标准进行区分,设置纵轴与横轴
统计图 Graph – 通过数值来表现变化趋势或进行比较
地图 Map – 描述在特定区域和空间里的位置关系
图形符号 Pictogram – 不使用文字,运用图画直接传达信息
在以纸质媒体为主的报刊杂志的传统行业中信息图是对实际事物的描述, 而在互联网行业中侧更多的是对数据的描述。将数据图形化的过程又称之为数据可视化。把数据,包括测量获得的数值、图像或是计算中涉及、产生的数字信息变为直观的、以图形图像信息表示的、随时间和空间变化的物理现象或物理量呈现出来。
我们来看一组简单的数据,比较下图形和数据对于人脑感观的差异。
这组数据包括I、II、III、IV,一共四组,每组有X和Y两个维度。数据很简单,但从数据上来看,你能说出这四组数据的区别吗?
从数据上很难看出有什么区别,因为每组数据看上去都十分的相近。下面我们把这四组数据转换成图表来进行对比下。
通过图表的比较,我们很容易就能找出这四组数据的区别了。I组数据呈现整体离散向上的趋势。II组数据呈现弧度上升,然后再下降的趋势。III组数据呈现线性上涨的趋势,但有一个点突出。IV组数据呈现Y坐标不变X上升的趋势,但有一点突出。
将数据图形化后,大脑天然的会对图形的不同点做出反应,从而更高效的理解数据带来的意义。
我们再来看下其他例子:
将当前QQ的在线人数,通过可视化的方式展示给用户。把数据置于视觉控件中,这样用户就能很直观的了解到QQ当前使用的人群分布在中国是怎么样的,那里的人群分布多,那里的人群少。
Eric Fischer
针对Twitter 发短消息的位置和Flickr 拍照片的位置为数据源做的名为“看图或说话”(SeeSomething or Say Something)的大数据可视化展示,通过简单但大量的数据,做出非常美的数据图展示。
这种用图形化对数据进行描述设计的过程,我们通常称为【数据可视化】。有时候,可视化的结果可能只是一个条形图表,但大多数的时候可视化的过程会很复杂的,因为数据本身可能会很复杂的。一般流程包括【数据收集】-【数据分析&清理】-【可视化设计】,从抽象的原始数据到可视化图像。
要做出好的【数据可视化】,拆分出来核心要先了解什么是【数据】。
数据
数据是可视化的基础,它不仅仅是数字,要想把数据可视化,就必须知道它表达的是什么。根据Ben Shneiderman的分类,信息可视化的数据分为以下几类:
一维数据:X轴一个维度如果1、2、3、4 ···
二维数据:X,Y两个二维度(1、2),(3、4),(5、6),(7、8)···
三维数据:X,Y,Z三个维度(1、2、3),(4、5、6),(7、8、9) ···
多维数据:X,Y,Z,···多个维度(1、2、3、4、···),(5、6、7、8、···)
时态数据:具有数据属性的数据集合。
层次数据:具有等级或层次关系数据集合。
数据种类划分是十分多的,但是这些数据都描述了现实的世界中的一部分,是现实世界的一个快照。除了类型,数据的数量级也影响这数据的表达结果。
小数据量(小于100)展示一下静态结果,中数据量(1K~100K)呈现数据反映的事实,大数据量(大于1M+)用于研究分析,推测结果。
我们来看一个数据:【2017年1月28号,成都PM2.5值245】,从这个数据里能看出什么,可能只是会觉得当天成都空气质量不好,我们可能会联想到这个样一个画面。
好像就不能得出什么了。其实从单个小数据上来看,我们很难得到什么有价值的信息。
只能匹配出数据代表的当前的静态状态结果。所以要想发挥出数据可视化的作用,首先我们需要大量真实的数据,知道数据的来龙去脉,把它作为一个整体来理解,关注全貌对原始数据了解得越多,打造的基础就越坚实,也就越可能制作出令人信服的数据图表。
OK,我们继续丰富我们的原始数据,在中国环境监测总站(http://www.cnemc.cn/)的网站获取到成都2017年整个1月份的PM2.5的数据。
中国环境监测总站作为空气质量公开的数据来源,它提供了获取数据的API接口。通过API接口我们可以获取到原始数据。
原始数据一般包含的信息都比较多,什么PM2.5,、空气质量指数、PM10、一氧化碳、二氧化碳、臭氧、二氧化硫等等。我们只需要PM2.5的,所以清理数据,把其他不必要的内容去掉。然后导入到Excel表中,可以得到我们最终需要的数据。
有了【数据】下一步就可以开始做数据的【可视化】。
可视化
通俗地说,可视化设计的目的是“让数据说话”,用图形去讲述数据的故事。可视化是一种表达数据的方式,是现实世界的抽象表达。它像文字一样,为我们讲述各种各样的故事。作为一种媒介,可视化已经发展成为一种很好的故事讲述方式。
我们把成都PM2.5的数据,按照日期和当天的PM2.5指数做出最简单图形来,我们可以得到下面这类的图表来。
这类的图用Excel很简单就能得到。我们可去修改下柱状图的配色,但它依然只是一个简单的图表,而不是好的可视化作品。
那什么是好的可视化作品呢?
好的可视化设计需要具备统计和设计方面的知识。没有前者,可视化只是插图和美术练习;没有后者,可视化就只是研究分析结果。统计和设计的知识都只能帮助你完成数据图形的一部分。
我们需要去讲述数据的故事。那PM2.5代表的是什么,是当天天气的情况,所以我们可以用天气的维度去讲述这个故事。
我们把成都2017年1月份的天气照片的到,天气好的时候天是蓝色,PM2.5超标的时候是灰色。把它图形化我们可以得到这样一个展示,可以看出对于成都来说一个月中天气好的时间是十分少的。
好的可视化设计能让你有一见钟情的感觉,你知道眼前的东西就是你想看到的。既可以是艺术的,同时又是真实的。而不是直接把数据转换成图表,找到数据和它所代表事物之间的关系按照“数字化叙事”去做设计,这是全面分析数据的关键,同样还是深层次理解数据的关键。
我们在网上可以看到大量的优秀的数据可视化图,这些优秀的作品都会以这种“数字化叙事”的方式,告诉用户数据的意义。
这是哈佛做的一个数据可视化项目,将全球价15万亿美元的大宗交易表现在这里。地图上的每个点都代表 1 亿美元的进出口商品,十分的形象和震撼。
当然好的数据可视化图都是不断迭代优化出来的,判断是不是一个好的数据可视化可以按照以下的步骤去考虑。【你有什么数据】 -> 【关于数据你想知道什么】 -> 【数据可视化的表现方式】 -> 【你看到了什么?有意义吗?】。每一个问题的答案都取决于前一个答案,不断的去问自己,每个环节有没有问题,这样才能做出最好的设计。
我们一直在讲数据可视化的目的是有两个:一个是更好地分享和传达数据信息,二个是通过设计之美有效地缩短信息的传达。这是可视化的最根本的目的,可视化的定义在不同人眼中是不一样的。作为一个整体,可视化的广度每天都在变化,但是这是一个新的领域,我们可以用一种全新的方式去认识世界的过程,数据可视化,改变对数据的呈现和思考方式。
参考资料
《图解力》 – 木村博之
《数据之美》 – 邱南森
《可视化沟通》 – Randy Krun
《信息设计》 – Dopress Books
Designing Data Visualizations with Noah Iliinsky – TED演讲
信息可视化研究综述 – 河北科技大学学报
上篇文章简单的介绍了数据可视化的基础,将数据进行设计可视化后,可以让我们有一种全新的方式去认识数据,改变对数据的呈现和思考方式。那现在就让开始做一份数据的可视化表,一步步的来看下我们如何获取数据,以及如何进行可视化的展示。
在上章内容中,提到了关于【数据可视化迭代过程】的步骤,这也能看出整个过程包含的步骤,大致有:
确定主题
数据获得
图表选择(表达)
图表绘制
当然了我们也可以看到可视化是要一个不断迭代的过程,步骤之间都需要多次的迭代修改的。
1、确定主题
这肯定是第一步了,在做数据可视化的时候,首先你要明了你要做什么,想要从数据获中取什么信息,有了目标才能明确的往下做。
那我们这次还是来做关于空气质量PM2.5的数据展示,了解历年来PM2.5的实际情况和发展趋势。
2、数据获得
对于全国空气质量的数据,最权威的来源肯定是来自于中国环境监测总站(http://www.cnemc.cn/)的数据提供。但是监测总站的API提供的并不是很详细,还有很多第三方也提供类似的API接口,比如PM25.in(http://pm25.in/),在API说明上做的很详细,他们的数据每日更新。所以这次我们选择PM25这个网站来获取数据源。
我们可以看到PM25提供的内容是相当多,包括PM2.5、AQI、PM10、CO、NO2、O3等等。我们只需要PM2.5的数据,所以我们把其他不需要的数据都可以去除掉,同时把Json的数据转换为CSV的数据格式,这里转换数据只是为了下一步处理方便,我这边是选用Processing来做数据可视化处理的。如果你用D3.js,Echart来做的话,Json可能会更方便点。
3、图表选择(表达)
对于很多人(非设计师)来说数据可能容易获取,但是像要把数据转换成合适的图表进行表达反而非常困难的。因为同样的数据,用不同的图表进行展示出来,得到的效果是完全不一样的。平时可能用到最多的就是通过Excel来做图表,在Excel2010的版本里面,提供了10类共53个图表,还提供了什么数据透视图,自定义图表等等,总之种类非常多。不过尽管图表种类繁多,但其基本类型只有以下几种:
曲线图:用来反映随时间变化的趋势;
柱形图:用来反映分类项目之间的比较,也可以用来反映时间趋势;
条形图:用来反映分类项目之间的比较;
散点图:用来反映相关性或分布关系;
饼图:用来反映构成,即部分占总体的比例;
地图:用来反映区域之间的分类比较。
那知道了,基础图表的类型,那怎么去选择。国外专家Andrew Abela他将图表展示的关系分为4 类:比较、分布、构成、联系。然后根据这个分类和数据的状况给出了对应的图表类型建议。当我们不确定使用什么类型的图表的时候,可以参考下这个图。
4、图表绘制
俗话说【不会撸码的交互不是好的数据可视化设计师】,现在市面上有各式各样的可视化的方法和工具,但坦白来说【这些可视化工具都是大坑!!!】,要想做好可视化的表现,最好的方式还是需要掌握一门编程语言,只有这样你才能最合适的表达清楚出你想传达出来的数据信息。
这里给各位想跳入数据可视化这个大坑的设计师们(编程大佬请无视),推荐一下Processing这个创意编程语言。
Processing是美国麻省理工学院媒体实验室旗下美学与运算小组创造出来的(搞设计的人做出来的编程语言),非常容易上手,代码逻辑也很简单,几段代码就能做出十分出现效果的展示。
不过Processing没有代码提示的功能的,用起来还是十分痛苦的,经常是因为一个单词写错了,而造成程序报错。不过后来我发现到Subilme Text能支持Processing的编译环境,而且能提供代码提示功能,简直是发现新大陆一样,从此Processing用起来再也不费劲了。
确定用Processing来实现后,我们继续来做PM2.5的可视化展示。国家环保部将空气质量分为六个等级,分别用绿、黄、橙、红、紫、褐六个颜色来标注,对于着优、良、轻度污染、中度污染、重度污染和严重污染六个空气质量。我们要展示历年来PM2.5的实际情况和发展趋势,就可以把每天的空气质量转换一个个不同颜色的小方格,通过颜色的区别来展示当天的PM2.5情况。
先在纸上画一个简单的草图。已年为划分,下面用小方格展示该年内每天的空气质量是什么等级,把当天的PM2.5数值转换对应的颜色值。
代码很简单的,我大概编写了40来行就完成了,代码逻辑很简单就是导入数据,判断当前数据的值是多少,根据不同的值属于小方块不同的颜色。
实现之后,看起来就是这样子的。日期时间轴是按照1月到12月排列的,通过上面的图示我们可以比较清楚的看到污染程度比较高的时间是集中在开头和结尾,就是1-2月,11-12月之间,也就是每年冬天就是PM2.5污染程度高的时间。
我们继续把成都历史的数据可视化后来看下。我们发现12年之前成都空气质量都还不错的,在14年的时候,就没有小绿格了,可见14年成都空气质量有多差劲,15年、16年后慢慢的开始有点好转,应该是政府开始治理了。我们在把北京,上海和深圳的天气拔来看看。
第一列是成都08-16年的空气质量,第二列是北京的,第三列是上海的,第四列是深圳的。可见深圳的空气质量完爆成都、北京和上海。几乎全是小绿格,真是宜居好地方啊。而帝都北京空气质量是这四个城市中最差的。
小结
将数据可视化后,我们可以发现数据中更大的意义,最重要的还是实践做出来,这篇文章简单的讲解了下可视化的整个过程,我们如何寻找数据,以及做出有意义的可视化图表出来。希望更多的人兴趣,一起来做数据可视化。
如何搭建数据可视化系统,用丰富的设计语言清晰表达复杂和庞大数据,并形成鲜明的设计风格?我们把数据可视化的元素进行拆分并建立相应的规范体系。
图表设计
1. 图表基本类型
六种基本图表涵盖了大部分图表使用场景,也是做数据可视化最常用的图表类型:
柱状图:分类照片照片什么照片什么什么项目之间的比较;
饼图:构成即部分占总体的比例;
折线图:随时间变化的趋势;
条形图:分类照片照片什么照片什么什么项目之间的比较;
散点图:相关性或分布关系;
地图:区域之间的分类照片照片什么照片什么什么比较。
基本图表类型都有通用的样式,不过多的展开讲解我们更多的考虑如何选择常用图表来呈现数据,达到数据可视化的目标基本方法:
(1)明确目标
明确数据可视化的目标,通过数据可视化我们要解决什么样的问题,需要探索什么内容或陈述什么事实。
(2)选择图形
围绕目标找到能提供信息的指标或者数据,选择合适的图形去展示需要可视化的数据。
Andrew Abela整理的图表类型选择指南图示,将图表展示的关系分为四类:
(3)选择维度
分辨哪些是有价值的值得关注的维度,选择数据展示的视角。基本图表一般有哪些可用维度呢?
基本图表维度
对照以上图形维度,制作可视化图形。
(4)突出关键信息
根据可视化展示目标,将重要信息添加辅助线或更改颜色等手段,进行信息的凸显,将用户的注意力引向关键信息,帮助用户理解数据意义。
CPU监控
CPU使用率监控案例,可视化的目标就是检测CPU的使用情况,特别是异常使用情况。所以图中将100%最高临界线使用特殊的颜色和线形标识出来,异常的使用段用颜色帮助用户识别。
2. 图表排布
在可视化展示中,往往有多组数据进行展示。通过信息的构图来突出重点,在主信息图和次信息图之间的排布和大小比例上进行调整,明确信息层级及信息流向,使用户获取重要信息的同时达到视觉平衡。以扶贫展示项目为例,以地图的方式展示出扶贫的概况信息,两边排布扶贫的具体内容信息,在构图和上突出主次。并在主要信息的背景上做动画处理,进一步加强信息层级及视觉流向的引导。
扶贫项目
3. 动效设计
目前越来越多的可视化展示的数据都是实时的,所以动效在可视化项目中的应用越来越广泛,动效设计肩负着承载更多信息和丰富画面效果的重要作用。
(1)信息承载
在可视化设计中经常遇到,非常多的数据信息需要展示在一个大屏幕上。遇到这种情况,需要对信息进行合并整理或通过动画的方式,在有限的屏幕空间里承载更多的信息,使信息更加聚合,同时使信息展示更加清晰,突出重点。
(2)画面效果
增加细节及空间感,背景动效使画面更加丰富。单个图表的出场动画,使画面平衡而流畅。减少了图表在出现或数据变化时的生硬刻板。
数据可视化动画在设计上重要的原则是恰当的展示数据。动画要尽量的简单,复杂的动画会导致用户对数据的理解错。动画要使用户可预期,可使用多次重复动画,让用户看到动画从哪里开始到哪里停止。
配色方案
由于图表的特殊性,数据可视化的配色方案和配色要求具有独特性。配色方案要充分考虑到特殊人群对数据图的可读性。丰富的色系,至少6种才可满足图表应用的各种场景。同时配色需要有可辨识性,色彩选择需要有跨度。
1. 背景色定义
背景色的选择与可视化展示的设备相关,分为深色、浅色、彩色。
(1)大屏背景色
在大屏设备中普遍用深色作为背景色,以减少屏幕拖尾,观众在视觉上也不会觉得刺眼。所有图表的配色需要以深色背景为基础。保证可视化图的清晰辨识度,色调与明度变化需要有跨度。
淘宝双11大屏设计
(2)中小屏背景色
中小屏幕背景色选择范围就比较广,浅色、彩色、深色均可以做出很好的设计。相比之下,浅色背景更适合展示大量的数据信息,因为在浅色底上数据图表的识别度比较高。而深色、彩色背景更适合渲染简单的数据,用于烘托气氛。
中小屏幕浅色,深色,彩色设计
2. 图表色定义
在图表的颜色运用上,色彩是最直接的信息表达的方式,往往比图形和文字更加直观的传递信息,不同颜色的的组合也能体现数据的逻辑关系。颜色的表示方法有很多种,如RGB、CMYK等,在可视化设计中,颜色作为用于数据编码的视觉通道,HSV的颜色表示方式更加符合人类感知方式,同时也更加适合展示数据。
(1)色彩辨识度
要确保配色非常容易辨识与区分,对于使用单一色相配色,明度差异需要全局考虑,明度跨度一定要够大才能更清晰的展示数据。明度跨度是否合适,可以通过在灰度模式下配色的辨识度来判断。
(2)色彩跨度
多色相配色在数据可视化中是相当常见的,多色相配色使用户容易将数据与图像联系起来。如何有效利用色调的变化来传达数据信息?
带明度信息的色环
当需要的颜色较少时,避免使用相近的色相同类色和相近色。尽量选择对比色或互补色,这样可以使不同属性数据在图表中展示更加清晰。
例如:美国大选使用红色和蓝色两种对比色,将清晰的将选票结果展示于地图上。
美国大选图
当图表需要的颜色较多时,建议最多不超过12种色相。通常情况下人在不连续的区域内可以分辨6〜12种不同色相。过多的颜色对传达数据是没有作用的,反而会让人产生迷惑如何让多种色相的颜色看来和谐有几种取色的方法?
色环提取法:
选择同一饱和度和明度的不同色调作为可视化图表的配色,这样可以使图表看起来协调统一。
渐变色取色法:
不同明度和色相的取色,淡紫到深黄的过渡,与淡黄到深紫的过渡,感觉是一样的配色,但是实际两种配色实际感觉却差别很大。
淡黄到深紫的过渡看起来更加自然,这是因为我们在自然中大多存在的都是淡黄向深紫的过度。如下图,所以采用仿自然的配色方式会让图表更加自然。
在取渐变色时,可以在Photoshop中制作出色相变化的色带并叠加明度渐变的色带,获得明度和色相均变化的色带。然后根据数据的数量,拉辅助线到取色点的位置,从断点处选取颜色,对渐变进行测试与调整,测试配色在实际运用中的效果,选取最优的配色。
取色的实际应用:
渐变色取色
渐变色应用案例
字体设计
文字是数据可视化的核心内容之一,文字和数字是数据信息传达的重要组成部分,为了更加清晰精确的传达信息,增加信息的可读性,从字体选择,到字体大小,字体间距都有特定的要求。
1. 字体选择
(1)辨识度
UI设计中使用无衬线字体是UI界的共识,但是对于数据可视化设计而言,字体大小的跨度可以非常大,所以在无衬线字体中需要选择辨识度更高的字体,大的宽度比值和较高的X高度值的字体有更高的辨识度,选择字母容易辨识不会产生奇异的字体更有利于用于数据可视化设计。
(2)更加灵活的字体
字体需要更加灵活,应该支持尽可能多的使用场景,数据可视化项目经常显示在不同大小,不同的终端上,需要选择更加灵活的字体可以在低分辨率的小屏或超大屏幕上运行良好。
(3)字间距
宽松的字母间距(字母之间的间距应小于字偶间距)和合适的中文字间距。
2. 字体大小
文字的可读性对数据可视化起着至关重要的作用,设置小字体的极限值,以保证在最小显示时不影响对文字的辨认与阅读。
3. 中西文间隔
中西文混排时,要注意中文和西文间的间隔,一般排版的情况都是中文中混排有西文,所以需要在中西文间留有间隔,帮助用户更快速的扫视文字内容。
极限处理
数据是多种多样不可预知的,所以在可视化时需要处理各种极限问题,才能使数据清晰表达。
1. 数据展示细节处理
如下图,当水平排列数据时,图表空间不够,导致数据不可辨识,对数据进行旋转处理,不利于阅读,可以选择简写的方式来排布展示数据,或通过改变图表形式来解决问题。
2. 选择合适的图表形式
虽然饼图可以展示份额,但过多的分项已经使饼图不堪重负,不能很好的展示数据占比这个主题,所以使用横向柱状图可以更加清晰的表达这个主题。
小结
我们生活在大数据时代,越来越多的数据被可视化。在构建可视化体系时,无论图表、颜色、字体都是承载和传达数据信息的元素,设计的核心是“让数据清晰传达”。