什么是数据可视化
发布时间:2023-08-26 20:11 浏览次数:次 作者:admin
什么是数据可视化?
数据可视化是指借助图形化手段,清晰有效地传达与沟通信息。这里的核心是有效的传递信息,由于人类大脑对视觉信息的处理优于对文本的处理,因此使用图表、图形和设计元素把数据进行可视化,可以帮你更容易的解释数据模式、趋势、统计规律和数据相关性,而这些内容在其他呈现方式下可能难以被发现。
如演讲和沟通专家南希·杜瓦特(Nancy Duarte)所说:“不要让听众感觉你在展示一张图表,而要回顾人的行为,描述曲线变化背后的事件。不是“来看我们的三季度财报”,而是“来看我们为什么没完成目标”。”
二、数据可视化有哪些好处?
1.化繁为简,方便理解
数据可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。
正所谓“一图胜千言”,使用图表来总结复杂的数据,这种沟通方式也使业务领导者能够更快地理解和处理他们的信息。
2.发现新趋势、新机遇
企业收集到的消费者行为的数据,可以为适应性强的公司带来许多新的机遇。通过使用大数据可视化来监控关键指标,更加阳光透明,及时发现问题第一时间做出应对。
例如:天猫的双11数据大屏实况直播,可视化大屏展示大数据平台的资源利用、任务成功率、实时数据量等。企业领导人可以更容易发现各种大数据集的市场变化和趋势。
3.增强数据交互
数据可视化的主要好处是它及时带来了风险变化。但与静态图表不同,交互式数据可视化鼓励用户探索甚至操纵数据来发现其他“秘密”。这就为使用分析提供了更好的意见。
三、数据可视化的难点
1.准备工作
数据可视化的最大难点在数据可视化之前的准备工作—数据的获取与整理。比如数据收集是否全面准确?清洗数据是否到位?数据分析是否有据可循?数据分析结论是否清晰?如果用来数据可视化的数据出现问题,数据可视化的作品都不具有任何参考价值。
2.对数据需要具有敏感性
面对复杂的数据、信息,怎么找到数据之间的逻辑关系至关重要,这就需要制作人具备一定的数据分析能力,对大量复杂的数据具备数据敏感性,快速找到多维度、多变量的数据之间的逻辑关系,确定哪些数据之间有直接关系,哪些数据之间具有间接关系,需要重点展现哪些数据之间的关系,这些都需要制作人及时做出准确判断。
3.用简洁易懂的图表展示复杂的数据关系
因为阅读者需要在极短的时间内掌握了解各类图表所传递的数据关系,数据可视化需要尽可能简洁,便于让不同的阅读者快速抓住其重点,数据可视化就需要用有限的文字、简洁的图表展现大量的数据之间的各种关系与其客观规律。
4.选择合适的图表
从千变万化的各类图表中,选出适合自己数据的图表类型是数据可视化的关键。每种图表都有自己的优势和局限性,条形图就有一般条形图、堆积条形图、百度比条形图、双向柱状图等分类,饼状图也有:一般饼状图、玫瑰饼状图、环形图、旭日图等类型。所以根据自己的数据特点选择适当的图表很重要。
5.图表细节处理
图表细节的处理需要综合考虑多方面因素—刻度标记类型、间隙、刻度标签位置、数据类型、小数位、是否千分位、颜色取值、图例位置、图上标签、图表标题、备注文字说明等等。细节的处理不仅影响数据可视化的效果,若处理不好,可能还会加大阅读人的阅读困难。例如:刻度选取不合理折线过于陡峭,折线太细不便于观察线等。
数据可视化过程的设计原则
1.目的明确
并不是所有的数据都需要数据可视化。数据可视化是借助图形化的分析过程,来解决业务上某一问题或者发现某一问题,当数据脱离了业务,就没有必要可视化了。所以做数据可视化之前先要明确这个数据可视化的分析目的到底是什么?你打算通过数据向用户讲述怎样的故事,数据可视化之后又在表达什么?通过这些数据,能为你后续的工作提供哪些指导?
为了准确找到数据可视化的目的,请先回答这7个问题
(1)数据要解决的业务内容的主题是什么?
(2)这个数据可视化的数据如何获取?
(3)我们想从数据中了解什么?也就是数据分析的要解决什么问题?
(4)这份业务数据是什么时间的?
(5)这份业务数据是什么领域的?
(6)谁搜集过这份数据,来自哪个业务系统?
(7)数据量是否足够完成这次准确的分析?
如果你完整、清晰地回答了以上7个问题,你就明确了这次的数据可视化到底要解决什么问题。
2.简洁、美观
很多人在做数据可视化的时候一味追求酷炫的动态图、华丽的视效等,如果一个简单的图表就可以解决一个问题,为什么还要花大量的时间精力去做一些与数据无关的工作呢?合理运用色彩同样能让图表显示的很高级。图表主要作用是传递信息,追求过分漂亮只会使徒增无用功。
但是,图表的基础美感会给人带来视觉上的享受,图表中的坐标轴、形状、线条、字体、标签、标题排版等元素是都会影响人的视觉效果,这些图表元素经过合理的搭配会给整个数据可视化作品加分,比如图表的色彩,如果搭配合理,会使整个图表看起来更加生生动,同时也会加深阅读者的记忆。
3.懂得利用工具
得心应手的数据可视化工具会使数据可视化的工作事半功倍。举个例子,如果用excel来做一份简单的仪表盘时,需要用到表格函数、AVERAGEIF函数、INDEX函数、MATCH函数等十几个函数,以及堆积条形图、簇状柱形图、信息图、带数据标记的折线图、簇状条形图等几种图型,就算是熟练的excel大能估计也要做上半个小时。如果对于excel的函数、透视表、VBA等不熟练,可能会花费更多时间。
4.实事求是
数据可视化的结果一定要实事求是,不可规避“异常数据”,真实反映业务数据,才可能帮助我们发现问题,掩盖问题只会造成更大的问题。若数据很庞大,也不可随意省去自认为不重要的数据部分,找到核心数据指标和异常数据,重点展示核心数据指标,分析异常数据的问题原因,最后给出合理、准确的数据分析结论。
五、选择合适的图表
数据可视化是一个展现复杂信息的强大武器。通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。
但如果数据可视化做得不好,反而会带来负面效果,所以更需要我们选择合理的数据可视化方法,高效传达数据。接下来,我们一起看看不同图表的不同使用场景。
1.比较类—柱状图
(1)特点:柱状图利用柱子的高度,反映数据的差异。 使用图形的长度、宽度、位置、面积、角度和颜色来比较数值的大小。
(2)使用场景:通常用于展示不同分类间的数值对比,不同时间点的数据对比。局限在于只适用中小规模的数据集。
2.流程类—漏斗图
(1)特点:流程类图表显示流程流转和流程流量。一般流程都会呈现出多个环节,每个环节之间会有相应的流量关系,这类图形可以很好的表示这些关系。漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
(2)适用场景:表现了随着业务流程的推进业务目标完成的情况。
3.占比类—饼图
(1)特点:占比类图表显示同一维度上的占比关系。饼图通过将一个圆饼按照分类的占比划分成多个区块,整个圆饼代表数据的总量。
(2)适用场景:展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
4.区间类—仪表盘
(1)特点:区间类图表显示同一维度上值的上限和下限之间的差异。使用图形的大小和位置表示数值的上限和下限,通常用于表示数据在某一个分类(时间点)上的最大值和最小值。
(2)适用场景:目前很多的管理报表或报告上都是用这种图表,以直观的表现出某个指标的进度或实际情况。
5.趋势类—折线图
(1)特点:趋势类图表反映事物随时间或有序类别而变化的趋势。使用图形的位置表现数据在连续区域上的分布,通常展示数据在连续区域上的大小变化的规律。
(2)适用场景:用于显示数据在一个连续的时间间隔或者时间跨度上的变化。
6.时间类—面积图
(1)特点:时间类图表显示以时间为特定维度的数据,在折线图的基础之上形成的,使用图形的位置表现出数据在时间上的分布,需要注意的是颜色要带有一定的透明度,透明度可以很好的帮助使用者观察不同序列之间的重叠关系。
(2)适用场景:用于表现数据在时间维度上的趋势和变化。
7.雷达图
(1)特点:雷达图适用于多维数据(四维以上),且每个维度必须可以排序。但是有一个局限,就是数据点最多6个,否则无法辨别,因此适用场合有限。
(2)适用场合:四维以上的数据。
可视化案例展示
数据可视化是指借助图形化手段,清晰有效地传达与沟通信息。这里的核心是有效的传递信息,由于人类大脑对视觉信息的处理优于对文本的处理,因此使用图表、图形和设计元素把数据进行可视化,可以帮你更容易的解释数据模式、趋势、统计规律和数据相关性,而这些内容在其他呈现方式下可能难以被发现。
如演讲和沟通专家南希·杜瓦特(Nancy Duarte)所说:“不要让听众感觉你在展示一张图表,而要回顾人的行为,描述曲线变化背后的事件。不是“来看我们的三季度财报”,而是“来看我们为什么没完成目标”。”
二、数据可视化有哪些好处?
1.化繁为简,方便理解
数据可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。
正所谓“一图胜千言”,使用图表来总结复杂的数据,这种沟通方式也使业务领导者能够更快地理解和处理他们的信息。
2.发现新趋势、新机遇
企业收集到的消费者行为的数据,可以为适应性强的公司带来许多新的机遇。通过使用大数据可视化来监控关键指标,更加阳光透明,及时发现问题第一时间做出应对。
例如:天猫的双11数据大屏实况直播,可视化大屏展示大数据平台的资源利用、任务成功率、实时数据量等。企业领导人可以更容易发现各种大数据集的市场变化和趋势。
3.增强数据交互
数据可视化的主要好处是它及时带来了风险变化。但与静态图表不同,交互式数据可视化鼓励用户探索甚至操纵数据来发现其他“秘密”。这就为使用分析提供了更好的意见。
三、数据可视化的难点
1.准备工作
数据可视化的最大难点在数据可视化之前的准备工作—数据的获取与整理。比如数据收集是否全面准确?清洗数据是否到位?数据分析是否有据可循?数据分析结论是否清晰?如果用来数据可视化的数据出现问题,数据可视化的作品都不具有任何参考价值。
2.对数据需要具有敏感性
面对复杂的数据、信息,怎么找到数据之间的逻辑关系至关重要,这就需要制作人具备一定的数据分析能力,对大量复杂的数据具备数据敏感性,快速找到多维度、多变量的数据之间的逻辑关系,确定哪些数据之间有直接关系,哪些数据之间具有间接关系,需要重点展现哪些数据之间的关系,这些都需要制作人及时做出准确判断。
3.用简洁易懂的图表展示复杂的数据关系
因为阅读者需要在极短的时间内掌握了解各类图表所传递的数据关系,数据可视化需要尽可能简洁,便于让不同的阅读者快速抓住其重点,数据可视化就需要用有限的文字、简洁的图表展现大量的数据之间的各种关系与其客观规律。
4.选择合适的图表
从千变万化的各类图表中,选出适合自己数据的图表类型是数据可视化的关键。每种图表都有自己的优势和局限性,条形图就有一般条形图、堆积条形图、百度比条形图、双向柱状图等分类,饼状图也有:一般饼状图、玫瑰饼状图、环形图、旭日图等类型。所以根据自己的数据特点选择适当的图表很重要。
5.图表细节处理
图表细节的处理需要综合考虑多方面因素—刻度标记类型、间隙、刻度标签位置、数据类型、小数位、是否千分位、颜色取值、图例位置、图上标签、图表标题、备注文字说明等等。细节的处理不仅影响数据可视化的效果,若处理不好,可能还会加大阅读人的阅读困难。例如:刻度选取不合理折线过于陡峭,折线太细不便于观察线等。
数据可视化过程的设计原则
1.目的明确
并不是所有的数据都需要数据可视化。数据可视化是借助图形化的分析过程,来解决业务上某一问题或者发现某一问题,当数据脱离了业务,就没有必要可视化了。所以做数据可视化之前先要明确这个数据可视化的分析目的到底是什么?你打算通过数据向用户讲述怎样的故事,数据可视化之后又在表达什么?通过这些数据,能为你后续的工作提供哪些指导?
为了准确找到数据可视化的目的,请先回答这7个问题
(1)数据要解决的业务内容的主题是什么?
(2)这个数据可视化的数据如何获取?
(3)我们想从数据中了解什么?也就是数据分析的要解决什么问题?
(4)这份业务数据是什么时间的?
(5)这份业务数据是什么领域的?
(6)谁搜集过这份数据,来自哪个业务系统?
(7)数据量是否足够完成这次准确的分析?
如果你完整、清晰地回答了以上7个问题,你就明确了这次的数据可视化到底要解决什么问题。
2.简洁、美观
很多人在做数据可视化的时候一味追求酷炫的动态图、华丽的视效等,如果一个简单的图表就可以解决一个问题,为什么还要花大量的时间精力去做一些与数据无关的工作呢?合理运用色彩同样能让图表显示的很高级。图表主要作用是传递信息,追求过分漂亮只会使徒增无用功。
但是,图表的基础美感会给人带来视觉上的享受,图表中的坐标轴、形状、线条、字体、标签、标题排版等元素是都会影响人的视觉效果,这些图表元素经过合理的搭配会给整个数据可视化作品加分,比如图表的色彩,如果搭配合理,会使整个图表看起来更加生生动,同时也会加深阅读者的记忆。
3.懂得利用工具
得心应手的数据可视化工具会使数据可视化的工作事半功倍。举个例子,如果用excel来做一份简单的仪表盘时,需要用到表格函数、AVERAGEIF函数、INDEX函数、MATCH函数等十几个函数,以及堆积条形图、簇状柱形图、信息图、带数据标记的折线图、簇状条形图等几种图型,就算是熟练的excel大能估计也要做上半个小时。如果对于excel的函数、透视表、VBA等不熟练,可能会花费更多时间。
4.实事求是
数据可视化的结果一定要实事求是,不可规避“异常数据”,真实反映业务数据,才可能帮助我们发现问题,掩盖问题只会造成更大的问题。若数据很庞大,也不可随意省去自认为不重要的数据部分,找到核心数据指标和异常数据,重点展示核心数据指标,分析异常数据的问题原因,最后给出合理、准确的数据分析结论。
五、选择合适的图表
数据可视化是一个展现复杂信息的强大武器。通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。
但如果数据可视化做得不好,反而会带来负面效果,所以更需要我们选择合理的数据可视化方法,高效传达数据。接下来,我们一起看看不同图表的不同使用场景。
1.比较类—柱状图
(1)特点:柱状图利用柱子的高度,反映数据的差异。 使用图形的长度、宽度、位置、面积、角度和颜色来比较数值的大小。
(2)使用场景:通常用于展示不同分类间的数值对比,不同时间点的数据对比。局限在于只适用中小规模的数据集。
2.流程类—漏斗图
(1)特点:流程类图表显示流程流转和流程流量。一般流程都会呈现出多个环节,每个环节之间会有相应的流量关系,这类图形可以很好的表示这些关系。漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
(2)适用场景:表现了随着业务流程的推进业务目标完成的情况。
3.占比类—饼图
(1)特点:占比类图表显示同一维度上的占比关系。饼图通过将一个圆饼按照分类的占比划分成多个区块,整个圆饼代表数据的总量。
(2)适用场景:展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
4.区间类—仪表盘
(1)特点:区间类图表显示同一维度上值的上限和下限之间的差异。使用图形的大小和位置表示数值的上限和下限,通常用于表示数据在某一个分类(时间点)上的最大值和最小值。
(2)适用场景:目前很多的管理报表或报告上都是用这种图表,以直观的表现出某个指标的进度或实际情况。
5.趋势类—折线图
(1)特点:趋势类图表反映事物随时间或有序类别而变化的趋势。使用图形的位置表现数据在连续区域上的分布,通常展示数据在连续区域上的大小变化的规律。
(2)适用场景:用于显示数据在一个连续的时间间隔或者时间跨度上的变化。
6.时间类—面积图
(1)特点:时间类图表显示以时间为特定维度的数据,在折线图的基础之上形成的,使用图形的位置表现出数据在时间上的分布,需要注意的是颜色要带有一定的透明度,透明度可以很好的帮助使用者观察不同序列之间的重叠关系。
(2)适用场景:用于表现数据在时间维度上的趋势和变化。
7.雷达图
(1)特点:雷达图适用于多维数据(四维以上),且每个维度必须可以排序。但是有一个局限,就是数据点最多6个,否则无法辨别,因此适用场合有限。
(2)适用场合:四维以上的数据。
可视化案例展示