可视化图表类型有哪些(常见12种图表类型分析)

可视化图表类型有哪些(常见12种图表类型分析)

导读:史上最全图表类型术语&指南来了!

安德鲁·阿伯拉(Andrew Abela)制作的《这份指南》(This Guide)是思考图表类型的一个很好的起点,但不要把它用作决策引擎。并不是人人都同意他对图表类型的组织方式,层级结构也并未包含所有有效的图表类型。

事实上,这里显示的每个图表都有许多变体和混合,而且人们时时刻刻都在创建出新的图表类型。此外,当你想要拓展自己的思维,尝试多种方法时,这个工具可能缩小你的思考范围。

但是,它将帮助你理解各种形式的类别(例如,比较和分布),并且可能激发你尝试一些新东西。我已经对《这份指南》进行了调整,使之与“交谈-画草图-创建原型”的框架相适应。至于我是怎样调整的,请参见下图。

01 2×2矩阵

也叫矩阵,水平和垂直平分的方框,形成了四个象限。它常用于说明基于两个变量的类型。

优点:针对元素分类和“区域”创建的易于使用的组织原则

缺点:在不同的空间间隔绘制象限内的项,暗示两者可能不存在统计关系

02 冲积图

也称为流图,显示值怎样从一个点移动到另一个点的节点和流。这通常用于展示值在一段时间内的变化,或者其组织方式的细节,例如,预算拨款如何逐月使用。

优点:在值的更改中公开详细信息,或者在广泛数据类别中公开地详细分解

缺点:流中的许多值和变化导致复杂而且交叉的视觉效果,虽然很漂亮,但可能很难解释

03 条形图

表示类别之间关系(“分类数据”)的高度或长度不等的条形。常用来比较同一指标下的不同群体,如10位不同CEO的薪酬。(当条形图垂直时也称为柱状图。)

优点:大家都熟悉的形式;非常适合于类别之间的简单比较缺点:许多条形图可能会造成趋势线的印象,而不是突出离散值;多组条形可能变得难以解析延伸阅读:手把手教你用直方图、饼图和条形图做数据分析(Python代码)

04 气泡图

散布在两次测量上的点,为数据增加了第三个维度(气泡大小),有时增加了第四个维度(气泡颜色),以显示几个变量的分布。常用来表示复杂的关系,如绘制不同国家的多个人口数据块。(也被错误地称为散点图。)

优点:合并“z轴”最简单的方法之一;气泡大小可以为分布式的可视化图表增加至关重要的上下文

缺点:按比例调整气泡大小是棘手的(面积与半径不成比例);从本质上说,三轴和四轴的图表需要更多的时间来解析,因此不太适合于一目了然的表示

延伸阅读:什么是气泡图?怎样用Python绘制?有什么用?终于有人讲明白了

05 凹凸图

也称为疙瘩图(bumps chart),显示随着时间推移的排名顺序变化的线条。常用来表示受欢迎程度,如每周的票房排名。

优点:表现受欢迎程度、赢家和输家的简单方式

缺点:变化没有统计学意义(值是序数,而不是基数);许多的等级和更多的变化使其具有引人注目的优势,但也可能使其难以追踪观察排名

06 点图

显示沿一根轴线的几个测量值。当重要的不是每根条形的高度而是条形之间的高度差时,常用于代替条形图。

优点:一种在垂直的或水平的狭小空间内都适用的紧凑形式;比传统的形式(条形图)更容易沿着单一的测试方法来进行比较

缺点:由于要绘制的点很多,很难有效地标记;如果这很重要,那就消除了所有类别之间的趋势感

07 流程图

用多边形和箭头表示流程或工作流。通常用于描绘决策,数据如何在系统中移动,或者人们如何与系统交互,例如用户在网上购买产品的过程。(也称为决策树,它是流程图的一种类型。)

优点:形式化的系统,被普遍接受,用于表示具有多个决策点的流程

缺点:必须理解已确定的语法(例如,菱形表示决策点;平行四边形表示输入或输出等规则)

08 地理图

也叫地图,用于表现属于现实世界中位置的值的地图。常用于比较国家或地区之间的值,如显示政治立场的地图。

优点:如果看图者熟悉地理,可以很容易地找到值并在多个层次上对它们进行比较(即同时按国家和地区比较数据)

缺点:使用位置的大小来表示其他值,可能会强化或弱化这些位置中编码的值

09 层次图

用来表示元素集合的关系和相对排名的线和点。通常用来表示某组织的结构,如家庭或公司。(也称为组织结构图、家谱或树形图,所有这些都是层次图的类型。)

优点:一种记录和说明关系与复杂结构的易于理解的方法

缺点:行与方框的方法在显示复杂性方面受到限制;更难显示不那么正式的关系,比如人们如何在公司的层级制度之外合作

10 直方图

基于范围内每个值的出现频率来显示分布情况的条形。常用于显示概率等结果的风险分析模拟。(也被错误地称为条形图,实际上,条形图用于比较类别之间的值,而直方图则显示一个变量的值的分布。)

优点:用来显示统计分布和概率的基本图表类型

缺点:看图者有时会把直方图误认为条形图

延伸阅读:手把手教你用Python画直方图:其实跟柱状图完全不同

11 折线图

显示值如何变化的一些相互连接的点,通常随时间的推移而变化(连续数据)。常用于通过把多条线画在一起来比较趋势,例如几家公司的收入。(也称为体温记录图或趋势线。)

优点:大家都熟悉的形式;非常适合于一目了然地表现趋势

延伸阅读:什么是折线图?怎样用Python绘制?怎么用?终于有人讲明白了

12 棒棒糖图

类似于点图,但在单个测量值上绘制两个点,用一根线连接,以显示两个值之间的关系。绘制几个棒棒糖图,可以产生类似于浮动条形图的效果,其中的值并不全都固定在同一个点上。(它也被称为双棒棒糖图。)

优点:既适合水平又适合垂直的紧凑的图表形式;当两个变量之间的差异最重要时,非常适合在它们之间进行多次比较

缺点:当变量“翻转”(高值是前一个棒棒糖图中的低值)时,多个棒棒糖图之间的比较可能令人困惑;值相似的多个棒棒糖图,使得评估图中的单个项变得困难

13 隐喻图

箭头、金字塔、圆圈和其他公认的图形,用来表示非统计概念。通常用于表示抽象的想法和流程,如业务周期。

优点:能够简化复杂的想法;由于人们对隐喻的普遍认识,所以显得天生就能理解这种图

缺点:很容易混淆隐喻,误用隐喻,或者过度设计隐喻

14 网络图

连接在一起的节点和线,以显示一个群体中各元素之间的关系。通常用于表示实物之间的相互联系,如计算机或人。

优点:有助于说明节点之间的关系,这些关系在我们采用其他方式时可能很难看出来;突出显示集群和异常值

缺点:网络往往迅速变得复杂起来。有些网络图虽然漂亮,但可能很难解释

15 饼形图

被分成若干部分的圆,每个部分代表某个变量在整个值中所占的比例。通常用于显示简单的总数细分,如人口统计。(也称为甜甜圈图,它是一种以圆环形式显示的变化图。)

优点:无处不在的图表类型;显示主导份额和非主导份额

缺点:人们对扇形楔形块的面积估计得不是很好;如果楔形块过多,将使得值难以区分和量化

16 桑基图

显示值是如何分布和传输的箭头或条形。常用于显示物理量的流动,如能量或人。(也称为流图。)

优点:使人们易于发现系统流程中的细节;帮助识别主要的组成部分和低效的地方

缺点:是一种由包含许多组成部分和流动路径的复杂系统构成的图表

延伸阅读:怎样用Python绘制诱人的桑基图?

17 散点图

对照某一特定数据集的两个变量而绘制的点,表示这两个变量之间的关系。常用于检测和显示相关性,如年龄与收入的关系图。

优点:大多数人都熟悉的基本图表类型;这种空间方法可以很容易地看到相关、负相关、集群和异常值

缺点:很好地表现了相关性,以至于即使相关性并不意味着因果关系,人们也可能做出因果关系的推测

延伸阅读:Python数据可视化:5段代码搞定散点图绘制与使用,值得收藏

18 斜率图

表示值的简单变化的线。通常用来表示剧烈的变化,或与大多数斜率相反的异常值,例如某地区的收入下降,其他所有地区的收入都在上升。(也称为折线图。)

优点:创造了一种简单的之前和之后的叙事,无论是单个值还是许多值的总体趋势,都让人很容易看出和掌握

缺点:排除了两种状态之间值的所有细节;太多纵横交错的线条可能让人很难看到单个值中的变化

19 小型多图

一系列小图表,通常是线形图,显示在同一尺度上测量的不同类别。常用于多次显示简单的趋势,如按国家划分的GDP趋势。(也称为网格图或格状图。)

优点:和将所有的线都叠加在同一个图表中相比,更容易比较多个甚至几十个类别之间的差异

缺点:如果没有戏剧性的变化或差异,就很难在比较中发现其意义;你在单个图表中看到的一些“事件”就会丢失,例如变量之间的交点

20 叠加区域图

也称为区域图,描绘某一随着时间的推移而变化的变量的线条,线条之间的区域用颜色填充,以强调体积或累计总数。通常用于按时间比例显示多个值,例如一年中多个产品的销售量。

优点:能很好地显示出比例随时间的变化;强调体积感或积累感

缺点:太多的“层次”使得每一层都太薄了,以至于很难看到随时间的变化、差异,或者难以追踪观察值的情况

21 叠加条形图

被分成若干部分的矩形,每个部分代表某个变量在整体中的比例。通常用于显示简单的分类汇总,如各地区的销量。(也称为比例条形图。)

优点:有些人认为它是饼形图的一个更好的替代图表;很好地显示主导份额和非主导份额;可以有效地处理比饼形图更多的类别;水平和垂直都适用

缺点:包含太多的类别或者将多个堆积条形组合在一起,可能使你很难看到差异和变化

22 表格

按列和行排列的信息。通常用于跨多个类别显示单个值,如季度财务业绩。

优点:使每个单个的值都可用;与相同信息的单调版本相比,更容易阅读和比较值的情况

缺点:难以对趋势产生粗略的了解,也很难对几组值进行快速比较

23 树形图

被分割成更小矩形的矩形,每个更小矩形代表某个变量与整个值的比例。常用于表示等级比例,如按类别和子类别划分的预算。

优点:显示详细比例分解的紧凑形式;克服了饼形图的许多楔形块的限制

缺点:以细节为导向的形式,不适合快速理解;太多的类别会造成令人震惊但难以解析的视觉效果;通常需要能够精确排列正方形的软件

24 单位图

用于表示与分类变量相关的单个值的集合的点或图标。通常用于显示实物的记录,如花费的金额或者流行病中的患者。(也称为点图。)

优点:以比某些统计演示更加具体、更加形象的方式来表现值

缺点:太多的单元类别可能使你难以将精力集中在核心的意义上;要拥有强大的设计能力,才能使单位的安排最有效

划重点??干货直达??

为什么Spark能成为最火的大数据计算引擎?它是怎样工作的?

吐血整理:盘点19种大数据处理的典型工具

10道题搞懂色彩搭配的6大准则,让你的图表开口说话!

学习Numpy,看这篇文章就够啦

发表评论

登录后才能评论