什么是数据可视化

2022-03-2622:01:57什么是数据可视化已关闭评论

数据可视化导论

以图形方式表示数据或信息,以便观察者能够轻松理解数据趋势的过程,这称为数据可视化。使用任何视觉元素,以便从数据中理解和研究趋势、异常值和模式。用于数据可视化的不同工具包括图表、地图和图形等。这些工具的设计方式可以轻松理解和掌握数据提供的信息,而不是扫描excel表格的整个过程,从而为分析人员节省时间。

Hadoop、数据科学、统计和;其他

饼图

使用中最普遍的图表之一是披萨图或饼图。

混合物中气体的比例
这张图表通常在选举中用来显示哪个政党获得了最多的选票,尽管它非常受欢迎,但也有一些明显的缺点。爱德华·塔夫特(Edward Tufte)、利兰·威尔金森(Leland Wilkinson)和杰拉尔德·范贝尔(Gerald van Belle)等统计学家都表示不愿意使用饼图。反对饼图的最确凿的证据可能是由Perceptive Edge的创始人斯蒂芬·诺尔(Stephen Now)提供的。斯蒂芬在《视觉商业智能通讯》上发表的文章《为甜点留馅饼》中解释了为什么,令同事和学生惊讶的是,他认为馅饼图是可视化数据的无效手段。
请看下面的饼图。

在这张描绘晚上9点后订购的食品比例的图表中,很容易估算出属于冰淇淋的百分比——25%。然而,经过轻微修改后,再也无法轻松确定冰淇淋订单的百分比。

虽然冰淇淋的比例仍然保持在25%,但从上图很难理解。在上一张图中,很容易猜出百分比,因为冰淇淋的阴影从6点钟位置开始,一直延伸到9点钟位置。由于我们的眼睛经过训练,可以看到12、3、6和9的时钟,如果饼图的区域与4个时钟位置一致,那么它也更容易解释。一位热心的饼图支持者会站出来建议,通过使用标签和标记每个区域的百分比,可以很容易地避免这个问题。

带有数据标签的饼图。
但同样,为了将值映射到项目,我们的眼睛必须不断将焦点从图表底部的图例转移到图表上的标签上。

查看课程
相关课程
Hadoop培训计划(20门课程,14个以上项目,4个小测验)
MapReduce培训(2门课程,4个以上项目)
Splunk培训计划(4门课程,7个以上项目)
Apache Pig培训(2门课程,4个以上项目)
解决这个问题的方法是附加项目名称和值,以获得类似的结果:

你会说,太好了。但我想问你——既然我们已经附上了项目名称和价值,那么上面的饼图与下表有什么不同:

使用按顺序百分比排序的数据清理表。
这些信息看起来是否比散布在饼图上的标签和图例要好得多。那么,饼图有什么用呢?视觉化是为了增加价值;它们是结论的媒介;他们应该让数据暴露其秘密。但在这种情况下,饼图并没有实现它的承诺。

进入数据可视化的条形图

与饼图相比,柱状图更简洁、更优雅,它能够表达饼图上所说的一切,而不会弄乱标签和图例。

条形图描述了相同的情况——易于比较、对比和总结
这与现在温和地呈现给观察者的信息相同。除了显示个别价值外,这个图表使我们能够快速比较每种食物的受欢迎程度,甚至比较连续食物之间价值的相对差异。同样的数据本可以通过表格获得,但我们的大脑在处理图像方面比破译文本更好。
这就是为什么饼图的使用随着时间的推移而减少。虽然这是媒体行业最受欢迎的视觉效果,但它已经被更好、更复杂的表现形式所取代。除了折线图、饼图和条形图之外,还有无数其他的图表可以派上用场。一个有趣的图是Sankey图,但对新手来说并不流行。这个图表用来表示物质的分布和流动。问题可能是能源、金钱,甚至是水。

典型IT员工的能量流和分布图。
上面是一个虚构的Sankey图,表示IT员工的大部分精力是如何以及在哪里分配的。

更新的工具

随着社交媒体和人们可以写出自己的感受、评论和观点的不同平台的出现,一个非常常见的数据可视化工具就是“云”。单词云帮助我们了解人们在谈论什么。

这是一个非常真实的、实时的word cloud,展示了google play商店中用户对PUBG的评论。
如果我们看看这里的“云”这个词,它是根据谷歌play store对游戏PUBG的前80条评论构建的,我们会发现对游戏的总体反应是“好的”,有些人甚至称之为“最好的”然而,似乎有些“更新”存在问题,人们正在恳求游戏创作者予以纠正。事实上,当我们在那天查看play store的评论时,我们看到了同样的情况。

更新的问题。另外,看看你是否能在这里找到“请”这个词。

未来

这只是冰山一角。Plotly和D3等库将数据可视化提升到了一个不同的水平。这是因为需求也发生了变化。你会如何在仪表盘上想象一个智能城市?一个巨大的屏幕,可以显示整个城市的重要信息。
交通、电力使用、不同地区的健康状况、空气质量和许多其他参数需要显示在一个页面上。这一要求要求对数据可视化提出了一种不同的方法,因此我们通过这个概念了解了什么是数据可视化。我们不能再坚持使用图表了。当图形与艺术和想象力相结合,创造丰富的视觉体验时,需要一种新颖的方法,这种讨论需要一篇完全不同的文章。直到下次。

推荐文章

本文是关于什么是数据可视化的有用指南。在这里,我们用图表和图表讨论了基本概念,以便您能够轻松理解数据可视化。您还可以阅读以下文章了解更多信息——

  1. Oracle数据库管理员的职业生涯
  2. 7.数据挖掘和Web挖掘之间最有用的区别
  3. 数据分析面试问题
  4. 大数据分析示例