1.2.5 数据可视化
数据可视化旨在借助图形化手段清晰有效地传达信息,它是一种能够利用人眼的感知能力对数据进行交互的可视化表达技术。
1.定义
数据可视化可以通过图形图像的形式展示大型数据集。该方式具有如下优点。
● 易于理解:视觉信息相比文字信息更容易理解,使用图形图像形式来总结复杂的
数据也比文字形式更加直观。
● 增强互动:动态的图形图像可以及时显示数据的变化情况,提供更清晰的数据信息。
● 强化关联:数据可视化可以突出地显示数据之间的关联关系。
● 美化数据:数据可视化工具可以美化数据的表现形式,提供更好的视觉体验。
数据可视化流程主要包括数据表示与变换、可视化呈现和用户交互3个步骤。
1)数据表示与变换:是数据可视化的基础,即将原始数据转换为计算机可识别与处理的结构化数据形式,以最大限度地保留信息和知识。
2)可视化呈现:以直观的、容易理解和操作的方式呈现数据,需要选择合适的展示形式。
3)用户交互:通过可视化的手段辅助分析决策,可以用于从数据中探索新的假设,也可以验证假设与数据的一致性,还可以用于向公众展示信息。
数据可视化和数据挖掘的目标都是从数据中获取知识,但采取的手段是有差异的。数据可视化通过图形图像形式呈现数据,让用户能够交互地理解数据。而数据挖掘则是通过各种算法获取数据背后隐藏的知识,并将结果直接反馈给用户。
2.数据可视化工具
下面介绍一些主流的数据可视化工具。
● Tableau:该工具可以帮助用户快速分析、可视化并分享信息。优点是易于上手,用户只需将大量数据拖放到数字画布上,便可以创建各种图表。同时,Tableau具有强大的数据处理能力,可以处理数百万行数据。
● Highcharts:该工具的图表类型非常丰富,可以制作实时更新的曲线图。Highcharts具有轻量级、性能稳定、兼容好以及图表简约美观的优点,但该工具缺乏中文版说明文档,学习门槛较高。
● Echarts:该工具基于JavaScript的开源可视化库,用于常用图表的制作,具有文件体积小巧、打包方式灵活、操作自由、支持多种图表的优点。Echarts由百度开发并开源,兼容当前绝大部分浏览器,中文版说明文档较为丰富,便于学习。Echarts的缺点是自定义开发比较困难且缺乏立体效果支持。