
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.5 本章小结
本章主要介绍了使用Python进行数据探索和可视化的相关应用实例。在数据分析和机器学习中,数据探索分析很重要,而在数据探索分析过程中,使用合适的数据可视化技术,能够更快速、充分地对数据进行理解。本章介绍了在数据探索过程中,可能遇到的一些问题的解决方法,如分析数据中是否存在缺失值或异常值,针对存在缺失值或异常值的数据怎么进行相关处理,如何使用相关指标对数据进行描述统计分析,以及如何使用合适的可视化方法,分析数据间的关系,最后还介绍了几种在机器学习中常用到的距离度量方式。本章使用到的函数如表2-1所示。
表2-1 函数说明

续表
