Python数据挖掘实战(微课版)
上QQ阅读APP看书,第一时间看更新

2.2 Pandas

Pandas是基于NumPy构建的一个数据分析模块,它也是Python语言中非常强大和重要的数据分析和处理模块。Pandas与NumPy的编码风格和功能均有相似之处,但两者的不同之处在于:Pandas是一个专门为处理表格和混杂数据而设计的高效模块,而NumPy更适合处理统一的数值数据。Pandas纳入了大量的库和标准数据模型,这使得使用Python处理海量数据变得非常快速和容易。

使用Pandas读取Excel文件

Pandas模块的安装与NumPy的类似,可以在Anaconda命令行终端中使用pip命令(见图2-2)或者conda命令进行安装:


pip install pandas                       #使用pip命令安装
conda install pandas                    #使用conda命令安装    

或者安装指定版本的Pandas:


pip install pandas == 0.9.1      #使用pip命令安装指定版本的Pandas
conda install pandas == 0.9.1           #使用conda命令安装指定版本的Pandas

图2-2 在Anaconda的命令行终端安装Pandas