Python爬虫开发:从入门到实战(微课版)
上QQ阅读APP看书,第一时间看更新

3.4 本章小结

本章主要讲到了正则表达式和Python的文件操作。

正则表达式用来在一大段文字中提取需要的内容,用得最多的组合是“(.*? )”。这个组合可以解决绝大多数的目标提取问题。

使用Python读/写文本文件和CSV文件都需要先把文件打开,在Python中使用open这个关键字来打开文件。在Python中,使用CSV这个内置的模块可以非常方便地把CSV文件转换成Python的字典,或者把Python的字典转换为CSV文件。