书籍介绍
在信息爆炸的时代,网络爬虫技术成为了数据获取的重要手段。无论是学术研究、市场分析还是个人兴趣,网络爬虫都发挥着不可替代的作用。《用 Python 写网络爬虫(第2版)》深入浅出地讲解了如何利用Python进行网络爬虫开发,让读者轻松掌握网络爬虫的核心技术和实践技巧。
作者简介
Katharine Jarmul是位于德国柏林的数据科学家及Python编程爱好者,她拥有自己的数据咨询服务公司Kjamistan,为各规模企业提供建模、抽取和采集数据等服务。自2008年起,她使用Python进行编程,从2010年开始运用Python进行网页抓取,并在初创企业的数据分析与机器学习项目中应用网络爬虫技术。可以通过Twitter账号@kjam来追踪她的见解和最新动态。
推荐理由
《用 Python 写网络爬虫(第2版)》详细介绍了网络爬虫的各个方面,从数据抓取、缓存处理到并发抓取,再到动态页面抓取、表单交互和验证码处理,覆盖了网络爬虫的整个流程。书中不仅介绍了常用的库和工具,还通过实例展示了如何将这些技术应用于真实网站的数据抓取,帮助读者学以致用。这本书是网络爬虫爱好者和有一定Python基础的读者的理想选择。
适合哪些人读
适合对网络爬虫技术感兴趣的Python开发者
有一定Python基础,希望学习网络爬虫技术的人员
从事数据挖掘、市场分析等领域的专业人士
以及对网络爬虫技术有浓厚兴趣的广大读者。
目录
前言
资源与支持
第1章 网络爬虫简介
第2章 数据抓取
第3章 下载缓存
显示全部