无名图书的logo
无名图书
  • 最近更新
  • 文学
  • 社会文化
  • 历史
  • 经济
  • 理工科
  • 政治
  • 健康
  • 自然科学
  • 计算机
  • 设计
  • 美食旅行
  • 思想
  • 生物
  • 建筑
  • 绘本
  • 天文
  • 用 Python 写网络爬虫(第2版)

    [德] 凯瑟琳·雅姆尔(Katharine·Jarmul)

    评分 6.7分

    本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。 Kathar