Python网络数据采集 - 米切尔 (Ryan Mitchell)

Python网络数据采集

米切尔 (Ryan Mitchell)

出版时间

2016-02-29

ISBN

9787115416292

评分

★★★★★

标签

编程

书籍介绍

本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。

目录
译者序  ix
前言  xi
第一部分 创建爬虫
第1章 初见网络爬虫  2
1.1 网络连接  2

显示全部
用户评论
很幽默
2019第19本,主要讲爬虫方面的一些方法,还是需要一点编程基础不然容易晕,涉及的方面还是比较多的
还算入门,不过读完了该不会还是不会,实际操练才行……
Beautifulsoup
主要看完了第一部分,算是网络数据采集的入门书 第一部分主要讲了爬虫,API,数据库还有文档读取这一类的内容。有API固然是好的,没有的话也只能自己爬了 估计以后我们会花很多时间就是做这些事情,搭建我们自己的数据库 不过书看到这,理论有点饱和了,理论还是得和实践搭配。能力才能有精进
快速入门/架构实现+技术选型(技术栈、工具链)
翻译的不错! 但原书内容较简陋,没啥营养。整体上不如那本 “用 Python 些网络爬虫“
文字幽默简洁,读着非常舒服。主要内容是初步教了一下python的beautifulsoup4怎么用,爬虫的有关基础概念各个方面都说了一下,包括数据的提交、存储和读取,NLP,OCR以及如何远程采集等等,简明扼要地给出了各个角度的后续学习路径。要求会一点python基础,几个小时就能看完,看完后几个小时就可以撸一个爬豆瓣日记的小玩具出来,很实用。
学了大半个月,太吃力了,这位作者大高手手眼太高,每个示例代码都得自己一步步反推解析,半本弃,重新回去学基础了[奋斗]
内容有点浅显,而且有些东西已经过时了
下载
收藏