数据整理实践指南 - Q.Ethan McCallum

数据整理实践指南

Q.Ethan McCallum

出版时间

2016-02-29

ISBN

9787115411020

评分

★★★★★
书籍介绍

随着数据科学的热门,数据的优化、整理以及如何处理不良数据成为人们关注的重点。本书通过处理不良数据,进行数据清理的案例,向读者展示了处理数据的方法。

本书共有19章,从6部分向读者展示了使用和清理不良数据背后的理论和实践。第1部分是Grubby的动手实践指南,它向读者介绍了驾驭、提取数据的方法,如何处理文本数据中的数据以及Web开发中碰到的数据问题。第2部分是让人充满意外的数据,它向读者介绍了数据也会“撒谎”。第3部分是方法,它向读者介绍了处理不良数据的一些方法。第4部分是数据存储和基础设施,它向读者介绍了如何存储数据。第5部分是数据的商业化,它向读者介绍了如何避免数据处理的一些误差。第6部分是数据策略,它向读者介绍了如何追踪数据、评估数据质量以及构建数据质量相关平台等。

本书适合数据科学家、数据处理和整理相关开发人员阅读。也适合想要进入数据处理领域的读者阅读。

目录
第1章 从头说起:什么是噪音数据 1
第2章 是我的问题还是数据的问题 4
2.1 理解数据结构 5
2.2 校验 8
2.2.1 字段校验 8

显示全部
用户评论
这是十年前的机器翻译吧…
数据杂文集,没有什么阅读的必要。除非闲着没事干。也有一点点的价值。
翻译的质量感觉不是太好,很多地方读起来拗口;内容上,对于自己体验过的场景,很有共鸣感,学到不少;没有体验过的部分,感觉距离太远,读不进去,以后有经验后可以回头再读;不适合初学者,适合有了一定经验想要进一步提高的相关工作人员
多人拼凑,粗知滥造。
书的内容过于零碎,令人抓不住其主题。
还行,有所收获,但是不是很系统。有收获就是好书。给个八星吧。
下载
收藏