R数据科学 - [新西兰] Hadley Wickham

R数据科学

[新西兰] Hadley Wickham

出版时间

2018-06-30

ISBN

9787115486394

评分

★★★★★

标签

编程

书籍介绍

本书的目标是教会读者使用最重要的数据科学工具,从而为实施数据科学奠定坚实的基础。读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。

AI导读
核心看点
  • 系统介绍tidyverse工具包,涵盖数据可视化与转换
  • 强调探索性数据分析思维,而非单纯语法罗列
  • 采用分层语法与管道操作,提升代码可读性
适合谁读
  • 希望掌握R语言进行数据科学实践的初学者
  • 需要规范数据处理流程的数据分析师
  • 从事定量研究或需要处理数据的科研人员
读前提醒
  • 本书侧重数据预处理与EDA,算法建模内容较少
  • 后半部分难度陡增,建议结合官方文档辅助阅读
  • 务必动手运行代码,理解管道操作与函数式编程
读者共识
  • Tidyverse生态的权威指南,代码风格优雅实用
  • 前半部分极佳的入门书,后半部分对新手较难
  • 翻译质量总体上乘,适合作为案头工具书查阅

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "正确问题的近似答案通常是模糊的,但它远远胜过错误问题的确切答案,尽管后者总是很精确。——John Tukey"
  • "正如Jamie Zawinsk下面所说 当遇到一个问题时,有些人会这样想:“我可以用正则表达式来搞定它。”于是,原来的一个问题就变成了两个问题。"
  • "Happy families are all alike;every unhappy family is unhappy in its own way. -Leo Tolstoy Tidy datasets are all alike,but every messy dataset is messy in its own way. -Hadley Wickham"
  • "ggplot2只能同时使用六种形状,默认情况下,当使用这种图形属性时,多出的变量值将不会出现图中。"
  • "只要将一个图形属性映射为一个离散变量,就会自动对数据进行分组来绘制多个几何对象。"
  • "使用RStudio快捷键RStudio:Alt+-(Alt加上减号)……会自动在复制的两端加上空格,这是一个非常好的编码习惯。读代码是苦中作乐的一件事情,因此,用空格让你的眼睛稍感轻松吧。"
  • "支持管道操作是tidyverse中的R包的核心原则之一。唯一的例外就是ggplot2:它是在发现管道方式前开发的。ggplot2的下一个版本ggvis支持管道操作,遗憾的是其还没有达到成熟完备的程度。"
  • "当使用多个变量进行分组时,每次的摘要统计会用掉一个分组变量。这样就可以轻松地对数据集进行循序渐进的分析"
作者简介
Hadley Wickham,RStudio首席科学家,统计学家,斯坦福大学、奥克兰大学、莱斯大学兼职统计学教授。ggplot2等多款知名R包的开发者,一直致力于让普罗大众更容易上手数据分析,被R社区誉为“改变了R的人”。另著有《R包开发》等书。 Garrett Grolemund,RStudio数据科学家、知名R培训师,曾受邀在Google、eBay等诸多公司讲授R语言和数据科学,在DataCamp开授的R相关课程备受R开发者喜爱。另著有《R语言入门与实践》。
目录
前言  XV
第一部分 探索
第1章 使用ggplot2进行数据可视化  3
1.1 简介  3
1.2 第一步  4

显示全部
用户评论
逻辑挺清晰的,我这个理科白痴也看得懂
匆匆浏览的教材,有空还得细看一遍。比较通俗易懂,适合新手入门。
其实是想给翻译者点这个赞,原书写得好,翻译的也很好,不易。
稍微学了一点基础以后看了这本书,感觉写的非常流畅易懂。而且这本书不只是介绍知识点,还教会读者如何自己去查阅文档。后面还要再过一遍,同时还要再去补充学习其他知识。
前两部分是很常规的数据处理过程,但流畅到有体验神奇的感觉。模型这部分有许多之前没有接触过的新思路,但是内容太少了,要是这部分能再多些就好了!
主要介绍tidyverse的使用,基本没涉及统计的东西
补标。
读的时候相见恨晚,觉得学r看这一本就足够了。不过后来又新学了几门语言,重新体验了几次入门者视角,这本书的定位算在入门之后的最佳选择更合适。r base虽然简单也得先捋清楚。
下载
收藏