图解Spark:核心技术与案例实战

郭景瞻

出版时间

2016-12-31

ISBN

9787121302367

评分

★★★★★
书籍介绍

《图解Spark:核心技术与案例实战》以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark 生态圈相关组件,包括Spark SQL 的即席查询、Spark Streaming 的实时流处理应用、MLbase/MLlib 的机器学习、GraphX 的图处理、SparkR 的数学计算和Alluxio 的分布式内存文件系统等。

《图解Spark:核心技术与案例实战》从Spark 核心技术进行深入分析,重要章节会结合源代码解读其实现原理,围绕着技术原理介绍了相关典型实例,读者通过这些实例可以更加深入地理解Spark 的运行机制。另外《图解Spark:核心技术与案例实战》还应用了大量的图表进行说明,让读者能够更加直观地理解Spark 相关原理。通过《图解Spark:核心技术与案例实战》,读者将能够很快地熟悉和掌握Spark 大数据分析计算的利器,在生产中解决实际问题。

郭景瞻,现就职京东商城,开源技术爱好者,对Spark等大数据系统有较为深入的研究,对Spark应用开发、运维和测试有较多的经验,喜欢深入阅读Spark源代码,分析其核心原理和运行机制。

目录
第一篇 基础篇
第1章 Spark及其生态圈概述
1.1 Spark简介
1.1.1 什么是Spark
1.1.2 Spark与MapReduce比较

显示全部
用户评论
内容还行 不过这本编著的书里面很多地方语句语法是不通的
里面一堆的内部代码实现,可以偶尔看看里面的逻辑是怎么样,感觉对学习spark还是非常有用的,之前因为一个textFile方法的一个参数没理解透导致犯了错,才下决心买来看看的。 这本书不是看一遍就能get到的,很多东西还没有看到,有些部分却已经看了好几遍,每次看都会有不同感受,有一股仰慕之情油然而生呢。
欠缺深度
错别字不少
算是讲的比较深入的一本书了,一大堆代码,有点难肯
不建议读 不如直接看代码或者博客
第四章和第五章很精彩
打8分,小白还是建议一看,结合《flink》实战派,就大致知道大数据是在干啥事了
泛泛而谈,不深,而且有多处错误
下载
收藏