Spark大数据处理:技术、应用与性能优化 - 高彦杰

Spark大数据处理:技术、应用与性能优化

高彦杰

出版时间

2014-11-01

ISBN

9787111483861

评分

★★★★★
书籍介绍

《Spark大数据处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用方法、性能优化,以及BDAS生态系统的相关技术。

作为一个基于内存计算的大数据并行计算框架,Spark不仅很好地解决了数据的实时处理问题,而且保证了高容错性和高可伸缩性。具体来讲,它有如下优势:

打造全栈多计算范式的高效数据流水线

轻量级快速处理

易于使用,支持多语言

与HDFS等存储层兼容

社区活跃度高

……

Spark已经在全球范围内广泛使用,无论是Intel、Yahoo!、Twitter、阿里巴巴、百度、腾讯等国际互联网巨头,还是一些尚处于成长期的小公司,都在使用Spark。本书作者结合自己在微软和IBM实践Spark的经历和经验,编写了这本书。站着初学者的角度,不仅系统、全面地讲解了Spark的各项功能及其使用方法,而且较深入地探讨了Spark的工作机制、运行原理以及BDAS生态系统中的其他技术,同时还有一些可供操作的案例,能让没有经验的读者迅速掌握Spark。更为重要的是,本书还对Spark的性能优化进行了探讨。

目录
前 言
第1章 Spark简介 1
1.1 Spark是什么 1
1.2 Spark生态系统BDAS 4
1.3 Spark架构 6

显示全部
用户评论
章节的安排,先难后易,抛出一大堆概念和原理。。有点谭浩强,太不注重实践了
浅入浅出……
错误有点多 居然没有找到网上勘误
第三,四两章不错,包含rdd操作还有spark的工作机制。
书的内容还不错,就是内容顺序不太好,总感觉读起来不顺畅,有些章节顺序对调下,可能会比较好
除了最基本的rdd,甚至连stream都没讲。真是够了
主要看看第三四章介绍远离框架,对了解框架还是有帮助,但是确实不算深入。
后面的代码越贴越多,而且整本书的csdn风格太浓,整个读下来几乎没得到什么新的见解
主要是一些偏底层的东西,大概过了一遍,内容泛而浅,基本就是源码解读,水水的… 不是这本,实际是内核机制解析与性能调优,但豆瓣没找到…
Z-Library
收藏