Hadoop应用架构 - Mark Grover

Hadoop应用架构

Mark Grover

出版时间

2017-01-01

ISBN

9787115442437

评分

★★★★★
书籍介绍

-使用Hadoop进行数据存储和建模的着眼点和思路

-将数据输入、输出系统的最佳方案

-MapReduce、Spark和Hive等数据处理框架介绍

-数据去重、窗口分析等常见Hadoop处理模式应用

-在Hadoop上采用Giraph、GraphX等图形处理工具

-综合使用工作流以及Apache Oozie等调度工具

-以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理

-点击流分析、欺诈检验和数据仓库的架构案例

本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。

为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。

目录
版权声明
O'Reilly Media, Inc. 介绍
译者序
前言

显示全部
用户评论
大数据架构方面最好的一本书了
20180916--2 工作了两个月,再看体会就多了些,不过我司好像都不用Flume。 20180517--1 高屋建瓴,不适合入门,期待有项目经验后二刷。另,排版问题有点大。
实用性很强,未实践过的话只能看个热闹
2019-10-12:第一次读,对于Hadoop生态的多种工具大致的讲解了下;第二部分的三个案例,非常经典,值得再读;
扫盲书,很快地掠过很多东西,了解了一下sqoop.oozie和数仓场景
极好
很久很久以前做的书
技术扫盲书,内容泛泛
下载
收藏