无名图书
收藏
Spark大数据分析实战
高彦杰
出版社
机械工业出版社
出版时间
2016-01-01
ISBN
9787111523079
评分
★★★★★
标签
工业技术
目录
前 言
第1章 Spark简介 1
1.1 初识Spark 1
1.2 Spark生态系统BDAS 3
1.3 Spark架构与运行逻辑 4
显示全部
用户评论
不连续;杂;不适合新手;体现不了实战二字。
哎
水
Spark是基于内存计算的大数据并行计算框架,因为它基于内存计算,所以提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。Hadoop中包含计算框架MapReduce和分布式文件系统HDFS。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive等分布式存储层,融入Hadoop的生态系统,并弥补MapReduce的不足。
1flume采集日志到kafka中,spark streaming去处理计算 2spark是加州大学伯克利分校发明的 3spark社区和生态发展越来越好,是未来的趋势。
有种“对方不想和你说话,并丢出一堆工具给你”的感觉。很多计算模型介绍,而就仅仅介绍,代码应用很浅,随便几行演示那种,也就看看个示例,并没有“实战”可言。
代码凑字数
你可能会关注的书籍
Spark大数据处理:技术、应用与性能优化
高彦杰
Hadoop+Spark大数据分析实战(大数据技术丛书)
PySpark大数据分析实战 伍鲜 常丽娟
伍鲜 常丽娟
机械工业出版社的其他书籍
查看全部
ADHD大脑使用说明书
(美)杰茜卡·麦凯布(Jessica McCabe)
CCF 信息学奥赛基础篇
中国计算机学会 组编 朱全民 丛书主编 江涛 编
记忆脑:在AI时代如何巧用大脑
[日] 桦沢紫苑
稳定内核修炼指南
刘翔平
关键跃升
刘润
手机断舍离
[美] 凯瑟琳·普赖斯(Catherine Price)
Z-Library
收藏