无名图书
收藏
Spark大数据分析实战
高彦杰
出版社
机械工业出版社
出版时间
2016-01-01
ISBN
9787111523079
评分
★★★★★
标签
工业技术
目录
前 言
第1章 Spark简介 1
1.1 初识Spark 1
1.2 Spark生态系统BDAS 3
1.3 Spark架构与运行逻辑 4
显示全部
用户评论
不连续;杂;不适合新手;体现不了实战二字。
哎
水
Spark是基于内存计算的大数据并行计算框架,因为它基于内存计算,所以提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。Hadoop中包含计算框架MapReduce和分布式文件系统HDFS。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive等分布式存储层,融入Hadoop的生态系统,并弥补MapReduce的不足。
1flume采集日志到kafka中,spark streaming去处理计算 2spark是加州大学伯克利分校发明的 3spark社区和生态发展越来越好,是未来的趋势。
有种“对方不想和你说话,并丢出一堆工具给你”的感觉。很多计算模型介绍,而就仅仅介绍,代码应用很浅,随便几行演示那种,也就看看个示例,并没有“实战”可言。
代码凑字数
你可能会关注的书籍
Spark大数据处理:技术、应用与性能优化
高彦杰
Hadoop+Spark大数据分析实战(大数据技术丛书)
PySpark大数据分析实战 伍鲜 常丽娟
伍鲜 常丽娟
机械工业出版社的其他书籍
查看全部
ADHD大脑使用说明书
(美)杰茜卡·麦凯布(Jessica McCabe)
走出洞穴
向松祚
解决问题的流程
李传杰
人生定位
艾·里斯, 杰克·特劳特
没有不好的你
理查德·C.施瓦茨
营销罗盘
夏凯
下载
收藏