Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。 译者介绍
Spark权威指南
Bill Chambers, Matei Zaharia
评分 7.6分
·大数据技术和Spark概述。 ·通过实例学习DataFrame、SQL、Dataset等Spark的核心API。 ·了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。 ·了解Spark如何在集群上运行。 ·Spark集群和应用程序的调试、监控、和调优。 ·学习Spark强大的流处理引擎——结构化流处理。 ·学习MLlib并了解如何应用它解决包括分类、推荐,以及其