PySpark实战指南

Name: PySpark实战指南
Availability: InStock
ISBN: 9787111582380

Tomasz Drabas

出版社

机械工业出版社

出版时间

2017-11-14

ISBN

9787111582380

评分

★★★★★

书籍介绍

本文从Spark的基本特点出发，借助大量例子详细介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。

作者:(美)托马兹·卓巴斯作者:丹尼·李译者:栾云杰译者:陈瑶译者:刘旭斌

托马兹·卓巴斯(Tomasz Drabas)，微软数据科学家，他拥有超过13年的数据分析经验。托马兹每天都和大数据打交道，解决机器学习问题（如异常检测、流失预测），并使用Spark进行模式识别。丹尼·李(Denny Lee)，微软Azure DocumentDB团队的首席项目经理。他是一个经验丰富的分布式系统和数据科学工程师，拥有超过18年的经验，擅长开发互联网级别基础架构、数据平台和预测分析系统（包括内部部署和云环境）。

Contents?目录

译者序

序

前言

关于作者

显示全部

用户评论

pyspark部分看了些，scala没开始。就是吃了英语差的亏，不然直接官方文档走起了！！190131 实话实说，有点不行，，，钱白花，书白买

还行吧，凑合能看

github上有代码

英文版原书Learning PySpark是一本很好的书，精炼、实用，除了有些代码比较老，但可以从github上更新最新代码。但中文版是什么鬼？这些所谓IBM的研究员确定从事过spark相关的大数据开发工作…………劝你良善，莫看中文。

翻译得实在是太差了。