PySpark实战指南 - Tomasz Drabas

PySpark实战指南

Tomasz Drabas

出版时间

2017-11-14

ISBN

9787111582380

评分

★★★★★
书籍介绍

本文从Spark的基本特点出发,借助大量例子详细介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。

作者:(美)托马兹·卓巴斯 作者:丹尼·李 译者:栾云杰 译者:陈瑶 译者:刘旭斌

托马兹·卓巴斯(Tomasz Drabas),微软数据科学家,他拥有超过13年的数据分析经验。托马兹每天都和大数据打交道,解决机器学习问题(如异常检测、流失预测),并使用Spark进行模式识别。丹尼·李(Denny Lee),微软Azure DocumentDB团队的首席项目经理。他是一个经验丰富的分布式系统和数据科学工程师,拥有超过18年的经验,擅长开发互联网级别基础架构、数据平台和预测分析系统(包括内部部署和云环境)。

目录
Contents?目 录
译者序
前言
关于作者

显示全部
用户评论
pyspark部分看了些,scala没开始。就是吃了英语差的亏,不然直接官方文档走起了!!190131 实话实说,有点不行,,,钱白花,书白买
还行吧,凑合能看
github上有代码
英文版原书Learning PySpark是一本很好的书,精炼、实用,除了有些代码比较老,但可以从github上更新最新代码。但中文版是什么鬼?这些所谓IBM的研究员确定从事过spark相关的大数据开发工作…………劝你良善,莫看中文。
翻译得实在是太差了。
市面上关于pyspark的书不多,选择余地不大,这本算是还不错的选择,缺点是翻译太差,很多句子不通顺,难理解。
其实我就想知道这是个啥,自己虚拟机配了个pyspark,照着书练一练,目的达到了
下载
收藏