大规模数据分析和建模:基于Spark与R

[美] 哈维尔·卢拉辛, [美] 凯文·郭, [美] 埃德加·鲁伊斯

出版时间

2022-02-01

ISBN

9787111661016

评分

★★★★★
书籍介绍
这本书的目的是帮助所有人通过R使用Apache Spark。第1章~第5章,简单地介绍了如何大规模执行数据科学和机器学习项目。第6~9章介绍了使用Spark进行集群计算中令人激动的基本概念。第10章~第13章涵盖一些高级主题,包括分布式R、Streaming和社区贡献等。 Javier Luraschi是大规模数据科学诸多库的发明者,包括sparklyr、r2d3、pins和cloudml。 Kevin Kuo构建了机器学习库,并领导了Kasa AI的开放保险研究。 Edgar Ruiz构建了企业级的数据解决方案工具,包括dbplot、tidypredict和modeldb。
目录
O’Reilly Media,Inc.介绍
译者序
序言
前言
第1章 引言

显示全部
收藏