这本书的目的是帮助所有人通过R使用Apache Spark。第1章~第5章，简单地介绍了如何大规模执行数据科学和机器学习项目。第6~9章介绍了使用Spark进行集群计算中令人激动的基本概念。第10章~第13章涵盖一些高级主题，包括分布式R、Streaming和社区贡献等。

Javier Luraschi是大规模数据科学诸多库的发明者，包括sparklyr、r2d3、pins和cloudml。
Kevin Kuo构建了机器学习库，并领导了Kasa AI的开放保险研究。
Edgar Ruiz构建了企业级的数据解决方案工具，包括dbplot、tidypredict和modeldb。

大规模数据分析和建模：基于Spark与R

AI超级个体：打造不可替代的个人品牌    元宇宙公主  人工智能应用徐旦

ADHD大脑使用说明书

走出洞穴

解决问题的流程

人生定位

没有不好的你

动态专注力

营销罗盘

Go语言学习指南：惯例模式与编程实践 (原书第2版)

CCF 信息学奥赛基础篇

《大规模数据分析和建模：基于Spark与R》 - [美] 哈维尔·卢拉辛,[美] 凯文·郭,[美] 埃德加·鲁伊斯 | 无名图书

WebKit