
本书以项目实践作为主线,结合必需的理论知识,以任务的形式进行内容设计,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及Spark基本原理、基于IDEA搭建Spark开发环境、RDD基本原理、Spark SQL基本操作流程、电商业务系统的基本流程、电商用户行为分析的基本指标以及分析过程、通过不同的维度对销售数据进行分析、通过不同的维度对订单数据进行分析以及常用的可视化分析图表的应用场景等。
本书适合需要使用Spark进行大数据处理的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校本科生和研究生的教材。
刘均,高级实验师、高级技师、教育部课程思政教学名师、全国职业院校技能大赛优秀指导教师、重庆市黄大年教学团队成员、重庆市高职院校1+X证书学习成果专业认证委员会专家、云计算1+X中级讲师、网络工程师、国家职业技能鉴定中心考评员、重庆市政府采购评审专家;主要研究方向为计算机实验实训教学、云计算运维技术;主要从事大数据、云计算自动运维方面教学工作;参与省部级科研项目《基于运行大数据的工业机器人预测性维护关键技术研究》等项目3项;国家级在线精品课程《云计算之软件定义网络》主要成员,主要讲授《云存储技术》《Python程序设计》《云计算系统框架》等课程。
王璐烽,教授,世界技能大赛中国赛区裁判员、重庆市高校黄大年式教师团队负责人、重庆市高校中青年骨干教师、重庆市高校优秀思想政治工作者;撰写论文20余篇,其中SCI/EI收录或核心期刊10余篇;主编国家十三五规划...