书籍 Python数据分析与挖掘实战(第2版)的封面

Python数据分析与挖掘实战(第2版)

张良均

出版时间

2019-12-01

ISBN

9787111640028

评分

★★★★★
书籍介绍

本书是Python数据分析与挖掘领域的公认的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。

作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。

全书共13章,分为三个部分,从技术理论、工程实践和进阶提升三个维度对数据分析与挖掘进行了详细的讲解。

第一部分 基础篇(第1~5章)

主要讲解了Python数据分析与挖掘的工具和技术理论,包括数据挖掘的基础知识、Python数据挖掘与建模工具、数据挖掘的建模过程,以及挖掘建模的常用算法和原理等内容。

第二部分 实战篇(第6~12章)

通过工程实践案例讲解了数据挖掘技术在金融、航空、零售、能源、制造、电商等行业的应用。在案例组织结构上,本书按照“介绍案例背景与挖掘目标→阐述分析方法与过程→完成模型构建”的顺序进行,在建模过程关键环节,穿插程序实现代码。最后,通过上机实践加深对案例应用中的数据挖掘技术的理解。

第三部分 提高篇(第13章)

重点讲解了基于Python引擎的开源数据挖掘建模平台(TipDM)的功能和使用方法,以航空公司客户价值分析为案例,介绍了如何使用该平台快速搭建数据分析与挖掘工程。

本书不仅提供TipDM这样的上机实践环境,而且还提供配套的案例建模数据、Python源代码、教学PPT。

张良均

资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验,擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析,对机器学习等AI技术驱动的数据分析也有深入研究。

为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。

华南师范大学、中南财经政法大学、广东工业大学、西安理工大学、广西科技大学、重庆交通大学、桂林电子科技大学等校外硕导或兼职教授。

撰写了《R语言数据分析与挖掘实战》《数据挖掘:实用案例分析》《Hadoop大数据分析与挖掘实战》等10余部畅销书,累计销售超过30万册。

目录
前言
基础篇
第1章 数据挖掘基础 2
1.1 某知名连锁餐饮企业的困惑 2
1.2 从餐饮服务到数据挖掘 4

显示全部
用户评论
哈哈上个学期无聊的时候就看一点…开发智力
内容全面,章节安排合理,个人觉得已经很不错了。但是这本书的难度其实挺大的,全部掌握不容易,需要再好好复习整理。
拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。 纯随机序列又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列。 对于平稳非白噪声序列,它的均值和方差是常数,现已有一套非常成熟的平稳序列的建模方法。通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。ARMA模型是最常用的平稳序列拟合模型。 对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列,这样就可以应用有关平稳时间序列的分析方法,如建立ARMA模型来进行相应的研究。如果一个时间序列经差分运算后具有平稳性,则称该序列为差分平稳序列,可以使用ARIMA模型进行分析。
学完这本书之后会踏实很多
跳了几章自己会用到的全程敲了一遍代码,很多代码已经过时了,会报错。不得不说,文科生没有算法基础看起来真头大,但是个人觉得很多案例挺实用的。
一个小时翻完了案例 RFM,图像用决策树,水流的阈值确认
看完啦!一站式的分析框架应该是应用趋势,未来数据分析应该也会变得像EXCEL一样简单吧。学习的时候在思考某些案例到底有没有分析的必要性,比如热水器用水行为分析的案例,在数据收集、数据预处理方面太繁琐,而且是通过设定一些人为的准则来分析,个人认为还不如做几个问卷调查和访问来得简单和真实。数据分析很多时候只不过是把一些显而易见的定性的结论通过数据表达出来。但不可否认在餐饮行业、电商行业的数据分析确实可以带来定量化的优势。说到底,并不是要盲目地应用数据分析手段,而是要从实际需求出发,解决实际问题,这样才能发挥出数据分析的真正优势。
Z-Library