数据科学实战入门 使用Python和R - [法] 尚塔尔·D·拉罗斯(Chantal D. Larose),

数据科学实战入门 使用Python和R

[法] 尚塔尔·D·拉罗斯(Chantal D. Larose),

出版时间

2020-07-01

ISBN

9787302553793

评分

★★★★★
书籍介绍

《数据科学实战入门 使用Python和R》一书将使你深入了解数据科学最流行的两大开源平台:Python和R。

当前数据科学非常热门。Python和R是世界更流行的两个开源数据科学工具。在本书中,你将逐步学习如何使用更先进的技术,针对现实世界的业务问题提供切实可行的解决方案。

本书为没有数据分析和编程经验的读者编写。第1章专门为初学者讲解Pyhton和R的基础知识。此后的每一章都提供了使用Python和R解决数据科学问题的分步说明和实践演练。

对于那些有数据分析经验的读者而言,他们将一站式学习如何使用Python和R进行数据科学实践。本书的主题涵盖数据准备、探索性数据分析、准备建模数据、决策树、模型评估、错误分类代价、朴素贝叶斯分类、神经网络、聚类、回归建模、降维和关联规则挖掘。此外,本书还包含一些令人兴奋的新主题,如随机森林和广义线性模型。

本书在每章的结尾提供了大量的练习,共有500多道习题。通过实践性的分析习题,读者将能轻松应对使用真实数据集解决有趣业务问题的挑战。

内容组织

《数据科学实战入门 使用Python 和R》一书基于数据科学方法论进行内容的组织。数据科学方法是一种在科学框架体系内进行数据分析的阶段性、自适应和迭代式方法。

1. 问题理解阶段。首先,需要清晰地阐明项目目标;然后将这些目标转化为一种可以用数据科学解决的问题。

2. 数据准备阶段。数据清洗/准备阶段很可能是整个数据科学处理过程中最费力气的阶段。

● 相关内容参见第3 章:“数据准备”。

3. 探索性数据分析阶段。在此阶段通过图形化探索方法获得对数据的初步认识。

● 相关内容参见第4 章:“探索性数据分析”。

4. 设置阶段。建立数据模型的性能基准,如果需要,可以对数据进行分割和平衡处理。

● 相关内容详见第5 章:“为建模数据做准备”。

5. 建模阶段。建模阶段是数据科学研究过程的核心,在此阶段应用各种先进的算法来发现隐藏在数据中的一些确实具有价值的关系。

● 相关内容参见第6 章以及第8~14 章。

6. 评估阶段。确定设计的模型是否有价值,在此阶段需要从一系列可选的模型中选择性能更佳的模型。

● 相关内容参见第7 章:“模型评估”。

7. 部署应用阶段。在此阶段需要与管理层协作来调整模型以适应实际部署。

Chantal D. Larose博士是东康涅狄格州立大学(ECSU)统计学与数据科学的助理教授。她已经参与撰写了三本有关数据科学和预测性分析的著作,并在ECSU和纽约州立大学新帕尔兹分校(SUNY New Paltz)参与开发了数据科学相关程序。

Daniel T. Larose博士是中央康涅狄格州立大学数据科学和统计学的教授,数据科学项目主任。他在数据科学、数据挖掘、预测性分析和统计学方面出版了多本著作。

目录
第1章 数据科学导引 1
1.1 为何学习数据科学 1
1.2 何为数据科学 1
1.3 数据科学方法论 2
1.4 数据科学任务 5

显示全部
收藏