机器学习实战 - Peter Harrington

机器学习实战

Peter Harrington

出版时间

2013-05-31

ISBN

9787115317957

评分

★★★★★
书籍介绍

机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。

本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

AI导读
核心看点
  • 以Python代码为核心,摒弃晦涩数学公式,通过实例演示机器学习算法实现。
  • 涵盖K近邻、决策树、逻辑回归、SVM、AdaBoost等经典监督与无监督学习算法。
  • 提供从数据准备、分析到可视化的完整流程,帮助读者理解算法底层逻辑与应用。
适合谁读
  • 具备Python基础,希望快速入门机器学习并理解算法代码实现的初学者。
  • 对数学推导感到畏惧,更倾向于通过动手编码来学习机器学习的实践者。
  • 需要补充机器学习基础概念,并寻找具体案例参考的开发者或学生。
读前提醒
  • 书中理论讲解较浅,建议搭配《统计学习方法》等理论书籍对照阅读。
  • 原书代码基于Python 2,阅读时需注意语法差异,建议参考社区提供的Python 3版本。
  • 代码风格较为随意,变量命名不规范,阅读时需耐心理解逻辑,勿直接用于生产。
读者共识
  • 被公认为机器学习入门佳作,适合零基础或数学基础薄弱者快速上手。
  • 普遍反映代码质量一般,注释少且变量名缩写多,阅读体验较差。
  • 理论深度不足,部分算法原理讲解缺失,不适合追求深入理论研究的读者。

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "Pros: High accuracy, insensitive to outliers, no assumptions about data Cons: Computationally expensive, requires a lot of memory Works with: Numeric values, nominal values The first machine-learning algorithm we’ll look at is k-Nearest Neighbors (kNN). It works like this: we have an existing set of"
  • "Pros: Computationally cheap to use, easy for humans to understand learned results, missing values OK, can deal with irrelevant features Cons: Prone to overfitting Works with: Numeric values, nominal values"
  • "General approach to decision trees 1. Collect: Any method. 2. Prepare: This tree-building algorithm works only on nominal values, so any continuous values will need to be quantized. 3. Analyze: Any method. You should visually inspect the tree after it is built. 4. Train: Construct a tree data struct"
  • "Logistic regression Pros: Computationally inexpensive, easy to implement, knowledge representation easy to interpret Cons: Prone to underfitting, may have low accuracy Works with: Numeric values, nominal values"
  • "The clear syntax of Python has earned it the name executable pseudo-code."
  • "With Python, you can program in any style you’re familiar with: object-oriented, procedural, functional, and so on."
  • "With Python it’s easy to process and manipulate text"
  • "Python is popular in the scientific and financial communities as well.A number of scientific libraries such as SciPy and NumPy allow you to do vector and matrix operations."
作者简介
Peter Harrington 拥有电气工程学士和硕士学位,他曾经在美国加州和中国的英特尔公司工作7年。Peter拥有5项美国专利,在三种学术期刊上发表过文章。他现在是Zillabyte公司的首席科学家,在加入该公司之前,他曾担任2年的机器学习软件顾问。Peter在业余时间还参加编程竞赛和建造3D打印机。
目录
目 录
第一部分 分类
第1章 机器学习基础  2
1.1  何谓机器学习  3

显示全部
用户评论
代码质量不行,感觉这作者 Python 水平太一般。当作入门读物还不错。
介绍机器学习的入门书,使用Python实现。示范的例子都挺有趣的,比如国会选举、twitter数据的分析。算法的覆盖面挺广,可惜原理的讲解有些浅,因此需要一些基础知识。书中没有神经网络算法的介绍,有些遗憾。
例子给出的代码很差,丝毫不考虑读者的感受。
处于原理和直接sdk之间的自己实现算法. 不去看数学原理的书, 看这个真的没什么用.
我。终于把所有的代码都写了一遍!结果发现软肋是数学,又要开始恶补数学了!
用python实现基础学习算法,比较直观,偏重机器的部分。
很棒
偏重于实战的书,入门是一个不错的选择~
看了这么多评论后,发现自己学不会可以赖书质量对我真是莫大安慰。。
适合入门
下载
收藏