机器学习 - (美)Drew Conway

机器学习

(美)Drew Conway

出版时间

2013-04-01

ISBN

9787111417316

评分

★★★★★
书籍介绍

这本书为机器学习技术提供了一些非常棒的案例研究。它并不想成为一本关于机器学习的工具书或者理论书籍,它注重的是一个学习的过程,因而对于任何有一些编程背景和定量思维的人来说,它都是不错的选择。

——Max Shron OkCupid

机器学习是计算机科学和人工智能中非常重要的一个研究领域,近年来,机器学习不但在计算机科学的众多领域中大显身手,而且成为一些交叉学科的重要支撑技术。本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。

全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市场指数,空间相似度:用投票记录对美国参议员聚类,推荐系统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种用于数据分析的高水平、功能性脚本语言。

本书主要内容:

·开发一个朴素贝叶斯分类器,仅仅根据邮件的文本信息来判断这封邮件是否是垃圾邮件;

·使用线性回归来预测互联网排名前1000网站的PV;

·利用文本回归理解图书中词与词之间的关系;

·通过尝试破译一个简单的密码来学习优化技术;

·利用无监督学习构建股票市场指数,用于衡量整体市场行情的好坏;

·根据美国参议院的投票情况,从统计学的角度对美国参议员聚类;

·通过K近邻算法构建向用户推荐R语言包;

·利用Twitter数据来构建一个“你可能感兴趣的人”的推荐系统;

·模型比较:给你的问题找到最佳算法。

目录
前言 1
第1章 使用R语言 9
R与机器学习 10
第2章 数据分析 36
分析与验证 36

显示全部
用户评论
2018-10
书名应该改,改成 R语言统计学的实用案例解析
。。。
基本没怎么看懂,
基本上把代码试了一遍,虽然英文名字里面有个hacker,但里面讲的东西倒是step by step ,适合入门,里面对机器学习讲的不多,主要讲了回归,分类,聚类,最后还捎着讲了SVM,基于R的实操,亲手试一下,有好处的。
适合用R语言入门,相当于手把手教怎么应用,不讲原理,翻译有些小错误
感觉厉害
全书12章 没找到数据代码下载地址 只是看文字介绍了 对R语言有了更深的理解 R语言是统计学家开发出来的语言 在进行机器学习时 速度比较慢
面对现实中的一个真实问题,尝试一下多个算法,并比较它们的效果是一个好主意,因为你通常并不知道什么算法在你的数据集上表现最好。而且在机器学习领域,一个菜鸟和一个专家之间的一个重要差别,就在于后者知道某些特定的问题不适合某些算法。为了培养一个机器学习领域专家那样的直觉,最好的办法就是,对你遇到的每一个机器学习问题,把所有的算法试个遍,直到有一天,你凭直觉就知道某些算法行不通。 1)面对实际数据集,你应该尝试多个不同的算法,更何况它们用R语言来实现又那么方便;2)没有所谓通用的“最优”算法,“最优”取决于具体的问题;3)你的模型效果一方面取决于真实的数据结构,另一方面也取决于你为模型的超参数调优所付出的努力,因此,如果你想得到令人信服和满意的结果,多花一点时间在模型的超参数调优上吧。
翻译一般,算法讲得浅,适合没有统计基础的朋友,案例不错。
下载
收藏