机器学习:软件工程方法与实现

张春强

出版时间

2020-12-06

ISBN

9787111669227

评分

★★★★★
书籍介绍

这是一部指导读者如何将软件工程的思想、方法、工具和策略应用到机器学习实践中的著作。

作者融合了自己10年的工程实践经验,以Python为工具,详细阐述机器学习核心概念、原理和实现,并提供了数据分析和处理、特征选择、模型调参和大规模模型上线系统架构等多个高质量源码包和工业应用框架。旨在帮助读者提高代码的设计质量和机器学习项目的工程效率。

全书共16章,分为4个部分:

第壹部分 工程基础篇(1~3)

介绍了机器学习和软件工程的融合,涉及理论、方法、工程化的数据科学环境和数据准备;

第二部分 机器学习基础篇(4~5)

讲述了机器学习建模流程、核心概念,数据分析方法;

第三部分 特征篇(6~8)

详细介绍了多种特征离散化方法和实现、特征自动衍生工具和自动化的特征选择原理与实现;

第四部分 模型篇(9~16)

首先,深入地剖析了线性模型、树模型和集成模型的原理,以及模型调参方法、自动调参、模型性能评估和模型解释等;然后,通过5种工程化的模型上线方法讲解了模型即服务;*后,讲解了模型的稳定性监控的方法与实现,这是机器学习项目的最后一环。

张春强

是一位具有3年C/C++、7年大数据和机器学习经验且富有创造力的技术专家,在技术一线摸爬滚打近10年,先后就职于大型IT、世界500强企业,目前就职于某大型金融科技集团,负责数据挖掘、机器学习相关工作的管理和研发。时隔5年,他再次为读者书写了一本技术专著。

张和平

现就职于某互联网金融集团科技公司,任大数据模型工程师,负责机器学习在金融风控和用户运营方面的应用工作,善于运用机器学习、数据挖掘、知识图谱和大数据技术解决实际的业务问题。在大数据风控建模、用户画像、大数据平台建设等方面有丰富的实践经验。

作者简介
张春强 是一位具有3年C/C++、7年大数据和机器学习经验且富有创造力的技术专家,在技术一线摸爬滚打近10年,先后就职于大型IT、世界500强企业,目前就职于某大型金融科技集团,负责数据挖掘、机器学习相关工作的管理和研发。时隔5年,他再次为读者书写了一本技术专著。 张和平 现就职于某互联网金融集团科技公司,任大数据模型工程师,负责机器学习在金融风控和用户运营方面的应用工作,善于运用机器学习、数据挖掘、知识图谱和大数据技术解决实际的业务问题。在大数据风控建模、用户画像、大数据平台建设等方面有丰富的实践经验。
目录
前言
第一部分 工程基础篇
第1章 机器学习软件工程方法 2
1.1 机器学习简述 2
1.1.1 机器学习与人工智能、深度学习等的关系 2

显示全部
用户评论
骗钱小团队又一力作,等一群小号刷评分。抄10手博客,抄文档,10年经验的作者35没工作了是不是只能抄书混日子,还是领导接私活让手下写,你们不忙么,现在出书挣钱么简介这么好干点别的呗 ##来了来了他来了,你猜猜我怎么关注这本书的呢?##指出来抄袭给红包的话,现在给您指出来十处
作为一本机器学习书籍,这本书最大的特点是“脚踩两只船”。如果是谈恋爱的话,对方“脚踩两只船”绝对不是一件好事,但是如果是一本书的话,“脚踩两只船”很可能不是一件坏事。尤其是当作者的“脚踩两只船”是指不走寻常路,别出心裁地从两个甚至多个维度融合的角度阐述一个主题的话,这种“脚踩两只船”往往是一件好事,这种视角往往很独特,很新鲜,可以让读者领略到单一维度无法呈现的景象。 这本书就是如此,脚踩了两只船而且踩得还不错,一是在机器学习类书籍中这么踩得人很少,所以作者只要一踩,就踩出了陌生感,踩出了新鲜感,踩成了特色。二是脚踩两只船着实是个技术活儿,有难度,不好踩,稍有不慎就掉水里了。理论技术与工程实践这两条船也同样不好踩,(后文见所在正文)
不懂python只能看懂30%
深入浅出,从实战出发,有原理有工程,适合入门学习。
深入浅出,还有代码配套,值得一读
本书从软件工程的角度,结合实际工作场景,客观的展示实际数据挖掘工作的完整流程,并提供相关源码包开箱即用,非常实用。 对于初学者建议学习理论书籍的同时,参考本书的流程完成一次数据挖掘全流程的软件开发体验,这样学习理论知识才能在应用和实践中加深理解。
教你:用软件工程/项目视角管理机器学习项目、做数据分析选变量、衍生特征,怎么选重要特征;教你算法调参不再是调包侠、解释哪些特征重要、部署模型提供线上生产服务,上线后的模型监控和重训/重构,全流程的闭环机器学习。Github脚本近5万行
收藏