分布式机器学习：算法、理论与实践

Name: 分布式机器学习：算法、理论与实践
Availability: InStock
Rating: 8.7 (146 reviews)
ISBN: 9787111609186

刘铁岩

出版社

机械工业出版社

出版时间

2018-10-20

ISBN

9787111609186

评分

★★★★★

标签

工业技术

书籍介绍

人工智能和大数据时代，解决最有挑战性问题的主流方案是分布式机器学习！本书旨在全面介绍分布式机器学习的现状，深入分析其中的核心技术问题，并且讨论该领域未来的发展方向。

由微软亚洲研究院机器学习核心团队潜心力作！鄂维南院士、周志华教授倾心撰写推荐序！

本书旨在全面介绍分布式机器学习的现状，深入分析其中的核心技术问题，并且讨论该领域未来的发展方向。

全书共12章。第1章是绪论，向大家展示分布式机器学习这个领域的全景。第2章介绍机器学习的基础知识。第3章到第8章是本书的核心部分，向大家细致地讲解分布式机器学习的框架及其各个功能模块。其中第3章给出整个分布式机器学习框架的综述，而第4章到第8章则分别针对其中的数据与模型划分模块、单机优化模块、通信模块、数据与模型聚合模块加以介绍。接下来的三章是对前面内容的总结与升华。其中第9章介绍由分布式机器学习框架中不同选项所组合出来的各式各样的分布式机器学习算法，第10章讨论这些算法的理论性质，第11章则介绍几个主流的分布式机器学习系统（包括Spark MLlib 迭代式MapReduce系统，Multiverso参数服务器系统，TensorFlow数据流系统）。最后的第12章是全书的结语，在对全书内容进行简要总结之后，着重讨论分布式机器学习这个领域未来的发展方向。

本书基于微软亚洲研究院机器学习研究团队多年的研究成果和实践经验写成，既可以作为研究生从事分布式机器学习方向研究的参考文献，也可以作为人工智能从业者进行算法选择和系统设计的工具书。

人工智能大潮中，市场上已有许多机器学习书籍，但是分布式机器学习的专门书籍还很少见。本书是希望学习和了解分布式机器学习的读者的福音。

刘铁岩

微软亚洲研究院副院长。刘博士的先锋性研究促进了机器学习与信息检索之间的融合，被国际学术界公认为“排序学习”领域的代表人物。近年来在深度学习、分布式学习、强化学习等方面也颇有建树，发表论文200余篇，被引用近两万次。多次获得最佳论文奖、最高引用论文奖、Springer十大畅销华人作者、Elsevier 最高引中国学者等。被聘为卡内基-梅隆大学（CMU）客座教授，诺丁汉大学荣誉教授，中国科技大学教授、博士生导师；被评为国际电子电气工程师学会（IEEE）会士，国际计算机学会（ACM）杰出会员。

陈薇

微软亚洲研究院机器学习组主管研究员，研究机器学习各个分支的理论解释和算法改进，尤其关注深度学习、分布式机器学习、强化学习、博弈机器学习、排序学习等。2011年于中国科学院数学与系统科学研究院获得博士学位，同年加入微软亚洲研究院，负责机器学习理论项目，先...

(展开全部)

精彩摘录

"对模型参数更新进行通信，往往有利于提高分布式机器学习的效率，因为在很多机器学习任务中，参数以及参数的更新任务往往是稀疏的。同时随着模型趋于收敛，参数的更新也会越来越小，另外可以使用量化或者过滤的方法进一步减少通信数据量。"
"如果每个小批量训练的计算量很大，而模型规模又不大（CNN），通信开销可以忽略。反之，无法忽略。"
"1.增大size导致方差变小，减少了跳出了局部最优的可能。实现了尖锐的局部最优，但是更加精确，所以可以增加学习率，逐步增大学习率。 2.减小，会导致收敛到平坦的局部最优，平坦区域泛化能力更强 3."
"模型划分的随机划分手段：规模更小的骨架网络，骨架网络存在于每个工作节点，传输非骨架结构的参数，探索全局的结构。骨架网络的选取可以是周期性更新的，对全局拓扑结构的探索也是动态/随机的，大大减小模型并行的通信代价，对模型并行的效果有一定保证。"
"是处理完mini-batch之后开始通信还是全部本地数据处理完之后通信？通信的收发频率是否需要一致？不同的频率对模型的收敛是否有影响？想要基于计算速度，带宽，数据大小，模型大小，计算出一个最优的通信频率，从而取得计算代价和通信代价的最优匹配。"
"收敛性：不同方法的收敛速度和性质，每个模块对整体的收敛速度产生怎么样的影响，按照优化目标，本地优化算法，并行模式，通信和聚合方式进行归纳加速比：除了与算法的收敛速度有关，还受通信-计算的时间比的影响。还有要实现收敛我们需要的最小通信量也是可以研究的方向。泛化性质"
"Caffe2中的gloo通信库实现了自定制的AllReuce功能，百度的DeepSpeech系统采用了环状的AllReduce功能，Nvidia提供的集合通讯库NCCL中有AllReduce的原语"
"CMU的Parameter Server和Petuum谷歌的DistBelief和微软的DMTK/Multiverso"

作者简介

刘铁岩微软亚洲研究院副院长。刘博士的先锋性研究促进了机器学习与信息检索之间的融合，被国际学术界公认为“排序学习”领域的代表人物。近年来在深度学习、分布式学习、强化学习等方面也颇有建树，发表论文200余篇，被引用近两万次。多次获得最佳论文奖、最高引用论文奖、Springer十大畅销华人作者、Elsevier 最高引中国学者等。被聘为卡内基-梅隆大学（CMU）客座教授，诺丁汉大学荣誉教授，中国科技大学教授、博士生导师；被评为国际电子电气工程师学会（IEEE）会士，国际计算机学会（ACM）杰出会员。陈薇微软亚洲研究院机器学习组主管研究员，研究机器学习各个分支的理论解释和算法改进，尤其关注深度学习、分布式机器学习、强化学习、博弈机器学习、排序学习等。2011年于中国科学院数学与系统科学研究院获得博士学位，同年加入微软亚洲研究院，负责机器学习理论项目，先后在NIPS、ICML、AAAI、IJCAI等相关领域顶级国际会议和期刊上发表文章30余篇。王太峰蚂蚁金服人工智能部总监、资深算法专家。在蚂蚁金服负责AI算法组件建设，算法工作服务于蚂蚁金服的支付、国际、保险等多条业务线。在加入蚂蚁之前在微软亚洲研究院工作11年，任主管研究员，他的研究方向包括大规模机器学习、数据挖掘、计算广告学等。在国际顶级的机器学习会议上发表近20篇的论文，在大规模机器学习工具开源方面也做出过很多贡献，在微软期间主持开发过DMTK的开源项目。高飞微软亚洲研究院副研究员，主要从事分布式机器学习和深度学习的研究工作，并在国际会议上发表多篇论文。2014年设计开发了当时规模最大的主题模型算法和系统LightLDA。他还开发了一系列分布式机器学习系统，并通过微软分布式机器学习工具包（DMTK）开源在GitHub上。

序言一

序言二

前　言

作者介绍

第1章　绪论/ 1

显示全部

用户评论

不错的一本综述，特别是有关通信模型的讨论，这方面的综述资料比较少

真的是如楼上的人吐槽的那样，这真实一本神奇的书，看的懂的部分不需要看，看不懂的部分看了也白看。里面涉及到公式的部分有中国人写书的自带的臭毛病，就是只丢公式和定理不告诉你符号代表啥意思。感觉智商受到了侮辱，可能还是需要看原始论文吧，而且这块的书其实不是很多，自己看完确实也有些收获，打个四星吧，推荐想了解参数服务器的小伙伴看看，这里面涉及到的很多门道，虽然不可能仅凭这本书把书上写的东西都搞清楚，不过即便没全搞清楚，作为了解parameter server架构中的大致内容和一定深度的知识结构，这本书还是能够完成使命的。

只能当paper索引么？

懂得不看，看过的没实践过也不懂

算法工程师必读，深入了解可参考附录文献

挂名的书

在出版的2018年这个时间点上，似乎这本书作为一个综述还凑合，但到了2022年，很多内容确实已经有点陈旧了，整个领域发展日新月异（最近的 GShard/pathway、actor自动流水 etc.）。整本书在内容排布上有些令人难以接收的问题，比如有很多文字一看就是跨章节复制的，有赶工之嫌。而且用了很大的篇幅（第四、五章）讲了单机的确定性优化与随机优化算法，看起来只是为了到第十章证明几个凸优化bound。理解第十章那个东西又还需要很多背景知识，光是第四、五章又不够。其他章节的优化方法又都是SGD...如果没有特别的兴趣，建议直接跳过四、五、十章，不会对本书的价值有任何影响。

建议只看第三章和六七八九章，以上

挺失望的，第三章及所有挺泛泛的，且前后重复内容很多

机械工业出版社的其他书籍查看全部

下载