Deep Learning

Ian Goodfellow, Yoshua Bengio, Aaron Courville, 约书亚·本吉奥

出版社

The MIT Press

出版时间

2016-11-11

ISBN

9780262035613

评分

★★★★★
书籍介绍
"Written by three experts in the field, Deep Learning is the only comprehensive book on the subject." -- Elon Musk, co-chair of OpenAI; co-founder and CEO of Tesla and SpaceX Deep learning is a form of machine learning that enables computers to learn from experience and understand the world in terms of a hierarchy of concepts. Because the computer gathers knowledge from experience, there is no need for a human computer operator to formally specify all the knowledge that the computer needs. The hierarchy of concepts allows the computer to learn complicated concepts by building them out of simpler ones; a graph of these hierarchies would be many layers deep. This book introduces a broad range of topics in deep learning. The text offers mathematical and conceptual background, covering relevant concepts in linear algebra, probability theory and information theory, numerical computation, and machine learning. It describes deep learning techniques used by practitioners in industry, including deep feedforward networks, regularization, optimization algorithms, convolutional networks, sequence modeling, and practical methodology; and it surveys such applications as natural language processing, speech recognition, computer vision, online recommendation systems, bioinformatics, and videogames. Finally, the book offers research perspectives, covering such theoretical topics as linear factor models, autoencoders, representation learning, structured probabilistic models, Monte Carlo methods, the partition function, approximate inference, and deep generative models. Deep Learning can be used by undergraduate or graduate students planning careers in either industry or research, and by software engineers who want to begin using deep learning in their products or platforms. A website offers supplementary material for both readers and instructors.
AI导读
核心看点
  • 三位领域专家合著,系统阐述深度学习数学与概念基础
  • 涵盖线性代数、概率论及各类深度学习算法原理
  • 提供海量参考文献,是深度学习领域的权威百科全书
适合谁读
  • 具备统计学与线性代数基础的计算机专业学生
  • 从事人工智能与机器学习研究的科研人员
  • 希望深入理解算法原理而非仅调参的开发者
读前提醒
  • 建议配合GitHub开源中文译本对照阅读
  • 数学推导跳跃性强,需耐心查阅补充资料
  • 不适合作为零基础入门教材,需一定前置知识
读者共识
  • 内容全面权威,但理论枯燥,不适合新手自学
  • 相比PRML,数学公式较少,文字描述易让人迷失
  • 作为工具书查阅极佳,需反复阅读才能消化

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "Noise injection also works when the noise is applied to the hidden units, which can be seen as doing dataset augmentation at multiple levels of abstraction. Poole et al. (2014) recently showed that this approach can be highly effective provided that the magnitude of the noise is carefully tuned. Dro"
  • "层次:让计算机从经验中学习,并根据层次化的概念体系来理解世界,而每个概念则通过与某些相对简单的概念之间的关系来定义。 这些机器学习算法的性能在很大程度上依赖给定数据的表示。然而,对于许多人物来说,我们很难知道应该提取哪些特征。解决这个问题的途径之一是使用机器学习来发掘表示本身,二不仅仅把表示映射到输出。这种方法我们称之为表示学习。 深度学习通过其他较简单的表示来表达复杂表示,解决了表示学习中的核心问题。 就像计算机程序的长度不存在单一的正确值一样,架构的深度也不存在单一的正确值。 控制论Cybernetics,联结主义Connnectionism,深度学习Deep Learning。 先行模型"
  • "不确定性有3种可能的来源 (1)被建模系统内在的随机性。例如,大多数量子力学的解释,都将亚原子粒子的动力描述为概率的。我们还可以创建一些假设具有随机动态的理论情境,例如一个假想的纸牌游戏,在这个游戏中,我们假设纸牌被真正混洗成了随机顺序。 (2)不完全观测。即使是确定的系统,当我们不能观测到所有驱动系统行为的变量时,该系统也会呈现随机性。例如,在 Monty Hall问题中,一个游戏节目的参与者被要求在3个门之间选择,并且会赢得放置在选中门后的奖品。其中两扇门通向山羊,第第3扇扇门通向一辆汽车。选手的每个选择所导致的结果是确定的,但是站在选手的角度,结果是不确定的。 (3)不完全建模。当我们使"
  • "Examples of learning algorithms based on non-distributed representations include:"
  • "For some of these non-distributed algorithms, the output is not constant by parts but instead interpolates between neightboring regions."
  • "第一,我们想要建模的很多分布的真实情况是比较接近正态分布的。中心极限定理说明很多独立随机变量的和近似服从正态分布。这意味着在实际中,很多复杂系统都可以被成功地建模成正态分布的噪声,即使系统可以被分解成一些更结构化的部分。 第二,在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。因此,我们可以认为正态分布是对模型加入的先验知识最少的分布。"
  • "尽管我们的确需要一种用以对不确定性进行表示和推理的方法,但是概率论并不能明显地提供我们在人工智能领域需要的所有工具。概率论最初的发展是为了分析事件发生的频率我们可以很容易地看出概率论,对于像在扑克牌游戏中抽出一手特定的牌这种事件的研究中是如何使用的。这类事件往往是可以重复的。当我们说一个结果发生的概率为p,这意味着如果我们反复实验(例如,抽取一手牌)无限限次,有p的比例可能会导致这样的结果。 这种推理似乎并不立即适用于那些不可重复的命题。如果一个医生诊断了病人,并说该病人患流感的概率为40%,这意味着非常不同的事情一一我们既不能让病人有无穷多的副本,也没有任何理由去相信病人的不同副本在具有不同"
  • "大多数哺乳动物的大脑使用单一的算法就可以解决大部分不同任务 分布式表示:可以用不同的神经元来识别不同的东西,比如三个神经元描述颜色,三个神经元描述对象身份"
作者简介
Ian Goodfellow is Research Scientist at OpenAI. Yoshua Bengio is Professor of Computer Science at the Université de Montréal. Aaron Courville is Assistant Professor of Computer Science at the Université de Montréal.
目录
Acknowledgments xv
Notation xix
1 Introduction 1
1.1 Who Should Read This Book? 8
1.2 Historical Trend sin Deep Learning 12

显示全部
用户评论
三个星期读完了第一遍,有很多切入角度不错,有很多地方看不懂,需要读论文,抽空再刷一遍
非常好的一本书,每个从业者都该看看
读的中文版:https://github.com/exacity/deeplearningbook-chinese 第三部分还没读下去,深觉数学不够 含金量台高,7,8,11三章真是调参的人森经验了
工具书,不适合新人自学。part1基础知识可以快速阅读过一遍,part2和part3不适合新手直接看。斯坦福cs231n是最好的深度学习资料。
读完第一部分和最后部分无监督学习的章节。读了一年终于读完了😊
https://www.deeplearningbook.org/
花书极妙,但太过细致,难以通读…准备下学期组织个小研讨会一起推一遍。
yyds
好书不厌百回读。特别是想了解的更深入。
好书,前面写得很好,读得也很爽;最后三章本人数学水平有限,怒弃 【补标】终于看完了,功德圆满
收藏