书籍介绍

人工智能（AI），尤其是生成式语言模型和生成式人工智能（AIGC）模型，正以惊人的速度改变着我们的世界。驾驭这股潮流的关键，莫过于探究自然语言处理（NLP）技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅，让其亲身感受，并动手搭建语言模型。本书主要内容包括N-Gram，词袋模型（BoW），Word2Vec（W2V），神经概率语言模型（NPLM），循环神经网络（RNN），Seq2Seq（S2S），注意力机制，Transformer，从初代GPT到ChatGPT再到GPT-4等一系列突破性技术的诞生与演进。

本书将以生动活泼的笔触，将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画，引领读者穿梭于不同技术的时空，见证自然语言处理技术的传承、演进与蜕变。在这场不断攀登技术新峰的奇妙之旅中，读者不仅能深入理解自然语言处理技术的核心原理，还能自己动手，从零开始搭建起一个又一个语言模型。

无论你是在校学生还是人工智能从业者，这本书都将成为一盏明灯，照亮你探索人工智能无限奥秘的道路。

黄佳，笔名咖哥，新加坡科技研究局人工智能研究员。主攻方向为 NLP 大模型的研发与应用、持续学习、AI in FinTech。黄佳深耕人工智能领域多年，积累了丰富的科研项目和政府、银行、能源、医疗等领域 AI 项目落地实战经验，目前正与 PlatoX.AI 展开富有前景的技术合作。曾著有《零基础学机器学习》《数据分析咖哥十话》等多部畅销书。同时，在极客时间开设专栏《零基础实战机器学习》《LangChain 实战课》，在深蓝学院开设视频课程“生成式预训练语言模型：理论与实战”。

精彩摘录

"从NPLM到Seq2Seq，NLP研究人员不断探索更有效的建模方法来捕捉自然语言的复杂性。 NPLM使用神经网络来学习词嵌入表示，并预测给定上文的下一个词。NPLM用连续向量表示词，捕捉到了单词之间的语义和语法关系。尽管NPLM性能有所提高，但仍然存在一些局限性，例如上下文窗口的大小是固定的。为了解决上下文窗口大小固定的问题，研究人员开始使用RNN来处理可变长度的序列。RNN可以在处理序列时保持内部状态，从而捕捉长距离依赖关系。然而，RNN在训练中容易出现梯度消失和梯度爆炸问题。为了解决梯度消失和梯度爆炸问题，LSTM和GRU等门控循环单元被提出。它们引入了门控机制，可以学习长距离依赖关系"

作者简介

黄佳，笔名咖哥，新加坡科技研究局人工智能研究员。主攻方向为 NLP 大模型的研发与应用、持续学习、AI in FinTech。黄佳深耕人工智能领域多年，积累了丰富的科研项目和政府、银行、能源、医疗等领域 AI 项目落地实战经验，目前正与 PlatoX.AI 展开富有前景的技术合作。曾著有《零基础学机器学习》《数据分析咖哥十话》等多部畅销书。同时，在极客时间开设专栏《零基础实战机器学习》《LangChain 实战课》，在深蓝学院开设视频课程“生成式预训练语言模型：理论与实战”。

序章　看似寻常最奇崛，成如容易却艰辛　001

GPT-4：点亮人工通用智能的火花　002

人工智能演进之路：神经网络两落三起　004

现代自然语言处理：从规则到统计　007

何为语言？信息又如何传播？　008

显示全部

用户评论

书没有很长，有大量的图解，理解起来也还好，但我不是相关从业者，就当成科普来看了

本书以“古诗词+章节内容”的形式为每个讲解不同语言模型的篇章命名，多为古诗词的改编，加上暗喻，用字数简短但是意蕴深厚的古诗词提炼大模型的特征、语言模型的发展脉络，让知识点直观、易懂、易记。

这本书很不错。

我想说我很喜欢佳哥书中章回体小说的章节标题，同时书中的配图对于我学习理解相关技术起到了很大的帮助。

看了黄佳大咖的这本新作，让我对GPT有了新的认识，人工智能一直是计算机从业者们的梦想，从无到有，经历坎坷，现今众多厂家公司开发人工智能技术，让人类更加轻松便捷使用我们的各类电子设备，加上大数据，让人工智能更加精准安全。