大模型时代：ChatGPT开启通用人工智能浪潮

Name: 大模型时代：ChatGPT开启通用人工智能浪潮
Availability: InStock
Rating: 8.8 (166 reviews)
ISBN: 9787500173953

龙志勇黄雯

出版社

中译出版社（原中国对外翻译出版公司）

出版时间

2023-04-30

ISBN

9787500173953

评分

★★★★★

书籍介绍

ChatGPT火爆全球，但大语言模型（Large Language Model）才是幕后真正的智能“大脑”！生成式大模型正在开创新的时代，基于生成式预训练大模型的技术突破，也在带来面向个人、深入行业的多重应用。这势必引发新一轮的智力革命和产业重构，构建全新的脑机协作关系。但在同时，与机会如影随形的泡沫也会随之涌现。

为此，本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。本书首先将专业的技术知识通过拟人化的形式进行呈现，生动形象地解释了ChatGPT大模型背后的原理，对这一赋能大模型变革技术与产业的基础能力进行深度剖析；其次，本书以三次工业革命的历史和逻辑作为参照，描绘出大模型将如何驱动社会进入智能革命和脑机协作时代，并为个人和企业应对此次变革提出建议；第三，本书对大模型在知识工作、商业企业、创意娱乐等领域的具体应用进行介绍，总结了企业在自身业务中应用大模型的注意事项和方法论；后，本书对国内外大模型产业的构成和发展进行了分析，并对暗藏泡沫隐患的风险点位做出预警。

龙志勇：曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官，获GMIC“AI Startup Top10”等荣誉，在人工智能、云计算、互联网行业深耕20余年。曾撰文《从<华为的冬天>到AI的冬天》，并有多本畅销译著：《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。

黄雯：互联网大厂高级AI产品经理，曾就职于腾讯和AI创业公司，积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。

AI导读

核心看点

拟人化解析大模型底层技术原理
参照工业革命推演社会变革逻辑
拆解产业生态并预警潜在泡沫

适合谁读

希望快速理解AI技术的非专业读者
关注大模型商业落地与应用的从业者
对智力革命与脑机协作感兴趣的人群

读前提醒

技术篇生动有趣，建议优先阅读
应用篇内容较浅，可快速浏览
结合书中案例思考自身行业影响

读者共识

技术科普部分深入浅出，通俗易懂
变革篇视角独特，启发思考
应用篇质量一般，略显粗糙

本导读基于书籍简介、目录、原文摘录、短评和书评生成，不等同于全文精读。

精彩摘录

"“尝试找到如何让机器使用语言、形成抽象和概念、解决现在人类还不能解决的问题、提升自己，等等。对于当下的人工智能来说，首要问题是让机器像人类一样能够表现出智能。” 一达特茅斯会议对人工智能（AI）的定义"
"大模型是大语言模型（LLM），也是多模态模型，或者是生成式预训练转换模型。GPT是大模型的一种形态，引发了人工智能生成内容（AIGC）技术的质变。大模型是人工智能赖以生存和发展的基础。"
"人工智能的模型，与通常的模型一样，是以数学和统计学为算法基础的算法基础的，可以用来描述一个系统或者一个数据集。在机器学习中，模型是核心概念。模型通常是一个函数或者一组函数，可以是线性函数、非线性函数、决策树、神经网络等各种形式。模型的本质就是对这个函数映射的描述和抽象，通过对模型进行训练和优化，可以得到更加准确和有效的函数映射。建立模型的目的是希望从数据中找出一些规律和模式，并用这些规律和模式预测未来的结果。模型的复杂度可以理解为模型所包含的参数数量和复杂度，复杂度越高，模型越容易过拟合。"
"大模型可以定义为大语言模型，具有大规模参数和复杂网络结构的语言模型。与传统语言模型（如生成性模型、分析性模型、辨识性模型）不同，大语言模型通过在大规模语料库上进行训练来学习语言的统计规律，在训练时通常通过大量的文本数据进行自监督学习，从而能够自动学习语法、句法、语义等多层次的语言规律。如果从人工智能的生成角度定义大模型，与传统的机器学习算法不同，生成模型可以根据文本提示生成代码，还可以解释代码，甚至在某些情况下调试代码。这一过程，不仅可以实现文本、图像、音频、视频的生成，构建多模态，还可以在更为广泛的领域生成新的设计，生成新的知识和思想，甚至实现广义的艺术和科学的再创造。近几年，比较有影响"
"机器学习有别于人类学习，二者的应用范围和知识结构有所不同：机器学习基于对数据和规则的处理和推理，主要应用于数据分析、模式识别、NLP等领域；而人类学习是一种有目的、有意识、逐步积累的过程。总之，机器学习是一种基于算法和模型的自动化过程，包括监督学习和无监督学习两种形式。第二个里程碑：深度学习（DL）。深度学习是机器学习的一个分支。所谓的深度是指神经网络中隐藏层的数量，它提供了学习的大规模能力。因为大数据和深度学习爆发并得以高速发展，最终成就了深度学习理论和实践。"
"深度学习是建立在计算机神经网络理论和机器学习理论上的科学。它使用建立在复杂的网络结构上的多处理层，结合非线性转换方法，对复杂数据模型进行抽象，从而识别图像、声音和文本。在深度学习的历史上，CNN和循环神经网络（RNN）曾经是两种经典模型。"
"大模型以人工神经网络（ANN）为基础。1943年，心理学家麦卡洛克（Warren Sturgis McCulloch，1898一1969）和数理逻辑学家、数学家皮茨（Walter Harry Pitts，Jr。，1923一1969）建立了第一个神经网络模型，即MP模型。该模型是对生物神经元结构的一种模仿，将神经元的树突、细胞体等接收信号定义为输入值x，突触发出的信号定义为输出值y。M-P模型奠定了支持逻辑运算的神经网络基础。"
"以OpenAI为代表的团队，为了让具有多层表示的神经网络学会复杂事物，创造了一个初始化网络的方法，即预训练（pre-trained）。在GPT中，P代表经过预训练（pre-trained），T代表Transformer，G代表生成性的（generative）。实际上，是生成模型为神经网络提供了更好的预训练方法。现在的大模型都是以人工神经网络为基础的算法数学模型。其基本原理依然是罗森布拉特的智能机。这种人工智能网络是一个复杂系统，通过分布式并行和调整内部大量节点之间相互连接的信息。大模型需要可持续的文本数据输入和预训练。大模型生成的内容的前提是大规模的文本数据输入，并在海量通用数据上进行预训练"

作者简介

龙志勇：曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官，获GMIC“AI Startup Top10”等荣誉，在人工智能、云计算、互联网行业深耕20余年。曾撰文《从<华为的冬天>到AI的冬天》，并有多本畅销译著：《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。黄雯：互联网大厂高级AI产品经理，曾就职于腾讯和AI创业公司，积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。

推荐序/朱嘉明

前言

篇：技术篇

01我是一个传话筒

02我是一个大模型

显示全部

用户评论

前面讲的深入浅出，后面就有点凑字数了。

大模型应用的三重境界：1、工欲善其事必先利其器；2、同舟共济扬帆起；3、欲穷千里目更上一层楼

作為科普書挺好了

20230604-0620

技术类的书籍其实很难写到通俗易懂。在chatgpt 逐渐兴起的背景下，生成式人工智能也引发关注。这本书前半部分的技术原理介绍，非常精彩。把生成式预训练，监督学习，强化学习之间的联系和区别讲的很清楚。后半部分对于产业的影响，感觉深度还能够再加强一点点。感觉生成式人工智能的涌现与失控，是未来产业机遇的关键，也是应引起我们警觉的地方。毕竟，当人工智能也不知道自己会做出什么事情来的时候，未知的风险也不可估量。

龙老师威武

作为从业者，以参与者的身份感受一次技术革命的到来，体会是不一样的。作为技术研究者，更多还是关注在技术本身上，而忽略了商业背后的逻辑。在浪潮中读到这本书，及时修正，扩大自己的关注范围，这种机会，可遇不可求！相当于做了一次及时的复盘！

技术篇最有价值

中译出版社（原中国对外翻译出版公司）的其他书籍查看全部

下载