大模型时代:ChatGPT开启通用人工智能浪潮

龙志勇 黄雯

出版时间

2023-04-30

ISBN

9787500173953

评分

★★★★★
书籍介绍

ChatGPT火爆全球,但大语言模型(Large Language Model)才是幕后真正的智能“大脑”!生成式大模型正在开创新的时代,基于生成式预训练大模型的技术突破,也在带来面向个人、深入行业的多重应用。这势必引发新一轮的智力革命和产业重构,构建全新的脑机协作关系。但在同时,与机会如影随形的泡沫也会随之涌现。

为此,本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。本书首先将专业的技术知识通过拟人化的形式进行呈现,生动形象地解释了ChatGPT大模型背后的原理,对这一赋能大模型变革技术与产业的基础能力进行深度剖析;其次,本书以三次工业革命的历史和逻辑作为参照,描绘出大模型将如何驱动社会进入智能革命和脑机协作时代,并为个人和企业应对此次变革提出建议;第三,本书对大模型在知识工作、商业企业、创意娱乐等领域的具体应用进行介绍,总结了企业在自身业务中应用大模型的注意事项和方法论;后,本书对国内外大模型产业的构成和发展进行了分析,并对暗藏泡沫隐患的风险点位做出预警。

龙志勇:曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官,获GMIC“AI Startup Top10”等荣誉,在人工智能、云计算、互联网行业深耕20余年。曾撰文《从<华为的冬天>到AI的冬天》,并有多本畅销译著:《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。

黄雯:互联网大厂高级AI产品经理,曾就职于腾讯和AI创业公司,积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。

AI导读
核心看点
  • 拟人化解析大模型底层技术原理
  • 参照工业革命推演社会变革逻辑
  • 拆解产业生态并预警潜在泡沫
适合谁读
  • 希望快速理解AI技术的非专业读者
  • 关注大模型商业落地与应用的从业者
  • 对智力革命与脑机协作感兴趣的人群
读前提醒
  • 技术篇生动有趣,建议优先阅读
  • 应用篇内容较浅,可快速浏览
  • 结合书中案例思考自身行业影响
读者共识
  • 技术科普部分深入浅出,通俗易懂
  • 变革篇视角独特,启发思考
  • 应用篇质量一般,略显粗糙

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "“尝试找到如何让机器使用语言、形成抽象和概念、解决现在人类还不能解决的问题、提升自己,等等。对于当下的人工智能来说,首要问题是让机器像人类一样能够表现出智能。” 一达特茅斯会议对人工智能(AI)的定义"
  • "大模型是大语言模型(LLM),也是多模态模型,或者是生成式预训练转换模型。GPT是大模型的一种形态,引发了人工智能生成内容(AIGC)技术的质变。大模型是人工智能赖以生存和发展的基础。"
  • "人工智能的模型,与通常的模型一样,是以数学和统计学为算法基础的算法基础的,可以用来描述一个系统或者一个数据集。在机器学习中,模型是核心概念。模型通常是一个函数或者一组函数,可以是线性函数、非线性函数、决策树、神经网络等各种形式。模型的本质就是对这个函数映射的描述和抽象,通过对模型进行训练和优化,可以得到更加准确和有效的函数映射。建立模型的目的是希望从数据中找出一些规律和模式,并用这些规律和模式预测未来的结果。模型的复杂度可以理解为模型所包含的参数数量和复杂度,复杂度越高,模型越容易过拟合。"
  • "大模型可以定义为大语言模型,具有大规模参数和复杂网络结构的语言模型。与传统语言模型(如生成性模型、分析性模型、辨识性模型)不同,大语言模型通过在大规模语料库上进行训练来学习语言的统计规律,在训练时通常通过大量的文本数据进行自监督学习,从而能够自动学习语法、句法、语义等多层次的语言规律。 如果从人工智能的生成角度定义大模型,与传统的机器学习算法不同,生成模型可以根据文本提示生成代码,还可以解释代码,甚至在某些情况下调试代码。这一过程,不仅可以实现文本、图像、音频、视频的生成,构建多模态,还可以在更为广泛的领域生成新的设计,生成新的知识和思想,甚至实现广义的艺术和科学的再创造。 近几年,比较有影响"
  • "机器学习有别于人类学习,二者的应用范围和知识结构有所不同:机器学习基于对数据和规则的处理和推理,主要应用于数据分析、模式识别、NLP等领域;而人类学习是一种有目的、有意识、逐步积累的过程。总之,机器学习是一种基于算法和模型的自动化过程,包括监督学习和无监督学习两种形式。 第二个里程碑:深度学习(DL)。深度学习是机器学习的一个分支。所谓的深度是指神经网络中隐藏层的数量,它提供了学习的大规模能力。因为大数据和深度学习爆发并得以高速发展,最终成就了深度学习理论和实践。"
  • "深度学习是建立在计算机神经网络理论和机器学习理论上的科学。它使用建立在复杂的网络结构上的多处理层,结合非线性转换方法,对复杂数据模型进行抽象,从而识别图像、声音和文本。在深度学习的历史上,CNN和循环神经网络(RNN)曾经是两种经典模型。"
  • "大模型以人工神经网络(ANN)为基础。1943年,心理学家麦卡洛克(Warren Sturgis McCulloch,1898一1969)和数理逻辑学家、数学家皮茨(Walter Harry Pitts,Jr。,1923一1969)建立了第一个神经网络模型,即MP模型。该模型是对生物神经元结构的一种模仿,将神经元的树突、细胞体等接收信号定义为输入值x,突触发出的信号定义为输出值y。M-P模型奠定了支持逻辑运算的神经网络基础。"
  • "以OpenAI为代表的团队,为了让具有多层表示的神经网络学会复杂事物,创造了一个初始化网络的方法,即预训练(pre-trained)。在GPT中,P代表经过预训练(pre-trained),T代表Transformer,G代表生成性的(generative)。实际上,是生成模型为神经网络提供了更好的预训练方法。现在的大模型都是以人工神经网络为基础的算法数学模型。其基本原理依然是罗森布拉特的智能机。这种人工智能网络是一个复杂系统,通过分布式并行和调整内部大量节点之间相互连接的信息。 大模型需要可持续的文本数据输入和预训练。大模型生成的内容的前提是大规模的文本数据输入,并在海量通用数据上进行预训练"
作者简介
龙志勇:曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官,获GMIC“AI Startup Top10”等荣誉,在人工智能、云计算、互联网行业深耕20余年。曾撰文《从<华为的冬天>到AI的冬天》,并有多本畅销译著:《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。 黄雯:互联网大厂高级AI产品经理,曾就职于腾讯和AI创业公司,积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。
目录
推荐序/朱嘉明
前言
篇:技术篇
01我是一个传话筒
02我是一个大模型

显示全部
用户评论
前面讲的深入浅出,后面就有点凑字数了。
大模型应用的三重境界:1、工欲善其事 必先利其器;2、同舟共济扬帆起;3、欲穷千里目 更上一层楼
作為科普書挺好了
20230604-0620
技术类的书籍其实很难写到通俗易懂。在chatgpt 逐渐兴起的背景下,生成式人工智能也引发关注。这本书前半部分的技术原理介绍,非常精彩。把生成式预训练,监督学习,强化学习之间的联系和区别讲的很清楚。后半部分对于产业的影响,感觉深度还能够再加强一点点。感觉生成式人工智能的涌现与失控,是未来产业机遇的关键,也是应引起我们警觉的地方。毕竟,当人工智能也不知道自己会做出什么事情来的时候,未知的风险也不可估量。
龙老师威武
作为从业者,以参与者的身份感受一次技术革命的到来,体会是不一样的。作为技术研究者,更多还是关注在技术本身上,而忽略了商业背后的逻辑。在浪潮中读到这本书,及时修正,扩大自己的关注范围,这种机会,可遇不可求!相当于做了一次及时的复盘!
技术篇最有价值
下载
收藏