这就是ChatGPT - [美] 斯蒂芬·沃尔弗拉姆(Stephen Wolfram)

这就是ChatGPT

[美] 斯蒂芬·沃尔弗拉姆(Stephen Wolfram)

出版时间

2023-07-01

ISBN

9787115618085

评分

★★★★★
书籍介绍

“第一个真正实用的人工智能”搜索引擎WolframAlpha发明人

斯蒂芬·沃尔弗拉姆的ChatGPT诚意之作

◎ 编辑推荐

OpenAI CEO、ChatGPT之父Sam Altman强烈推荐

首部揭秘ChatGPT内部原理的权威之作

科学和技术领域重要的革新者

“第一个真正实用的人工智能”搜索引擎WolframAlpha发明人斯蒂芬·沃尔弗拉姆的ChatGPT诚意之作

•国内首部由世界顶级AI学者、科学和技术领域重要的革新者、“第一个真正实用的人工智能”搜索引擎WolframAlpha发明人斯蒂芬·沃尔弗拉姆的ChatGPT诚意之作

•当今活着的最聪明的人之一、比肩康德,最硬核的思考者,对ChatGPT最本质的原理(神经网络)的解构

•OpenAI CEO,ChatGPT之父山姆·阿尔特曼、世界顶级的AI学者,机器人界的巨擘,MIT教授,多家知名机器人公司创始人,美国工程院院士罗德尼·布鲁克斯、量子位联合创始人,总编辑李根、科学作家,“得到”APP《精英日课》专栏作者万维钢联袂推荐

◎ 名人推荐

这是我见过的对ChatGPT原理最佳的解释。

——Sam Altman,OpenAI CEO,ChatGPT之父

读过这本书之后,我认为它堪称精湛之作。大语言模型擅长给出听起来像是答案的答案,但这与真正的答案不同。

——Rodney Brooks,世界顶级AI学者,机器人界的巨擘,MIT教授,美国工程院院士

从原理上知道ChatGPT和大语言模型的“能”与“不能”,才能准确把握这波科技浪潮的红利和机遇。而Stephen Wolfram无疑是既权威专业,又懂得把技术原理生动表达出来的那一个。连OpenAI CEO都赞不绝口。

——李根,量子位联合创始人,总编辑

Wolfram是当今活着的最聪明的几个人之一,也是最硬核的思考者之一,因为他解读世界的视角是数学和物理学的。他关于计算不可约性的思想,给此后无论如何发展的世界中的AI和人类的角色设定了互不毁灭的定律。Wolfram的历史地位将有可能比肩康德。这本书拨云见日,讲出了ChatGPT最底层的原理以及谜团。没有人真正理解为什么语言模型这么厉害,但这本书能告诉你它们的底线在哪里。

——万维钢,科学作家,“得到”App《精英日课》专栏作者

ChatGPT的推出预示着通用人工智能(AGI)时代的帘幕揭开,其强大能力将对许多行业的产品形态产生深远的影响,因此对它进行深入了解变得非常必要。这本书从第一性原理出发,通俗易懂地介绍了与ChatGPT相关的技术原理,且有作者独到的见解。相信读者在阅读这本书之后,能对ChatGPT有更深刻的认识。

——张俊林,新浪微博新技术研发负责人

◎ 内容简介

ChatGPT是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出,能够自动生成一些表面上看起来像人类写出的文字的东西,是一件很厉害且出乎大家意料的事。那么,它是如何做到的呢?又是为何能做到的呢?本书会大致介绍ChatGPT的内部机理,然后探讨一下为什么它能很好地生成我们认为是有意义的文本。

本书适合想了解ChatGPT的所有人阅读。

斯蒂芬·沃尔弗拉姆(Stephen Wolfram)

计算机科学、数学和理论物理学家,当今科学和技术领域重要的革新者之一。他创造了在全世界备受推崇的软件系统——Mathematica、Wolfram|Alpha和Wolfram语言。35年来,他一直担任科技公司Wolfram Research的首席执行官,并负责基础科学领域的一系列突破性进展,包括最近的Wolfram物理项目(Physics Project)。著有畅销书《一种新科学》《这就是ChatGPT》《计算探索者之旅》《创想者》等。

伊利诺斯大学物理学、数学和计算机科学教授。“科学天才”15岁发表首篇粒子物理方面的学术论文;19岁,到加州理工学院研究基本粒子物理学,一年内获得理论物理学博士学位。随后他和费曼一起研究起元胞自动机。

软件工程师、企业老板,他创办的Wolfram Research软件...

(展开全部)

AI导读
核心看点
  • 揭秘ChatGPT逐词生成与概率选择的核心机制
  • 深度解析Transformer神经网络与无监督学习原理
  • 探讨大模型能力边界及与WolframAlpha的结合
适合谁读
  • 对AI底层逻辑感兴趣且具备一定数理基础的读者
  • 希望从科学视角理解大语言模型运作机制的技术人
  • 愿意挑战硬核科普、探索计算思维本质的求知者
读前提醒
  • 内容偏重原理推导,非数学背景读者可能感到吃力
  • 原文为免费英文博客,中文版翻译质量与排版受争议
  • 后半部分涉及作者自家产品推广,需理性看待营销
读者共识
  • 作者视角独特,对神经网络原理的解构极具启发性
  • 部分概念晦涩难懂,被吐槽为‘似懂非不明觉厉’
  • 虽为免费内容出版,但书中夹带私货卖课引发反感

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "当ChatGPT做一些事情,比如写一篇文章时,他只是一遍又一遍的询问:“根据目前的文本下一个词应该是什么”并且每次都添加一个词。 它在每一步都会得到一个带概率的词列表,如果我们总是选择排民最高的词,会得到一份“平庸”的文章,毫无“创造力”,但有时随机选择低概率的词,会显得“更有趣”。"
  • "从来没有“无模型的元模型”,所有模型都有特定的基本结构,以及用于拟合数据的一定量的“旋钮”(也就是“参数”)。"
  • "每个神经网络都只对应于某个整体的数学函数,GPT神经网络也只对应于一个数学函数——实际上有数十亿项。"
  • "神经网络之所以强大,原因不仅在于它能够处理各种工作,还在于它可以通过逐步“根据样例训练”来执行学习程序。 当构建一个神经网络来区分猫与狗时,我们不需要编写一个程序(比如)明确找到胡须,只需要展示足够多的关于什么是狗、什么是猫的样例,然后让神经网络从中“机器学习”如何区分即可。"
  • "有时候,用神经网络解决复杂问题比解决简单问题更容易,大致原因在于,当有很多权重变量时,高位空间中“许多不同方向”可以引导我们达到全面最优解,而但变量很少时,很容易陷入局部最优解(但非整体最优解)。"
  • "在越来越多的情况下,人们并不从头开始使用训练网络:一个新网络可以直接包含一个已训练过的网络、或至少使用该网络未自己生成更多数据。"
  • "ChatGPT一个很好的特点,就是可以进行“无监督学习”,更容易获取训练样例。试想一下,GPT基本任务是续写给定的文本,因此要获得训练样例,就是获取一段文本并将结尾遮挡起来,将其作为“训练的输入”,而“输出”就是无遮挡的完整文本。这里的重点是,GPT不需要“明确的标签”,它可以直接从获得的文本样例中进行学习。"
  • "训练神经网络很难,并且需要大量的计算工作,绝大部分工作是在处理数的数组,这正是GPU长处,这也是为什么神经网络训练通常受限于GPU数量。"
作者简介
斯蒂芬·沃尔弗拉姆(Stephen Wolfram) 计算机科学、数学和理论物理学家,当今科学和技术领域重要的革新者之一。他创造了在全世界备受推崇的软件系统——Mathematica、Wolfram|Alpha和Wolfram语言。35年来,他一直担任科技公司Wolfram Research的首席执行官,并负责基础科学领域的一系列突破性进展,包括最近的Wolfram物理项目(Physics Project)。著有畅销书《一种新科学》《这就是ChatGPT》《计算探索者之旅》《创想者》等。 伊利诺斯大学物理学、数学和计算机科学教授。“科学天才”15岁发表首篇粒子物理方面的学术论文;19岁,到加州理工学院研究基本粒子物理学,一年内获得理论物理学博士学位。随后他和费曼一起研究起元胞自动机。 软件工程师、企业老板,他创办的Wolfram Research软件公司,研发出当今世界四大数学软件之一Mathematica。Mathematica的发布标志着现代科技计算的开始,它是世界上通用计算系统中最强大的系统。沃尔夫勒姆本人也因为这个发明被认为是“人类的伟大赞助者”,并跨入千万富翁的行列。 1981年,沃尔弗拉姆被授予麦克阿瑟“天才人物”奖,并成为该奖有史以来最年轻的获得者。 2009年5月,沃尔弗拉姆发布了一个搜索引擎WolframAlpha。“第一个真正实用的人工智能”。可以给出针对问题的有效答案,所以,WolframAlpha问世不久后便被称为“谷歌杀手”。他跟乔布斯也是好友,比如苹果手机助手Siri,背后的知识库,其实就是Wolfram|Alpha支持的。 他的大部头著作,1197页的《一种新科学》(A New Kind of Science)在2002年出版的时候登上了亚马逊的榜首,畅销无比。
目录
第一篇
ChatGPT 在做什么?它为何能做到这些? / 1
它只是一次添加一个词 / 3
概率从何而来 / 10
什么是模型 / 16

显示全部
用户评论
从chatGPT语言模型的工作原理入手,展示了千亿简单计算单元联结后量变引起质变的威力。通过和Wolfram对比为例,展示了chatGPT的能与不能,譬如本质上基于概率学习的GPT暂时无法进行深入的思考,非常坦诚而热烈的科普。chatGPT首先颠覆的是语言学,模仿人类构筑的神经网络最终也许能够揭开语言以及思维的秘密,非常神奇的循环。 一点笔记:在处理高维问题时,人工智能/机器还是可以展示出远超人类的能力,人类会在几个变量的纠结之中陷入“山湖”,而出路往往存在于高维变量之间的联动或者要彻底跳出当前思维。
短短100多页的小书,篇幅长度很易读。但不知道是翻译的原因还是个人认知局限,和机器学习领域的一些大部头相比,内容比较晦涩,大量的括号打乱了阅读节奏。算是给出了一些关于ai,关于llm的哲学角度的一些思辨。人类的自然语言是否不过是某种规律的总结提炼,而这种规律恰恰已被飞速发展的人工智能捕捉、学习会了。
2023年第44本。大神写一本如此通俗的书,也是大众之幸了。
已经比较通俗易懂 但对于没有AI相关背景的我来说 还得多查资料理解。ps 作者的带货有点多
初学者要理解ChatGPT,读这一本书就够了。随着ChatGPT等人工智能技术的发展,人机交互将变得更加智能化和自然化。这可能会改变我们与计算机和机器的交互方式,让人们更容易与技术进行沟通和协作。ChatGPT等人工智能技术的出现为人类带来了许多机遇和挑战。关键在于我们如何理智地应用和管理这些技术,以确保其对人类社会的影响是积极和可持续的。
如果不是我已经懂了 我是看不懂的
没有技术基础,读得一知半解的。书写得非常好,深入浅出,平易近人,那些复杂抽象的概念和原理也比较直观的呈现出来了。但并不是方法论,对于AI工具使用方法和技巧(插件使用、提示词编写等)的提升并没有多大的直接帮助。
ChatGPT最长路径百万神经元1750亿个链接即1750亿个权重 只向前 人脑1000亿个神经元100万亿个链接 ChatGPT vs Wolfram即产品经理vs程序员😓 Wolfram用复杂系统逼近生物&社会 和 降临language 太cooool了
Gpt generative pre-training 生成式预训练 Chatgpt本质上是生成语言输出系统,从根本上要做的事情是,针对他得到的任何文本产生“合理的延续”;找到这个文本的所有实例,然后看看接下来出现什么词,以及这些词出现的概率是多少。 Chatgpt是一个庞大的神经网络,能以某种方式捕捉到人类大脑在生成语言时所做事情的本质。神经网络的基本思想是利用大量简单(本质上相同)的组件来创造一个灵活的“计算结构”,并使其能够逐步通过学习样例得到改进。当前神经网络基本上是利用微积分的思想来进行这种逐步的改进。 有意义的人类语言实际上比我们所知道的更加结构化、更加简单,最终可能以相当简单的规则来描述如何组织这样的语言。
挺好的GPT科普; 建议网站上直接看英文文章, 中文版超过正文1/6篇幅的导读不知道是在显摆啥.
下载
收藏