拆穿数据胡扯

[美]卡尔·伯格斯特龙

出版时间

2022-03-01

ISBN

9787521738797

评分

★★★★★

标签

经济

书籍介绍

“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?

X 让人看不懂的数据分析和神奇算法

X 莫名奇妙的数学方程

X 强行联系因果的统计学论文

X 某些新闻报道或PPT中花里胡哨的图表

……

我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!

一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?

对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。

两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪...

(展开全部)

AI导读
核心看点
  • 源自华盛顿大学爆满公开课,系统拆解数据胡扯套路
  • 犀利剖析相关性非因果、选择偏倚等常见统计谬误
  • 提供识别与驳斥虚假信息的方法,培养批判性思维
适合谁读
  • 需频繁处理数据报表、撰写PPT的职场人士
  • 希望提升信息素养、避免被媒体误导的普通读者
  • 对统计学、数据分析及批判性思维感兴趣的群体
读前提醒
  • 警惕证真偏差,勿仅关注符合自身信念的信息
  • 质疑图表设计意图,判断其是否扭曲底层数据
  • 牢记古德哈特定律:指标一旦成目标,便失效
读者共识
  • 案例丰富且幽默,深入浅出地讲解统计学原理
  • 搭建思考框架,帮助读者在信息洪流中保持清醒
  • 虽无全新理论,但实用性强,是防骗必备工具书

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "一个多世纪前,哲学家约翰·亚历山大·史密斯在对牛津大学新生发表演讲时说:月年本复微的测富头清具确管即出增 你在学校学到的东西对你(将来的生活)几乎毫无用处,但它有一个好处:只要你认真学习,方法得当,那么在别人胡说八道的时候你会有所察觉。我认为,这即使不是教育的唯一目的,也是它的一个主要目的。"
  • "证真偏差是指人们往往会注意与我们已有的信念相一致的信息。如果某个言论与我们相信的信念相一致,我们更倾向于接受它,而不太可能怀疑它的真实性。我们对证真偏差的易感性可以用社会学家尼尔·波兹曼的那句名加以概括:“在任何时候,你必须与之抗争的胡扯主要源于你自己。”"
  • "问问自己,设计者设计的图表是为了准确地反映底层数据,还是说希望它传递的信息更贴近设计者希望你相信的信息。"
  • "这是一本关于胡扯的书。它将告诉我们,面对无处不在的胡扯我们如何看穿它,如何对它进行反击。不过,事情得一步一步地做。首先,我们需要了解什么是胡扯,它从何而来,为什么会泛滥成灾。为了回答这些问题,我们需要将目光投向遥远的过去,了解一下这一现象的起源。 胡扯不是现代发明。在《柏拉图全集》(Euthydemus)记载的一次与苏格拉底的对话中,柏拉图抱怨那些被称为诡辩家的哲学家对事实漠不关心,只对赢得辩论感兴趣。换句话说,他们是胡扯艺术家。但如果追溯胡扯的起源,就会追溯到比任何人类文明更久远的年代。胡扯起源于更广泛意义上的欺骗,而动物之间已经互相欺骗了上亿年。"
  • "有的胡扯者会主动去欺骗,不让听者了解真相;还有一些胡扯者则对真相漠不关心。"
  • "麻省理工学院教授朱迪丝·多纳特发现,在很多时候,人们看上去是在谈论其他事情,但实际上是在谈论自己。假设我登录脸书并分享了一篇虚假的(甚至是荒谬的)报道,称飞机云是自由主义者为降低美国年轻人睾酮水平而喷洒的扰乱内分泌的化学物质。就像我无意于表明自己的政治倾向一样,我可能也无意于表明并让你接受我对飞机云的看法。分享这样一篇文章,表明我是阴谋论者,不信任美国的“自由主义议程”。如果这就是我的目的,那么这篇报道是否属实对我来说并不重要。我可能没有读过这篇文章,也不关心你是否读过,但我想让你知道我是一个阴谋论者。 信号本身变成了意义所在。假设我分享一篇报道,称美国国税局正在调查唐纳德·特朗普在2016年"
  • "胡扯可能毫无意义。另一位研究胡扯问题的哲学家G.A.科恩指出,很多胡扯一尤其是学术上的各种各样的胡扯一是毫无意义的,而且隐藏在修辞和复杂的语言中,甚至让任何人都无法评论。因此,对科恩来说,胡扯就是“无法厘清的含糊”。胡扯者不仅表达不清,其背后的思想也非常含糊,让人理不清头绪。科恩提出了一种测试含糊程度的方法:如果一个语句变成否定句后意思没有改变,它就是胡扯,例如:“莎士比亚笔下的普洛斯彼罗最终成了认知悲剧的支点,正是因为他没有接受超限诠释学”。"
  • "2011年,科技企业家杰夫·哈默巴赫尔在谈到艾伦·金斯伯格时曾抱怨:“我们这一代最聪明的人都在思考如何让人们点击广告。这太糟糕了。”问题不仅在于这些“最聪明的人”本可以献身于人类的艺术和科学进步,还在于所有这些学识达人都在致力于劫持我们宝贵的注意力,浪费我们的智力。互联网、社交媒体、智能手机……转移我们注意力的手段越来越复杂。我们沉迷于网络连接,沉迷于毫无意义的核实工作,沉迷于注意力被数字信息洪流冲击得支离破碎的生活之中。简言之,驱动社交媒体内容的算法就是胡扯。他们不关心自己传递的信息,只是想引起我们的注意。只要是能吸引我们注意力的信息,他们都愿意告诉我们。"
作者简介
卡尔·伯格斯特龙(Carl Bergstrom) 美国华盛顿大学生物学系教授。他研究流行病如何在人群中传播,以及信息如何大规模地在生物和社会系统中流动——从细胞内对基因表达的控制到社交媒体上错误信息的传播。他最为人所知的是跨界整合自然科学和社会科学思想的能力,特别是在信息研究领域造诣很深。2010年以来,他发表了多篇前瞻性的文章,涉及信息科学、计算机科学、控制论、进化生物学、信息论、科学哲学、物理学等方面。其中有很多都发表在《自然》《科学》《美国国家科学院院刊》上。 杰文·韦斯特(Jevin D.West) 美国华盛顿大学信息学院副教授、公众知情中心主任。
目录
推荐序1 科学地对抗科学的胡扯的“胡扯” / V
推荐序2 拨开扯淡的迷雾 / IX
推荐序3 闲得没事也别胡扯 / XIII
前 言 / XVII
第1 章 胡扯无处不在

显示全部
用户评论
除了教会你如何识别数据胡扯,当你迫不得已需要胡扯时,它也会成为一本实操性强的工具书用来消磨时光
好看 学会的最重要的事情是数据的关联性并不代表数据的因果关系。 真实的有用,即可以拆穿,也可以避免被拆穿(不是
疫情让人郁闷,读书的欢乐多半来自本书。远离量化研究的文科生务必抽空看下,防止被骗。
没有什么太新的内容,大数据的信息时代,谬误太多,光靠书里推荐的方法恐怕也很难看清,搭建一个思考的框架还是可以的
一本《人类驯服数据为己所用骚操作大全》,强烈推荐"数据可视化"那章,笑出声的同时还偷师了几个让辣鸡PPT看起来很厉害的小技巧
百搭备课素材。果然每次上课前都是看书最快的时候。
纵使黑夜吞噬了一切,太阳还可以重新回来
非常实用,特别是在处理各大社交媒体资讯的时候(疫情期间尤其)。“谎言是为了使人远离真相,胡扯则对真相漠不关心”可谓真理了,直接幻视各种小编体。第七章数据可视化部份的内容也可以反过来利用,学会通过改变图表形式来证明自己的观点。
下载
收藏