统计思维 - [美] Allen B.Downey

统计思维

[美] Allen B.Downey

出版时间

2013-05-01

ISBN

9787115317377

评分

★★★★★
书籍介绍
本书正是一本概率统计方面的入门图书,但视角极为独特,折射出大数据浪潮的别样风景。作者将基本的概率统计知识融入Python编程,告诉你如何借助编写程序,用计算而非数学的方式实现统计分析。一个趣味实例贯穿全书,生动地讲解了数据分析的全过程:从采集数据和生成统计量,到识别模式和检验假设。一册在手,让你轻松掌握分布、概率论、可视化以及其他工具和概念。 《统计思维:程序员数学之概率统计》是一本以全新视角讲解概率统计的入门图书。抛开经典的数学分析,Downey 手把手教你用编程理解统计学。概率、分布、假设检验、贝叶斯估计、相关性等,每个主题都充满趣味性,经编程解释后变得更为清晰易懂。 本书研究数据主要来源于美国全国家庭成长调查(NSFG)与行为风险因素监测系统(BRFSS),数据源及解决方案的相关代码全部开放,具体章节列出了大量学习和进阶资料,方便读者参考。 Allen B. Downey是富兰克林欧林工程学院的计算机科学副教授,曾执教于韦尔斯利学院、科尔比学院和加州大学伯克利分校。他先后获麻省理工学院计算机科学硕士学位和加州大学伯克利分校计算机科学博士学位。Downey已出版十余本技术书,内容涉及Java、Python、C++、概率统计等,深受专业读者喜爱。他的最新Think系列书还有Think Complexity: Complexity Science and Computational Modeling、Think Python。
AI导读
核心看点
  • 以编程视角重构概率统计,用Python代码替代复杂数学推导。
  • 通过模拟实验理解分布、假设检验等概念,直观且易于掌握。
  • 提供开放数据集与全代码攻略,手把手教你解决真实数据问题。
适合谁读
  • 具备Python基础,希望掌握数据分析技能的程序员。
  • 对传统数学推导感到头疼,偏好计算思维的统计学初学者。
  • 需要快速上手统计工具,进行数据探索与可视化的从业者。
读前提醒
  • 建议边读边运行代码,通过动手实践加深概念理解。
  • 无需深究数学证明,重点关注统计思想与编程实现逻辑。
  • 部分习题无官方答案,可参考在线资源或自行验证结果。
读者共识
  • 讲解角度独特巧妙,将晦涩统计知识变得清晰易懂且有趣。
  • 适合作为入门读物或工具书查阅,不适合追求深度理论者。
  • 部分读者认为内容较浅或简略,需结合其他资料补充学习。

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "The words "mean" and "average" are sometimes used interchangeably, but I will maintain this distinction: * The "mean" of a sample is the summary statistic computed with the previous formula. * An "average" is one of many summary statistics you might choose to describe the typical value or the centra"
  • "这一章译得很不容易,放出来供批判"
  • "exponential distribution和它的CDF图。(很典型,很好记)观察事件的interarrival time,如果事件在每个时间点发生的概率相同,那间隔时间的分布就近于exponential distribution. CDF(x)=1−e−λx 均值是1/λ 取间隔事件的CDF,跟exponential distribution很像。如何确定它就是?一种办法是画出取对数后的互补累积分布函数(Complementary CDF,CCDF):1 - CDF(x)。如果数据服从指数分布,这应该是一条直线。y轴上的值取对数后,CCDF是一条斜率为−λ的直线"
  • "帕累托分布:财富分布情况,自然界和社科中各种现象(城镇大小、沙砾和陨石、火灾和地震etc)(Xm是最小值) 帕累托分布的CDF是:。。。图是。。。该分布的中位数是:。。。https://jobrest.gitbooks.io/statistical-thinking/di_4_zhang_lian_xu_fen_bu/42_pa_lei_tuo_fen_bu.html 可以通过图形判断一个经验分布是否服从帕累托分布:对两条数轴都取对数后,其CCDF应该基本上是一条直线。在对y和x取对数后,就应该基本上是条直线,斜率是−α,截距是 −αlogxm。"
  • "正态分布/高斯分布,有普适性。相对于CDF,更常用error function来表达。公式为https://jobrest.gitbooks.io/statistical-thinking/di_4_zhang_lian_xu_fen_bu/43_zheng_tai_fen_bu.html"
  • "连续模型也是一种数据压缩。如果模型能很好地拟合数据集,那么少量参数就可以描述大量数据。 有时候,我们会惊讶地发现某种自然现象服从某个连续分布,观察这些现象可以让我们深入理解真实的系统。有时候,我们可以解释观察到的分布服从特定形式的原因。例如,帕累托分布通常是正反馈生成过程的结果(也称为偏好依附:preferential attachment"
  • "如果仅仅是为了产生服从指数分布的随机数,或许不用费心地定义一个新类,可能直接用 random.expovariate实现就行了。但是对于其他分布,用RandomVariable对象会是更好的选择。例如,爱尔朗分布(Erlang distribution)是一个连续型分布,有两个参数λ和k"
目录
统计思维
O'Reilly Media, Inc.介绍
译者序
前言
第1章 程序员的统计思维

显示全部
用户评论
7.0 代码没看,但是数学得好好的补一下了。
#豆瓣阅读# 于不懂的人太皮毛,知道名词和实现有什么用,怎么有中国人写的高数书的感觉;于懂的人太罗嗦,这这这你都能写一本书?
还不错 简单入门
优点是告诉读者概率和数理统计能做什么。
这书最后两章写的有点急了,就像考试没做完赶着交卷子似的。但是前面的概念阐述都蛮清晰的,我也跟着写了一些代码,但是后来主要是吃早餐的时候看,所以代码就没坚持写,但是觉得比国内的教科书写的好(我能说过去我不知道概率密度函数确切物理意义么,捂脸跑。。。。。。。)在读第二遍,这本书很基础,但是对概念的阐述非常清晰,学过概率统计,而且还拿了个优,但是后来已经不记得什么了,因为过去对基础概念都没有彻底搞明白。这本书帮我做到了,但是还是有点小瑕疵,后面阐述的急了。还有一个就是,对于每个数学概念我觉得都可以抽象到自然界哲学高度来理解,知道的越多理解的越深,对自然越发敬畏!
给自己对于概率里面的一些概念的理解提供了一个比较强的逻辑关系,各个概念的一个发展顺序,以及为什么,各个概念表达的含义。比较的简单。
自定义类的使用。现在用处不大,以后闲的时候可以二读,耗时35min基本上翻了一下,试了几个程序。
一般
需要基础,不适合入门。
简洁明了
Z-Library
收藏