Python for Data Analysis - Wes McKinney

Python for Data Analysis

Wes McKinney

出版时间

2017-09-25

ISBN

9781491957660

评分

★★★★★

标签

计算机

AI导读
核心看点
  • Pandas作者亲撰,权威讲解NumPy与Pandas核心用法
  • 涵盖数据清洗、预处理、可视化等完整分析流程
  • 代码示例丰富,是Python数据分析领域的经典工具书
适合谁读
  • 希望系统掌握Python数据分析技能的初学者
  • 需要查阅Pandas和NumPy用法的开发者
  • 从R或Matlab转向Python的数据分析师
读前提醒
  • 本书偏向工具手册,建议结合具体项目边做边查
  • 内容较枯燥,需动手敲代码实践才能避免遗忘
  • 注意版本差异,建议配合官方文档或勘误表阅读
读者共识
  • 被誉为Python数据分析入门圣经,地位不可撼动
  • 像字典一样实用,适合遇到问题时快速查阅
  • 部分章节略显啰嗦,新手需耐心克服枯燥感

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "数组切片是原始数据的视图。这意味着数据不会被复制,视图上的任何修改都会直接反映到源数组上。"
  • "records = [json.loads(line) for line in open(path)]"
  • "The probability density function for lognorm is: lognorm.pdf(x, s) = 1 / (s*x*sqrt(2*pi)) * exp(-1/2*(log(x)/s)**2) for x > 0, s > 0. lognorm takes s as a shape parameter. The probability density above is defined in the “standardized” form. To shift and/or scale the distribution use the loc and scal"
  • "def get_top_amounts(group, key, n=5): totals = group.groupby(key)['contb_receipt_amt'].sum() # Order totals by key in descending order return totals.order(ascending=False)[-n:]"
  • "return totals.order(ascending=False)[:n]"
  • "TypeError: pivot_table() got an unexpected keyword argument 'rows'"
  • "从0开始,步长1和-1出现的概率相等。通过内置的random模块以纯python的方式实现1000步的随机漫步: In [1]: import random In [2]: position=0 In [3]: walk=[position] In [4]: steps=1000 In [5]: for i in xrange(steps): ...: step=1 if random.randint(0,1) else -1 ...: position += step ...: walk.append(position) ...: 我用np.random模块一次性随机产生1000个“掷硬币的"
  • "dateutil可以解析几乎所有人类能够理解的日期表示形式。(很遗憾,中文不行)"
用户评论
2年前死啃第一版,现在第二版……觉得好简单都是基础。
给后面同学的客观参考:1. 这是一本工具书,比较像字典,而不是教读者怎么做数据分析 2. 可以说是一本pandas字典 3. 学习方法应该是项目导向,不懂的时候来看这本书。 对着书敲代码,过两天就忘
2019
Supplemental textbook for Darcy's course "Data Programming with Python". Pandas and matplotlib libraries are discussed in detailed context, as well as data managment in the beginning, and great illustrations are provided. Useful tool books in data field.
前前后后加起来学了小半年,终于把这本身学完了,除了第14章和附录,其他代码我都看了一遍、自己打了一遍、学了一遍。学会用pandas和datetime实在大有裨益。就是有些内容写的实在不太好,例子过于复杂。
我喜欢这种简单通读一遍就能上手的书籍,pandas讲的不错
我读完了完全判断不出好坏啊
不错的数据处理入门书,看了前五章
下载
收藏