书籍 大数据之路的封面

大数据之路

阿里巴巴数据技术及产品部

出版时间

2017-07-01

ISBN

9787121314384

评分

★★★★★
书籍介绍

在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。

《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。

《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信《大数据之路:阿里巴巴大数据实践》中的实践和思考对同行会有很大的启发和借鉴意义。

目录
第1章 总述1
第1篇 数据技术篇
第2章 日志采集 8
2.1 浏览器的页面日志采集 8
2.1.1 页面浏览日志采集流程 9

显示全部
用户评论
适合架构师看
2018年买的书,现在才读完,感觉蛮不错的,介绍了阿里的数据采集,数据同步,离线实时,数据挖掘,数据建模,存储计算,sql优化。 实时计算还是以jstorm glaxay为样例,现在都已经换成Flink了,看到以前同事分享的极限存储感觉有点熟悉。 中间一些章节比如数据建模,没怎么接触过,感觉有些抽象,不过多了解下还是能知道大数据平台在一个公司里的具体是怎么搭建怎么服务上层业务的。
泥水味好浓
遇到有价值的内容,就说限于篇幅……然后就没有了,写书还有限于篇幅这种说法,那你写来做甚?
看个热闹。
阿里版大数据和hadoop从入门到入门。。
力荐,学到了很多数据平台构建、数据分析业务开发方面的insight,也算是为自己一年来数据研发旅途做一个总结~
入职后再读一遍,谦虚学习,常读常新。
建模篇不错,各种概念结合实际应用场景阐述很清晰。
优点:大量的真实举例,代入感很强;脉络清晰,能扣住技术框架,对搭建数据仓库有入门启发作用 缺点:技术不是很讲,只能旁观其产品之丰富和周全,毕竟不是本技术手册;ch14没有hive基础的话,看得费劲太多 整体来讲,值得入门推荐!
Z-Library