大规模Web服务开发技术 - 伊藤直也

大规模Web服务开发技术

伊藤直也

出版时间

2011-06-30

ISBN

9787121138843

评分

★★★★★

标签

算法

书籍介绍

Hatena是日本最大的Web服务提供商之一,它提供的服务包括关键字(类似于维基百科)、博客、相册等。《大规模Web服务开发技术》由伊藤直也、田中慎司所著,内容主要来自Hatena为学生们举行的暑期实习的课程,内容涵盖广泛,介绍了性能优化、分布式、算法、系统架构等各个方面,甚至还介绍了硬件的经济成本,是运维工程师们必不可少的参考书。书中还包括几个算法实习课题,介绍了压缩算法、全文搜索等算法的实现方法,对于打算靠Web创业的人不失为一本很不错的参考书。

AI导读
核心看点
  • 源自Hatena实习课程,涵盖性能优化与分布式架构
  • 深入解析内存与磁盘差异,揭示大规模数据处理难点
  • 结合硬件成本与算法实现,提供全栈开发实战指南
适合谁读
  • 希望系统学习Web架构与运维的初级工程师
  • 对大规模数据处理及高并发系统感兴趣的开发者
  • 计划进行Web创业或技术转型的技术人员
读前提醒
  • 内容偏重基础概念与思维,非深度源码级教程
  • 部分技术细节可能随时代变迁,需结合现状理解
  • 建议配合实际项目阅读,重点吸收架构设计思路
读者共识
  • 行文风趣易懂,像看小说一样,适合入门科普
  • 内容实在且数据翔实,虽浅显但逻辑清晰可靠
  • 大牛可能觉得简单,但对新人构建整体观极有帮助

本导读基于书籍简介、目录、原文摘录、短评和书评生成,不等同于全文精读。

精彩摘录
  • "1、GB级别的数据处理 2、内存的重要性"
  • "3、以分布式为主的运维"
  • "4、选择恰当的算法和数据结构"
  • "压缩就是分析符号的出现频率,用短编码标记频繁出现的符号,用长编码标记其余符号"
  • "通过基于Trie的正则表达式实现Common Prefix Search(公共前缀搜索)"
  • "“%iowait”是 I/O 等待率。平均负载过高并且该数值也过高的话,可以认为高负载的原因就是 I/O 。"
  • "操作系统启动之后,要先把经常使用的数据库文件 cat 一遍。这样就能全部放进内存中。 以后大家在工作中构建系统的时候,就要进行性能测试和负载测试。那时请记住,一定要把第一次测试结果放弃掉。刚开始时缓存尚未优化"
  • "如果缓存不过来的话:就需要扩展到多台服务器上。CPU负载分散只需简单的增加数据库即可;IO负载分散则需要考虑局部性"
作者简介
伊藤直也(Naoya Ito) Hatena株式会社董事兼CTO。合著作有《BlogHacks(0‘Reilly Japan)、《“24小时365天”服务器/基础设施的支撑技术》(技术评论社)。曾获情报处理学会主办的“Software Japan 2009”的Software JapanAward奖,以及“乐天Technical Conference 2008”的Technology Award银奖。 田中慎司(Shinji Tanaka) Hatena株式会社董事,信息学博士。合著有《“24小时365天”服务器/基础设施的支撑技术》(技术评论社)一书,还主持过多本著作的翻译。支撑着Hatena服务器的是由600多台服务器构成的系统,现在这一系统的性能及设备运维由他全权负责。
目录
目 录
第1章 大规模Web服务的开发定位——掌握整体 2
第0课 本书的起源——本书讲述的范围 3
从事大规模Web服务开发——面向大学生的Hatena实习 3
本书讲述的内容 3

显示全部
用户评论
后端架构师入门必备,内容有广度和较强的概括性。
挑了几章来看。内容属于科普级的,不过读起来还蛮有趣,比如折叠纸巾的那个例子。
草略翻过,里面数据挖掘的内容该回头看看
讲了一些很多基础概念,内容简单好懂.但却不是一个practice类型的.
一般,没讲到我感兴趣的东西
当量级上去之后,会遇到哪些问题以及如何解决,总结得很好,可以当成一本架构技术索引书。
书比较早了,内容也相对浅显
比较老的一本入门向工业实践概览。一些技术选型在今天看来已经过时了。构建搜索引擎时用到的一些经典字符串算法挺有意思。另外头一回见到用Perl技术栈的公司,而且现在还活着,挺好
科普而已,我不做这块的也基本不懂,但感觉是上个时代的技术了。
大佬推荐
下载
收藏