SRE: Google运维解密

SRE: Google运维解密

  • 大小:94.7 MB
  • 类型:电子书
  • 格式:PDF
  • 出版:电子工业出版社
  • 作者:Betsy、Beyer(贝特西、拜尔)
  • 更新:2022-07-27 14:39:20
版权投诉 / 资源反馈(本资源由用户 瞿熙阳 投稿)

这是一个关于SRE相关的电子书资料,由电子工业出版社出版,作者是Betsy、Beyer(贝特西、拜尔),介绍了关于SRE、Google、运维解密方面,格式为PDF,资源大小94.7 MB,目前在SRE类资源综合评分为:8.8分。

大型软件系统生命周期的绝大部分都处于“使用”阶段,而非“设计”或“实现”阶段。那么为什么我们却总是认为软件工程应该首要关注设计和实现呢?在《SRE:Google运维解密》中,Google SRE的关键成员解释了他们是如何对软件进行生命周期的整体性关注的,以及为什么这样做能够帮助Google成功地构建、部署、监控和运维世界上现存最大的软件系统。通过阅读《SRE:Google运维解密》,读者可以学习

Google工程师在提高系统部署规模、改进可靠性和资源利用效率方面的指导思想与具体实践——这些都是可以立即直接应用的宝贵经验。

任何一个想要创建、扩展大规模集成系统的人都应该阅读《SRE:Google运维解密》。《SRE:Google运维解密》针对如何构建一个可长期维护的系统提供了非常宝贵的实践经验。

目录

  • 第Ⅰ部分 概览
  • 第1 章 介绍 2
  • 第2 章 Google 生产环境:SRE 视角 11
  • 第Ⅱ部分 指导思想
  • 第3 章 拥抱风险 23
  • 第4 章 服务质量目标 34
  • 第5 章 减少琐事 44
  • 第6 章 分布式系统的监控 49
  • 第7 章 Google 的自动化系统的演进 60
  • 第8 章 发布工程 76
  • 第9 章 简单化 85
  • 第Ⅲ部分 具体实践
  • 第10 章 基于时间序列数据进行有效报警 93
  • 第11 章 on-call 轮值 109
  • 第12 章 有效的故障排查手段 116
  • 第13 章 紧急事件响应 131
  • 第14 章 紧急事故管理 140
  • 第15 章 事后总结:从失败中学习 146
  • 第16 章 跟踪故障 152
  • 第17 章 测试可靠性 157
  • 第18 章 SRE 部门中的软件工程实践 176
  • 第19 章 前端服务器的负载均衡 191
  • 第20 章 数据中心内部的负载均衡系统 197
  • 第21 章 应对过载 212
  • 第22 章 处理连锁故障 223
  • 第23 章 管理关键状态:利用分布式共识来提高可靠性 246
  • 第24 章 分布式周期性任务系统 273
  • 第25 章 数据处理流水线 284
  • 第26 章 数据完整性:读写一致 295
  • 第27 章 可靠地进行产品的大规模发布 322
  • 第Ⅳ部分 管理
  • 第28 章 迅速培养SRE 加入on-call 341
  • 第29 章 处理中断性任务 355
  • 第30 章 通过嵌入SRE 的方式帮助团队从运维过载中恢复 363
  • 第31 章 SRE 与其他团队的沟通与协作 370
  • 第32 章 SRE 参与模式的演进历程 383
  • 第Ⅴ部分 结束语
  • 第33 章 其他行业的实践经验 398
  • 第34 章 结语 408

以上就是本次关于书籍资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。

SRE相关资源

下载地址

学习笔记

21小时8分钟前回答

Objective-C中常用的结构体NSRange,NSPoint,NSSize(CGSize),NSRect实例分析

本文以实例详细描述了Objective-C中常用的结构体NSRange,NSPoint,NSSize(CGSize),NSRect的定义及用法,具体如下所示: 1、NSRange: NSRange的原型为 typedef struct _NSRange {NSUInteger location;NSUInteger length;} NSRange; NSMakeRange的函数: NS_INLINEz是内联函数……