-
Notifications
You must be signed in to change notification settings - Fork 13
Open
Description
2022年做告警时看过一遍, 最近再去看部分章节的时候依然发现了一些宝贝, 计划再整体看一遍(学习Google方式). 8月份技术书籍就他了.
Google 确实是开放自己系统的先行者, 从开放BigTable, GFS, MapReduce 再到k8s, 一直走在前列.
Content
- 赞序(2023.07.28)
- PART I 概述-CH1 介绍(2023.07.29)
- PART I 概述-CH2 Google 生产环境: SRE视角(2023.07.29)
- PART II 指导思想-CH3 拥抱风险(2023.08.01)
- PART II 指导思想-CH4 服务质量目标(2023.08.04)
- PART II 指导思想-CH5 减少琐事(2023.08.04)
- PART II 指导思想-CH6 分布式系统的监控(2023.08.05)
- PART II 指导思想-CH7 Google 自动化系统的演进(2023.08.05)
- PART II 指导思想-CH8 发布工程(2023.08.08)
- PART II 指导思想-CH9 简单化(2023.08.09)
- PART III 具体实践-CH10 基于时间序列进行有效告警(2023.08.10)
- PART III 具体实践-CH11 OnCall 轮值(2023.08.11)
- PART III 具体实践-CH12 有效的故障排查手段(2023.08.12)
- PART III 具体实践-CH13 紧急事件响应(2023.08.12)
- PART III 具体实践-CH14 紧急事故管理(2023.08.13)(2023.08.12)
PART III 具体实践-CH15 事故总结:从失败中学习(2023.08.13)
PART III 具体实践-CH16 跟踪故障(2023.08.13) - PART III 具体实践-CH18 SRE 部门中的软件工程实践(2023.08.16)
- PART III 具体实践-CH19 前端服务器的负载均衡(2023.08.21)
- PART III 具体实践-CH20 数据中心内部的负载均衡系统(2023.08.21)
- PART III 具体实践-CH 21 应对过载(2023.08.22)
- PART III 具体实践-CH22 处理连锁反应(2023.08.26)
- PART III 具体实践-CH23 管理关键状态, 使用分布式共识来提供可靠性(2023.08.27)
- PART III 具体实践-CH24 分布式周期性任务系统(2023.08.27)
- PART III 具体实践-CH27 可靠的进行产品的大规模发布(2023.08.27)
- 完结(2023.08.27)
Metadata
Metadata
Assignees
Labels
No labels