My_Study_SRE
latest
SRE
SRE运维解密
1. 概述篇
2. 指导思想篇
3. 具体实践篇
4. 管理篇
SRE工作手册
My_Study_SRE
»
SRE运维解密
Edit on GitHub
SRE运维解密
SRE运维解密
1. 概述篇
1.1. 介绍
1.1.1. demo
1.2. SRE视角
1.2.1. demo
2. 指导思想篇
2.1. 拥抱风险
2.1.1. 管理风险
2.1.2. 度量服务风险
2.1.3. 服务的风险容忍度
2.1.3.1. 辨别消费者服务的风险容忍度
2.1.3.1.1. 可用性目标
2.1.3.1.2. 故障类型
2.1.3.1.3. 成本
2.1.3.2. 基础设施服务的风险容忍度
2.1.3.2.1. 可用性目标
2.1.3.2.2. 故障类型
2.1.3.2.3. 成本
2.1.4. 使用错误预算的目的
2.1.4.1. 错误预算的构建过程
2.1.4.2. 好处
2.2. 服务质量目标
2.2.1. 服务质量术语
2.2.2. 指标在实践中应用
2.2.2.1. 运维人员和最终用户各自关心什么
2.2.2.2. 指标的收集
2.2.2.3. 汇总
2.2.2.4. 指标标准化
2.2.3. 目标在实践中应用
2.2.3.1. 目标的定义
2.2.3.2. 目标的选择
2.2.3.3. 控制手段
2.2.3.4. slo可以建立用户预期
2.2.4. 协议在实践中应用
2.3. 减少琐事
2.3.1. 琐事的定义
2.3.2. 为什么琐事越少越好
2.3.3. 什么算工程工作
2.3.4. 琐事繁多是不是一定不好
2.3.5. 小结
2.4. 分布式系统的监控
2.4.1. 术语描述
2.4.2. 为什么要监控
2.4.3. 对监控系统设置合理预期
2.4.4. 现象与原因
2.4.5. 黑盒监控与白盒监控
2.4.6. 4个黄金指标
2.4.7. 关于长尾问题
2.4.8. 度量指标采用合适的精度
2.4.9. 简化到不能在简化
2.4.10. 将上述理念整合起来
2.4.11. 监控系统的长期维护
2.4.12. 小结
2.5. Google自动化系统的演进
2.5.1. demo
2.6. 发布工程
2.6.1. demo
2.7. 简单化
2.7.1. demo
3. 具体实践篇
3.1. 基于时间序列数据进行有效报警
3.1.1. demo
3.2. on-call轮值
3.2.1. demo
3.3. 有效的故障排查手段
3.3.1. 理论
3.3.2. 实践
3.3.2.1. 故障报告
3.3.2.2. 定位
3.3.2.3. 检查
3.3.2.4. 诊断
3.3.2.5. 测试和修复
3.3.3. 神奇的负面结果
3.3.3.1. 治愈
3.3.4. 案例分析
3.3.5. 使故障简单
3.3.6. 小结
3.4. 紧急事件响应
3.4.1. 当系统出现问题怎么办
3.4.2. 测试导致的紧急事故
3.4.3. 变更部署带来的紧急事故
3.4.4. 流程导致的严重事故
3.4.5. 所有问题都有解决方案
3.4.6. 向过去学习
3.5. 紧急事故管理
3.5.1. 紧急事故流程管理要素
3.5.1.1. 职责分离
3.5.1.2. 控制中心
3.5.1.3. 实时事故状态文档
3.5.1.4. 明确公开的职责交接
3.5.2. 一次流程管理良好的事故
3.5.3. 什么时候对外宣布事故
3.5.4. 最佳实践
3.6. 事后总结
3.6.1. google的事后总结哲学
3.6.2. 协作和知识共享
3.6.3. 建立事后总结文化
3.7. 跟踪故障
3.7.1. demo
3.8. 测试可靠性
3.8.1. demo
3.9. SRE部门中的软件工程实践
3.9.1. demo
3.10. 前端服务器的负载均衡
3.10.1. 使用DNS进行负载均衡
3.11. 数据中心内部的负载均衡系统
3.11.1. demo
3.12. 应对过载
3.12.1. demo
3.13. 处理连锁故障
3.13.1. demo
3.14. 管理关键状态
3.14.1. demo
3.15. 分布式周期性任务系统
3.15.1. demo
3.16. 数据处理流水线
3.16.1. demo
3.17. 数据完整性
3.17.1. demo
3.18. 可靠地进行产品的大规模发布
3.18.1. demo
4. 管理篇
4.1. 迅速培养SRE加入on-call
4.1.1. demo
4.2. 处理中断性任务
4.2.1. demo
4.3. 通过嵌入SRE的方式帮助团队从过载恢复
4.3.1. demo
4.4. SRE与其他团队的沟通与协作
4.4.1. demo
4.5. SRE参与模式的演进历程
4.5.1. demo
Read the Docs
v: latest
Versions
latest
Downloads
On Read the Docs
Project Home
Builds