[读书笔记] 运维如何转型
https://www.infoq.cn/article/1aX7LLK2oxjhjJF3WDuS
https://www.infoq.cn/article/vSjY7L6ykpLBlHD7RuxQ
https://www.infoq.cn/article/OTr4OQ7jVdI9Z9JHpwNF
https://www.infoq.cn/article/TLGRcZ8Zz7JmyNvd6rCQ
https://www.infoq.cn/article/kTtlLZxNUPmlvYpzA0eF
https://www.infoq.cn/article/Bsomd9QO2p66YP3vRk5q
岗位职责(运维是干什么、产出什么)和关键指标(度量产出成果)
关键指标,不仅仅包含服务可用性,还有比如服务器资源达标率、服务故障数据(故障分类、故障响应时间、平均故障恢复时间、故障告警覆盖率)、服务安全指标、服务资源到位时长等等。
业务的成功是第一要务
定义故障 -> 响应故障 -> 快速定位 -> 快速止损
牵头整体的稳定性建设,各个业务需要出接口人极力配合,所谓的稳定性建设,包括事前的预防风控、事中的统筹协同、事后的复盘推进,这也是 SRE 对公司的最大价值。
对象管理是纵向模式,围绕运维对象、建设生命周期的管理平台。
场景管理是横向模式,根据运维场景、纳管多种运维对象的生命周期阶段。运维场景的分类,包括交付/变更、监控/度量、多云、成本等等,非常贴近业务研发的工作习惯、覆盖少数高频场景
- 先保障稳定,然后再优化
- 提供可靠的测试依据和时间验证
- 使用可控的自动化手段提升效率
- 保持简单,监控一切
- 面向预算的运维
- 面向场景的智能运维 - 智能运维就是需要深入理解业务,合理配置资源和架构来满足不同业务场景的需求
- 持续集成和发布系统
一、 以可配置为荣,以硬编码为耻
二、 以互备为荣,以单点为耻
三、 以随时重启为荣,以不能迁移为耻
四、 以整体交付为荣,以部分交付为耻
五、 以无状态为荣,以有状态为耻
六、以标准化为荣,以特殊化为耻
七、以自动化工具为荣,以手动和人肉为耻
八、以无人值守为荣,以人工介入为耻
Comments
Post a Comment