[读书笔记] 运维如何转型

https://www.infoq.cn/article/1aX7LLK2oxjhjJF3WDuS

 https://www.infoq.cn/article/vSjY7L6ykpLBlHD7RuxQ

https://www.infoq.cn/article/OTr4OQ7jVdI9Z9JHpwNF

https://www.infoq.cn/article/TLGRcZ8Zz7JmyNvd6rCQ

https://www.infoq.cn/article/kTtlLZxNUPmlvYpzA0eF

https://www.infoq.cn/article/Bsomd9QO2p66YP3vRk5q


岗位职责(运维是干什么、产出什么)和关键指标(度量产出成果)


关键指标,不仅仅包含服务可用性,还有比如服务器资源达标率、服务故障数据(故障分类、故障响应时间、平均故障恢复时间、故障告警覆盖率)、服务安全指标、服务资源到位时长等等。


业务的成功是第一要务



最常做的变更是二进制、配置的变更,当然,还有对基础环境以及组件的变更需求。

定义故障 -> 响应故障 -> 快速定位 -> 快速止损

牵头整体的稳定性建设,各个业务需要出接口人极力配合,所谓的稳定性建设,包括事前的预防风控、事中的统筹协同、事后的复盘推进,这也是 SRE 对公司的最大价值。





对象管理是纵向模式,围绕运维对象、建设生命周期的管理平台。

场景管理是横向模式,根据运维场景、纳管多种运维对象的生命周期阶段。运维场景的分类,包括交付/变更、监控/度量、多云、成本等等,非常贴近业务研发的工作习惯、覆盖少数高频场景


  • 先保障稳定,然后再优化
  • 提供可靠的测试依据和时间验证
  • 使用可控的自动化手段提升效率
  • 保持简单,监控一切
  • 面向预算的运维
  • 面向场景的智能运维 - 智能运维就是需要深入理解业务,合理配置资源和架构来满足不同业务场景的需求
  • 持续集成和发布系统

  • 一、 以可配置为荣,以硬编码为耻

  • 二、 以互备为荣,以单点为耻

  • 三、 以随时重启为荣,以不能迁移为耻

  • 四、 以整体交付为荣,以部分交付为耻

  • 五、 以无状态为荣,以有状态为耻

  • 六、以标准化为荣,以特殊化为耻

  • 七、以自动化工具为荣,以手动和人肉为耻

  • 八、以无人值守为荣,以人工介入为耻



关注公司的业务现在急需什么?公司最核心的用户他们需要什么?他们需要什么我们就优先做什么,

Comments

Popular posts from this blog

Docker Container mount to a mysteric folder which I don't know where is it.

读书笔记 - 2023 State of DevOps Report Platform Engineering Edition

[读书笔记] - 3-rhetorical-techniques-to-increase-your-impact