扫码阅读
手机扫码阅读
混沌工程赋能:规模化地应对上云后的未知暗债
431 2023-07-20
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
文章来源:
吾真本说混沌工程
扫码关注公众号
企业上云后遭遇未知暗债
企业在上云过程中,会面临系统复杂性增加导致的暗债问题,这些暗债是不可见的系统异常,只能在发生故障时被感知。
混沌工程要解决的问题
混沌工程起源于Netflix遭遇上云后的暗债问题,通过故障注入实验“混沌猴”规模化应对暗债,提高系统稳定性。
混沌工程赋能的核心
混沌工程的核心在于规模化地赋能开发团队,使其全面理解复杂系统的运作和失效方式,强化系统稳定性设计。
为混沌工程赋能创造好的条件
创建好的混沌工程赋能条件包括服务分级、责任分配、质量内建、生产环境验证、架构文档、故障监控工具、系统稳定性度量、灾难恢复计划、服务等级目标、故障预算、值班机制和混沌工程实验等12件事。
混沌工程的成效度量
混沌工程的成效度量可以借鉴Kirkpatrick模型,该模型是教育领域的一种成效评估工具。
混沌工程赋能的过程
混沌工程赋能过程包含成立赋能团队、选择试点服务、混沌工程实战营、挑选种子、现状调研、导入理念、沉淀案例、案例分享和优化过程等9个步骤。
总结
混沌工程是规模化赋予开发团队系统稳定性的活动。通过解决早期大众的痛点,实现从早期采纳者到早期大众的过渡,逐步规模化。
想要了解更多内容?
文章来源:
吾真本说混沌工程
扫码关注公众号
吾真本说混沌工程的其他文章
3年实践之编程操练攻略
首先感谢codingstyle.cn的掌门人匠友李小波的邀请,让我于2016年3月30日晚,在欢乐的bilibili.com上进行“如何进行编程操练”的直播、录屏并写就此文。含“如何进行编程操练”录屏及高清版PPT下载地址。
被遗漏的度量指标
DevOps的4个关键指标,似乎已经成为能解释一切软件开发生产力(或研发效能)问题的“北极星”指标。 我们
懂人心的软件开发:不现实的机器化软件人假设
业界只重视技术和过程,忽视软件人的心理,导致软件人消极应付开发规范。懂人心的软件开发,将心理学和行为经济学研究成果,应用于软件工程和敏捷软件开发,用助推方法,以较低成本,让软件人在工作中自然做出提升软件产品质量和用户价值的行为。
崩后的B站,适合执行混沌工程实验
对于那些对自己所开发和维护的系统,能否在生产环境长期稳定运行缺乏信心的团队,可以考虑实践混沌工程,以持续探索和快速修复未知生产故障,提升信心。
2016版编程操练神器Cyber-dojo的VMDK虚拟机镜像文件下载
经过Cyber-dojo的作者Jon Jagger的同意,我把在我电脑VirtualBox虚拟机中安装完毕的新版Cyber-dojo私有服务器的14GB大小的VMDK文件,切成14份,上传到云盘,供大家下载,能免去翻墙安装的痛苦。
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线