扫码阅读
手机扫码阅读
我对混沌工程的理解
99 2024-02-24
混沌工程是什么
用户需求在不断变化,随之而来的业务的复杂化、多样化、快速迭代; 业务倒逼系统架构不断优化和演进:服务集群→分布式→微服务→容器化→上云; 业务和技术的迭代演进过程会引入新的风险,因为人对风险往往会产生低估或者忽视;
组织&流程:7*24小时值班、在线oncall应急响应机制; 技术&方法:SRE、生产全链路压测、容灾演练、异地多活;
混沌工程的实践方法
建立稳定状态的假设(制定合适的目标); 多样化现实世界事件(选择合适的场景); 在生产环境运行实验(在真实环境运行实验); 持续自动化运行实验(避免人为误操作风险); 最小化控制爆炸半径(控制实验的影响范围和程度);
混沌工程应具备的功能及服务能力:覆盖基础设施、平台功能、平台性能及支撑能力,平台功能包括故障场景、介质管控、场景库管理、演练计划、演练流程、演练防护、演练观测及演练报告。 混沌工程的成熟度模型和评估等级:
基础级:能够基本实现功能要求; 增强级:在基础级别能上,具备较高级的功能实现; 先进级:在增强级能力上,具备行业内领先的功能实现;
原文链接:
http://mp.weixin.qq.com/s?__biz=Mzg2NDAwMjM1NQ==&mid=2247487217&idx=1&sn=12f0b582cde90d43cafcbbed8bfa93c1&chksm=ce7146adf906cfbb43900f764ba898025bdb7d1b6dd56c213af96729797ea8df7e1832eb9253#rd
老张的求知思考世界的其他文章
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线