扫码阅读

手机扫码阅读

混沌工程杂谈

868 2023-08-19

混沌工程实验故障故障注入

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：混沌工程杂谈

文章来源：

茹炳晟聊软件研发

扫码关注公众号

混沌工程摘要

混沌工程在分布式系统中的应用摘要

分布式系统由于其庞大的规模和复杂的依赖关系，预防单点故障对系统的影响已经变得异常困难。在快速迭代的商业和技术环境中，保障系统稳定性和高可用性面临前所未有的挑战，不当处理可能导致严重的业务损失或其他意外行为。

由于无法阻止分布式系统中的故障发生，混沌工程旨在提前识别潜在的异常行为。这种方法颠覆了传统的测试底层逻辑，依赖于对系统架构的深刻理解。与故障注入测试不同，混沌工程不是为了验证预期结果，而是探索未知可能性。

区分混沌工程和简单的破坏行为是理解其概念的关键。例如，随机关闭服务器或应用实例，如果没有计划和目的，可能被视为破坏；而在混沌工程中，这些行为是为了测试系统的弹性和发现潜在问题。

实施混沌工程的必要性在于，早期测试环境与生产环境差异巨大，直接在生产环境中进行混沌实验有其价值。对于业务逻辑故障的模拟则无需在生产环境中进行，因为测试环境即可覆盖。

混沌工程的自动化概念已经提出，但由于解决后的问题通常不会立即重现，且架构稳定时不需频繁回归测试，自动化的必要性受到质疑。但自动化故障构造工具仍有助于混沌实验的便利性。

混沌工程成功的关键在于收集各种故障变量，要尽可能考虑到所有潜在的故障和异常，减少团队对“未知未知”的恐惧。这需要广泛收集历史上的故障数据，形成故障变量图谱，才能有效实施混沌工程。

想要了解更多内容？

查看原文：混沌工程杂谈

文章来源：

茹炳晟聊软件研发

扫码关注公众号

相关推荐

以线上事故驱动混沌工程更能展现价值

726

混沌工程测试事故

运维部门离线上事故更近，所以可以用线上事故驱动混沌工程，来体现混沌工程的价值。可以优选“严重级别”高且“业务影响时长”长的线上事故，有助于多样化地在混沌工程实验中引入现实世界事件，并能更好度量成效。

聊聊混沌工程

622

混沌工程实验系统

混沌工程是一门新兴学科，它不仅仅只是个技术活动，还包含如何设计能够持续协作的混沌实验。它由Neflix首先在实践中发现了混沌工程的商业价值，通过构建更有韧性的系统来抵御海量组件系统的意外失效

聊聊混沌工程的企业实践

600

混沌工程实验

很多著名公司把混沌工程实验做成“Game Day”，用游戏比赛的有趣竞争状态来进行混沌实验，而不是制造如临大敌的气氛。本文详细介绍各大企业实践混沌工程的优秀流程，经验教训，人为阻力，人和组织的能力提升，从中学习到了哪些洞见

混沌工程赋能：规模化地应对上云后的未知暗债

622

服务团队混沌赋能

企业如何规模化地赋能团队，以应对上云后所遭遇的未知暗债？在解决这个复杂问题的过程中，混沌工程诞生了。

大厂在混沌工程领域的实践

569

混沌工程

大厂在混沌工程领域的最佳实践。

我对混沌工程的理解

628

工程混沌实践稳定性

重新认识混沌工程。

茹炳晟聊软件研发

关注软件研发行业效能提升与质量提升的工程实践，普及研发效能宣言的价值观、最佳实践与工程落地案例

14 篇文章

浏览 13.3K

茹炳晟聊软件研发的其他文章

ChatGPT在GUI自动化测试领域的应用

浅谈软件研发的复杂性与应对之道

大概在五六年前，有一次我在Google美国总部参加一次技术交流，有一个演讲让我印象深刻，让我至今一直记忆犹新

软件测试的权衡与取舍

选择了某一方向上的决策，总是会相对应地限制事情在另一个方向上发展的可能性。每个测试工程师都应学会权衡与取舍。

一个即将秃头的工程师，解答你对“变异测试”的所有困惑

不懂变异测试，你好意思说自己是测试工程师，今天让我（一个即将秃头的工程师）带你深入浅出理解变异测试的方方面面。

优秀的测试工程师为什么要懂大型网站的架构设计

随机阅读

采用Minitab进行logistic回归分析

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

混沌工程杂谈

混沌工程在分布式系统中的应用摘要

联系我们

融实践库

微信公众号

微信视频号

社区微信群

混沌工程杂谈

混沌工程在分布式系统中的应用摘要

快刀斩乱麻，DevOps让代码评审也自动起来

联系我们

融实践库

微信公众号

微信视频号

社区微信群