扫码阅读
手机扫码阅读
节省显示器同时提升持续集成问题修复及时性的“流水线问题责任聚焦”实验

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

吾真本说混沌工程
扫码关注公众号
在提高开发团队流水线问题修复及时性的探索中,采用了一个大显示器展示持续集成流水线的健康状况。然而,出现了一个问题:所有开发人员面对显示屏上的红色/黄色告警时,都可能认为别人已经注意到并处理,因此忽略了告警,这是一种“责任稀释”的现象。
为了解决这一问题,设计了一个实验,旨在找出提高团队修复流水线问题的及时性的方法。实验步骤分为五个阶段:
- 基于观察。
- 问出问题。
- 形成可验证的解释性假说。
- 基于假说做出预测。
- 设计并执行有对照组的实验检验预测。
实验中,由IT部门负责人和两个开发团队负责人组成实验小组。各团队负责人需要准备观测工具来监控流水线健康状况,并设置修复时间标准。实验组去除了工位附近的健康显示屏,要求开发人员通过个人电脑监控流水线状况,并立即修复发现的问题。
实验分为三个迭代,每迭代两周,在迭代末召开会议分析数据。在实验的第6周结束时,总结对比实验组和对照组的数据,并根据结果决定是否需要调整假说、预测或实验过程。
实验旨在通过混沌工程的方法,提高开发团队的问题响应速度和解决效率。
想要了解更多内容?

吾真本说混沌工程
扫码关注公众号
吾真本说混沌工程的其他文章
在不增加成本的情况下引导开发人员做好功能自测的“开发与测试岗位更名为系统红蓝军”实验
开发和测试人员的岗位,分别改名为*系统红军*和*系统蓝军*。系统红军需要对所设计和编写的软件特性在整个系统中正常运行负全责,而系统蓝军需要从整个系统的角度模拟现实生产环境各种刁钻的场景来考验系统红军所设计和实现的软件特性,能否正常运行,
以线上事故驱动混沌工程更能展现价值
运维部门离线上事故更近,所以可以用线上事故驱动混沌工程,来体现混沌工程的价值。可以优选“严重级别”高且“业务影响时长”长的线上事故,有助于多样化地在混沌工程实验中引入现实世界事件,并能更好度量成效。
2016版编程操练神器Cyber-dojo的VMDK虚拟机镜像文件下载
增加了md5,更新了下载链接。经过Cyber-dojo作者Jon Jagger的同意,我把自己的虚拟机中安装完毕的新版Cyber-dojo私有服务器的14GB大小的VMDK文件,切成14份,上传到云盘,供大家下载,能免去翻墙安装的痛苦。
被遗漏的度量指标
DevOps的4个关键指标,似乎已经成为能解释一切软件开发生产力(或研发效能)问题的“北极星”指标。 我们
用UDDD破解软件开发的三大魔咒
详解如何破解“三次需求改变就能杀死程序员”、“不敢删除垃圾代码”、“不知如何切分系统”这软件开发的三大魔咒,并给出落地步骤。
加入社区微信群
与行业大咖零距离交流学习


PMO实践白皮书
白皮书上线
白皮书上线