扫码阅读
手机扫码阅读

数据中存在的假象

98 2024-10-02

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:数据中存在的假象
文章来源:
麦哲思科技任甲林
扫码关注公众号

在实施CMMI高成熟度的软件公司中,分析过程性能数据时,常出现无法证明理应相关的变量间的相关性,或者出现与假设相反的分析结果。这种现象引发了对相关性分析过程中存在的问题的探讨。

首先,根据经验和常识,人们通常会有以下假设:

  • 假设1:高水平的测试人员比低水平的测试人员发现的BUG多。
  • 假设2:高水平的开发人员犯的错误应该比低水平的开发人员少。

然而,在实际数据分析中,发现这两个假设并未得到支持。原因在于,软件公司在实践中通常采用以下策略:

  • 策略1:关键模块由高水平开发人员开发,非关键模块由低水平开发人员开发。
  • 策略2:高水平测试人员测试关键模块,低水平测试人员测试非关键模块。

这些策略导致了实际数据是有偏的样本,而不是随机样本。因此,历史数据显示发现的BUG数量与开发或测试人员的水平无关,这与假设1和假设2相矛盾。

为了证明这两个假设,需要进行实验,即在控制其他条件不变的情况下,观察测试人员和开发人员的水平对BUG数量的影响,并通过统计过程的性能数据来验证假设的正确性。

总结来说,当数据分析结果与常识不符时,我们应该深入分析原因,可能是由于样本选择的偏差所导致的。理解这一点对于正确解读性能数据和改进过程至关重要。

想要了解更多内容?

查看原文:数据中存在的假象
文章来源:
麦哲思科技任甲林
扫码关注公众号

麦哲思科技(北京)有限公司总经理 敏捷性能合弄模型评估师 认证的Scrum Master 认证的大规模敏捷顾问SPC CMMI高成熟度主任评估师 COSMIC MPC,IAC 成员,中国分部主席

425 篇文章
浏览 105.4K
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设 白皮书上线