聊聊大模型的幻觉问题

模型训练 AI

发布于 2024-01-30

4295

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：聊聊大模型的幻觉问题

文章来源：

敏捷测试转型

扫码关注公众号

扫码阅读

手机扫码阅读

鼎叔在这篇原创文章中聚焦于当前AI领域的火热议题——大模型AI实践，特别是它们产生的幻觉问题。文章强调，尽管幻觉问题在大模型中不可避免，但同时也体现了模型的创造力。此外，鼎叔提出了多种策略来降低这些幻觉的发生。

大模型的幻觉问题，即Hallucination，指模型基于有限元素和强大的语言表达能力生成逻辑上似乎合理但实际不符合已知常识的描述。幻觉可能由错误数据、训练过程失误、推理错误等多种原因触发。尽管闭源模型因用户反馈而幻觉较少，幻觉本身是大模型创造力的一部分，为人类提供了探索各种可能性的“梦工厂”。

针对幻觉问题，鼎叔建议采取多种解决方案，如使用不同来源的语料库进行训练、结合检索和生成模型、手动标注和修订数据集、优化提示工程、改进编解码器、严格数据比对、引入常识规则、收集跨模态幻觉案例、保留原始训练数据、训练模型承认不确定性、完善预训练策略、以及使用其他大模型进行置信度评分。

同时，鼎叔认为大模型幻觉与安全息息相关，预见黑产可能利用幻觉进行舆论操纵或攻击，这一新方向值得进一步探究。最后，他预告将探讨大模型在业务创新、研发效能、测试领域的应用，以及测试工程师的适应技能。

敏捷测试转型

查看原文：聊聊大模型的幻觉问题

文章来源：

敏捷测试转型

扫码关注公众号

相关推荐

极佳、中科院等9机构联合首发 | 3万字长文全面解析世界模型(内容生成/自动驾驶等)

模型世界生成视频

击下方卡片，关注“AI生成未来”>>后台回复“GAI

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

模型训练语言 GPT

点击下方卡片，关注“AI生成未来”>>后台回复“

理解 DDD：编程中的模型思维

511

模型业务计算机逻辑

业务设计上往往没有建立起特定的领域模型，这是我们架构腐化和软件开发困难的关键原因。**业务领域建立好的模型，并指导代码实践，这就是 ”编程思维“。** DDD 领域驱动设计就是解决这部分问题，与其叫领域驱动设计，不如叫做模型驱动设计。

具身智能成败之关键！干货长文首次全面回顾具身智能领域中的视觉-语言-动作模型！

模型语言视觉机器人

点击下方卡片，关注“AI生成未来”>>后台回复“

LLMOps快速入门，轻松开发部署大语言模型

599

模型 LLM LLMOps 提示

深入介绍LLMOps。

AIGC｜万字长文！带你了解AI大模型技术演进

2539

模型神经网络 AI

大模型时代来临，我们站上了风口浪尖→

敏捷测试转型

《无测试组织-测试团队的敏捷转型》主题探讨。从打造测试的组织敏捷，到敏捷测试技术的丰富实践，从一线团队的视角来聊聊我们是怎么做的。面向未来，拥抱敏捷原则，走向高效能组织。

81 篇文章

浏览 73.5K

敏捷测试转型的其他文章

聊聊探索式测试与敏捷实践

探索式测试在敏捷测试象限中处于右上角，即面向业务且评价产品，这篇补充一下探索式测试在项目测试中体现出的敏捷价值观，分享探索式测试进阶实践的经验。

聊聊组织中如何成功导入变革（上）

也许你对一种全新技术框架或者敏捷框架充满兴趣，希望在组织中落地，坚信它一定会带来显著变化和收益，那么你会怎么做？如何系统地成功导入一场新技术变革？

聊聊集体缺陷大扫除

集体缺陷大扫除，是敏捷团队质量共建最重要的活动，没有之一。探索式测试天然就适合集体进行，在正确的组织形式下，通过团队放大探索测试的惊人效果。按照测算，有了团队的氛围加成，单位时间内探索的成果收益可以提高4倍以上！

聊聊如何测试你的测试（翻译自Meta）

第一篇自行翻译的硅谷公司技术文章，来自facebook(Meta),关于flaky test的量化度量与应用，这也是国内很多大学教授喜欢的研究课题。原文：How do you test your tests?

聊聊用户体验与常规缺陷的异同

《提升用户体验的评测方案》议题下的第三篇系列文章，展开分享测试团队应如何理解用户体验模型，到底它和常规测试关注点的区别是什么，以及管理者如何培养测试人员对用户体验的关注习惯。

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

聊聊大模型的幻觉问题

版权声明

联系我们

融实践库

微信公众号

微信视频号

社区微信群

聊聊大模型的幻觉问题

版权声明

大模型幻觉困境下，我们该如何使用它？

需求变更，敏捷项目应如何做？

联系我们

融实践库

微信公众号

微信视频号

社区微信群