聊聊大模型的幻觉问题

模型训练 AI

发布于 2024-01-30

4313

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：聊聊大模型的幻觉问题

文章来源：

敏捷测试转型

扫码关注公众号

扫码阅读

手机扫码阅读

鼎叔在这篇原创文章中聚焦于当前AI领域的火热议题——大模型AI实践，特别是它们产生的幻觉问题。文章强调，尽管幻觉问题在大模型中不可避免，但同时也体现了模型的创造力。此外，鼎叔提出了多种策略来降低这些幻觉的发生。

大模型的幻觉问题，即Hallucination，指模型基于有限元素和强大的语言表达能力生成逻辑上似乎合理但实际不符合已知常识的描述。幻觉可能由错误数据、训练过程失误、推理错误等多种原因触发。尽管闭源模型因用户反馈而幻觉较少，幻觉本身是大模型创造力的一部分，为人类提供了探索各种可能性的“梦工厂”。

针对幻觉问题，鼎叔建议采取多种解决方案，如使用不同来源的语料库进行训练、结合检索和生成模型、手动标注和修订数据集、优化提示工程、改进编解码器、严格数据比对、引入常识规则、收集跨模态幻觉案例、保留原始训练数据、训练模型承认不确定性、完善预训练策略、以及使用其他大模型进行置信度评分。

同时，鼎叔认为大模型幻觉与安全息息相关，预见黑产可能利用幻觉进行舆论操纵或攻击，这一新方向值得进一步探究。最后，他预告将探讨大模型在业务创新、研发效能、测试领域的应用，以及测试工程师的适应技能。

敏捷测试转型

查看原文：聊聊大模型的幻觉问题

文章来源：

敏捷测试转型

扫码关注公众号

相关推荐

极佳、中科院等9机构联合首发 | 3万字长文全面解析世界模型(内容生成/自动驾驶等)

模型世界生成视频

击下方卡片，关注“AI生成未来”>>后台回复“GAI

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

模型训练语言 GPT

点击下方卡片，关注“AI生成未来”>>后台回复“

理解 DDD：编程中的模型思维

517

模型业务计算机逻辑

业务设计上往往没有建立起特定的领域模型，这是我们架构腐化和软件开发困难的关键原因。**业务领域建立好的模型，并指导代码实践，这就是 ”编程思维“。** DDD 领域驱动设计就是解决这部分问题，与其叫领域驱动设计，不如叫做模型驱动设计。

具身智能成败之关键！干货长文首次全面回顾具身智能领域中的视觉-语言-动作模型！

107

模型语言视觉机器人

点击下方卡片，关注“AI生成未来”>>后台回复“

LLMOps快速入门，轻松开发部署大语言模型

606

模型 LLM LLMOps 提示

深入介绍LLMOps。

AIGC｜万字长文！带你了解AI大模型技术演进

2552

模型神经网络 AI

大模型时代来临，我们站上了风口浪尖→

敏捷测试转型

《无测试组织-测试团队的敏捷转型》主题探讨。从打造测试的组织敏捷，到敏捷测试技术的丰富实践，从一线团队的视角来聊聊我们是怎么做的。面向未来，拥抱敏捷原则，走向高效能组织。

81 篇文章

浏览 74.1K

敏捷测试转型的其他文章

聊聊定位-如何占领用户心智

业务和产品频繁提及的“占领用户心智”，如何做，令人困惑。我们从营销领域著名的变革作品-《定位》，来理解一下为什么要占领用户心智，以及如何占领。软件产品的定位也是同样道理。

聊聊混沌工程的企业实践

很多著名公司把混沌工程实验做成“Game Day”，用游戏比赛的有趣竞争状态来进行混沌实验，而不是制造如临大敌的气氛。本文详细介绍各大企业实践混沌工程的优秀流程，经验教训，人为阻力，人和组织的能力提升，从中学习到了哪些洞见

聊聊技术外包的价值和团队组建

测试团队通常是企业外包实践的主力部门，基于多年的实践经验，本篇会展开聊聊，外包的分类和价值，如何选择合适的外包敏捷管理模式，以及如何组建外包团队。提高敏捷交付效率，满足商业目标。内容也适用于其他岗位的外包团队

聊聊研发效能建设的痛点

参加深圳敏捷之旅的感想：研发效能的痛苦，一是高层往往关心把业务快速打下来，打不下来就撤，而不是省钱提效，二是让别人提高效能，远比教小孩提高学习成绩难啊，强扭的瓜不甜。提高研发效能的本质，就是带着团队明确度量、无限拆解、刻意练习、自建纪律

随机阅读

COSMIC规模度量案例集三：业务应用软件案例—页面维护

10-01

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

聊聊大模型的幻觉问题

版权声明

联系我们

融实践库

微信公众号

微信视频号

社区微信群

聊聊大模型的幻觉问题

版权声明

大模型幻觉困境下，我们该如何使用它？

软件开发流变史：从瀑布开发到敏捷开发再到DevOps

联系我们

融实践库

微信公众号

微信视频号

社区微信群