扫码阅读

手机扫码阅读

动手做一个最小RAG——TinyRAG

308 2024-09-29

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：动手做一个最小RAG——TinyRAG

文章来源：

Datawhale

扫码关注公众号

Datawhale干货摘要

Datawhale干货

作者：宋志学，Datawhale成员

本文由宋志学介绍如何一步一步实现一个简化版的RAG模型，即Tiny-RAG。

1. RAG 介绍

RAG模型通过在生成答案前从文档数据库中检索信息，提高了内容的准确性和相关性。RAG包含几个基本结构：向量化模块、文档加载和切分模块、数据库、检索模块和大模型模块。流程包括索引、检索和生成。

2. 向量化

向量化是RAG的基础，涉及文档片段向量化。通过构建一个Embedding基类可以方便地扩展代码，示例中展示了使用OpenAI API进行文档片段向量化。

3. 文档加载和切分

文档加载和切分类负责将文档切分成片段。文档可以是任何文本格式，如pdf、md或txt。切分时要考虑重叠内容和句子完整性。

4. 数据库和检索

数据库负责存储文档片段和向量表示。检索是通过问题向量化和相似度计算来实现的，没有使用成熟的数据库，而是便于理解和修改的Numpy。

5. 大模型模块

大模型模块根据检索到的文档回答问题。通过实现一个BaseModel基类，可以快速地扩展到其他模型。示例使用InternLM2-chat-7B模型。

6. LLM Tiny-RAG Demo

演示了Tiny-RAG模型的使用，包括加载和切分文档、向量化、保存和加载数据库、问题的检索和回答。

7. 总结

文章总结了Tiny-RAG应包含的内容，并鼓励读者给项目点赞。

想要了解更多内容？

查看原文：动手做一个最小RAG——TinyRAG

文章来源：

Datawhale

扫码关注公众号

相关推荐

AIGC技术与应用生态发展进入新阶段，引领内容产业大革命！

311

AI AIGC 搜索 ChatGPT

【可编辑原版文件资料参照文章底部方法获取】【关注零竖质量公众号，获更多精品资料下载】 AIGC，即人

当ChatGPT永远记住了我的一切 - 他甚至比我自己还了解我

586

记忆信息 Memory Prompt

我想给他完整的一生

最强中文语音克隆BertVits2 - 有一点点麻烦，但是效果真的无敌

629

运行代码效果音频

曾经我写过一篇做语音克隆的AI音频工具：11Labs 效果?

盘一下最近爆火刷屏的3大AI视频项目 - 开始加速的未来

328

AI 阿里。。。字节

阿里的Animate Anyone\x0d\x0a字节跳动的MagicAnimate\x0d\x0a微软的GAIA

15个杀手级Python库，绘制令人惊艳的网络图

553

网络 Python https 图形

介绍15个优秀的Python工具用来绘制网络图。

我们为什么要学AI？

136

AI 一位爷爷视频

AI发展的实在太快了，短短一年的时间，已经步入了??

一个专注于AI领域的开源组织，汇聚了众多优秀学习者，使命-for the learner，和学习者一起成长。

45 篇文章

浏览 17.8K

Datawhale的其他文章

一文带你了解基于大模型的Agent

Datawhale干货作者：陈安东，Datawhale成员前言在

AI + X 组队学习来了！一起学Sora

Agent、Sora学习。

深度剖析AI机会，数字人智能对话系统：未来的人机交互新范式

Datawhale成员分享。

吴恩达 x OpenAI Prompt Engineering教程中文笔记

Datawhale干货作者：刘俊君，Datawhale成员完整课程??

代码逐行解析！冠军选手解读锂电池生产温度预测赛事方案

代码逐行解析，可一键运行。

随机阅读

案例：每日站立会议落实情况的再跟踪

你是否真的读懂了回归方程y=ax+b?

对需求签字画押，有用吗？

GOV与II两个PA的案例

COSMIC规模度量案例集四：业务应用软件案例—新增用户

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线