扫码阅读

手机扫码阅读

使用LangChain编写图检索查询，实现RAG

443 2024-10-10

查询文本节点检索 <

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：使用LangChain编写图检索查询，实现RAG

文章来源：

AI科技论谈

扫码关注公众号

RAG技术摘要

介绍RAG技术

检索增强生成（RAG）技术融合了大型语言模型的内部知识与外部权威数据源，以提高生成式AI模型的性能。本文介绍了如何使用Python和Langchain框架有效编写检索查询，以提升LLM的输出质量，并通过这种方式使开发者能在多种应用场景中实现高质量的AI生成内容。

1 数据集

数据集来源于EDGAR数据库的SEC文件，这些文件记录了上市公司的详细财务状况和关键信息。这些数据集包括不同行业、不同管理层持股的公司提交给SEC的财务表格。为了便于处理，将这些财务表格文本内容细分为小块，并为每块创建向量嵌入，存储在CHUNK节点中。在执行向量搜索查询时，通过对比查询向量与CHUNK节点的向量识别并提取最为相似的文本块。

2 构建检索查询

构建检索查询时，首先利用相似性搜索查询得到相关节点及其相似度得分。然后，执行检索查询，它不仅返回节点和得分，还包含文本内容和提供数据背景信息的元数据，确保结果的准确性和深度。

检索查询框架建立后，需要确定从中提取的信息。数据模型会识别出CHUNK节点，并在查询中以node AS doc的形式出现。目标是获取与CHUNK节点相连的Form、Person、Company、Manager和Industry等实体节点，并包括与每个CHUNK节点相邻的文本块。

为了提高效率，只聚焦于相似度最高的前5个块。这种策略有助于精确筛选最相关信息，减少数据处理。通过这种方法，构建既精确又高效的检索系统，为用户提供有价值的数据。查询结果还包括了相邻文本块的内容，确保结果的完整性和一致性。

最后，调整了RETURN语句以便将相邻文本块内容合并为一个变量，并使用coalesce()函数处理空值。此外，计划添加更多上下文信息，提取图中的其他相关实体。

想要了解更多内容？

查看原文：使用LangChain编写图检索查询，实现RAG

文章来源：

AI科技论谈

扫码关注公众号

相关推荐

SQL面试 100 问

4833

查询员工 SQL 答案

本文介绍并分析了 100 道常见 SQL 面试题，

【图文结合】全网最全的MySQL索引讲解，万字长文由浅入深带你认识索引

480

索引存储引擎查询

万字长文、图文结合、由浅入深带你认识MySQL索引!\x0a本文通过图文结合的方式,由浅入深的带你理解索引的奥妙!从索引是什么、到索引有什么用、索引如何用、如何设计索引、Mysql存储引擎是什么....

SqlServer事务详解（事务隔离性和隔离级别详解）

93

事务隔离查询回话

不少人对于事务的使用局限于begin transaction：开始事务、commit transaction：提交事务、rollback transaction：回滚事务的初步运用。并且知道使用事务后，事务中所有操作命令必须作为一个整

一文带你了解DAX Studio

766

DAX 查询点击导出

如何在Power BI Desktop下使用DAX Studio进行查询

使用LangChain和Llama-Index实现多重检索RAG

384

查询检索 Index 个子

介绍查询扩展技术，阐释其在LangChain和Llama-Index中的实现及对提高检索效率的贡献。

数仓选型之 StarRocks

343

数据 StarRocks ClickHouse 查询

数仓选型之 StarRocks基于全场景MPP（Massively Parallel Processing）

数即是空

108 篇文章

浏览 67.3K

AI科技论谈的其他文章

10个Pandas小技巧，快速上手数据分析

介绍10个Pandas小技巧。

力压Transformer，详解Mamba和状态空间模型（下）

介绍Mamba和状态空间模型。

基于LangGraph多智能体技术，搭建AI写作自动化系统

使用LangGraph实现多智能体系统。

利用LlamaIndex和本地PDF文档，轻松打造知识图谱GraphRAG

利用LlamaIndex框架和本地PDF文档，构建知识图谱索引，增强语言模型的理解和回答能力。

入门PyTorch，看这一篇就够了

介绍PyTorch。

随机阅读

杂谈推理逻辑的严密性

解读微信团队的七个价值观

案例：缺陷状态数据分析

使用Gompertz模型预测非典的趋势

公司级项目管理例会的汇报内容

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线