解决复杂查询难题：通过 Self-querying Prompting 优化 RAG 系统效率

在现代自然语言处理（NLP）领域，检索增强生成（RAG）系统因其能够结合外部知识库和大语言模型的强大生成能力，成为了提升信息检索质量的主流解决方案之一。然而，传统的 RAG 流程存在诸多挑战，尤其是在查询处理阶段，这可能直接影响检索的准确性和效率。为了解决这些问题，Self-querying prompting（自查询提示）应运而生，作为一种优化 RAG 系统查询过程的技术，显著提升了从向量数据库中检索相关信息的精度与质量。

一、背景

在理解 Self-querying prompting 之前，我们首先需要了解传统的 RAG 系统是如何工作的，以及为什么这一技术变得如此重要。

1. 什么是 RAG 系统？

检索增强生成（RAG, Retrieval-Augmented Generation）是一种结合了检索和生成的混合式 NLP 系统。RAG 的优势在于它可以利用外部知识库来帮助大模型回答更复杂的问题。例如，当用户输入问题时，RAG 系统会首先通过检索模块（通常基于向量搜索的方式）从庞大的知识库中获取最相关的文档片段（chunks），然后将这些片段整合到生成模型的输入中，帮助生成模型给出更准确、更符合上下文的回答。

Self-querying prompting 流程示意图

这种方法尤其适合解决知识密集型任务，比如技术支持、客户服务、信息查询等场景。然而，传统的 RAG 流程中直接使用用户的原始查询进行检索可能导致以下问题：

查询不具体：用户输入的查询可能过于宽泛或模糊，导致检索结果不够精准。
冗余信息：查询中可能含有与检索任务无关的多余信息，干扰检索效果。
缺少上下文：部分查询缺乏必要的上下文信息，使得检索效果不佳。

这些问题会导致模型生成的回答不够准确或不够相关。因此，如何优化查询，提升 RAG 系统的检索效率成为了关键。

2. 为什么需要 Self-querying prompting？

传统的查询优化方法通常依赖于用户手动调整查询内容，这对于不熟悉系统运作的用户来说并不友好。Self-querying prompting 的出现解决了这一难题，它通过自动优化查询的方式，使得 RAG 系统能够更智能、更高效地获取到准确的相关信息。

二、Self-querying prompting 的步骤与原理

Self-querying prompting 是通过一系列步骤来优化查询的，每一个步骤都与提高检索结果的精度和效率息息相关。下面我们逐一探讨每个步骤的具体细节及其背后的工作原理。

Self-querying prompting 核心机制

1. 信息抽取

信息抽取是 Self-querying prompting 的核心步骤之一。在这个阶段，系统利用大语言模型（如 GPT）对用户输入的原始查询进行分析和处理，从中提取出关键的属性和与检索任务相关的信息。

关键属性与非属性类信息：

关键属性（key attributes）是与查询直接相关的内容，通常包括用户的具体需求。例如，当用户查询一款商品时，关键属性可能包括价格、颜色、品牌等；而在查询电影或文章时，关键属性可能是导演、年份、评分等。

非属性类信息指的是那些可能帮助模型更好理解查询的背景信息。这些信息可能不直接属于查询的核心内容，但在上下文理解中扮演着重要角色。例如，用户可能会提供产品描述、使用场景等信息，帮助模型生成更符合预期的查询。

2. 生成过滤条件

在从查询中抽取关键信息后，接下来是生成过滤条件（filtered fields）。这些过滤条件可以被看作是检索系统的'预筛选器'，它们帮助减少与用户查询无关的结果。

过滤条件通常基于元数据（metadata），如产品类别、价格区间、用户评分等。通过对这些条件的设定，向量数据库可以在执行查询之前，先排除掉那些不符合基本需求的文档片段，从而提高整体检索的精度。

# 导入 openai api key import os from dotenv import load_dotenv, find_dotenv # .env 存储 api_key load_dotenv(find_dotenv()) # 导入 LangChain 和 OpenAI 相关模块 from langchain_openai import ChatOpenAI from langchain_community.vectorstores import Chroma from langchain_core.documents import Document from langchain_openai import OpenAIEmbeddings from langchain.chains.query_constructor.base import AttributeInfo from langchain.retrievers.self_query.base import SelfQueryRetriever # 初始化 OpenAI 大模型 llm = ChatOpenAI() # 示例文档 docs = [ Document( page_content="A bunch of scientists bring back dinosaurs and mayhem breaks loose", metadata={"year": 1993, "rating": 7.7, "genre": "science fiction"}, ), Document( page_content="Leo DiCaprio gets lost in a dream within a dream within a dream within ...", metadata={"year": 2010, "director": "Christopher Nolan", "rating": 8.2}, ), Document( page_content="A psychologist / detective gets lost in a series of dreams within dreams within dreams and Inception reused the idea", metadata={"year": 2006, "director": "Satoshi Kon", "rating": 8.6}, ), Document( page_content="A bunch of normal-sized women are supremely wholesome and some men pine after them", metadata={"year": 2019, "director": "Greta Gerwig", "rating": 8.3}, ), Document( page_content="Toys come alive and have a blast doing so", metadata={"year": 1995, "genre": "animated"}, ), Document( page_content="Three men walk into the Zone, three men walk out of the Zone", metadata={ "year": 1979, "director": "Andrei Tarkovsky", "genre": "thriller", "rating": 9.9, }, ), ] # 创建向量数据库 vectorstore = Chroma.from_documents(docs, OpenAIEmbeddings()) # 定义元数据字段信息 metadata_field_info = [ AttributeInfo( name="genre", description="The genre of the movie. One of ['science fiction', 'comedy', 'drama', 'thriller', 'romance', 'action', 'animated']", type="string", ), AttributeInfo( name="year", description="The year the movie was released", type="integer", ), AttributeInfo( name="director", description="The name of the movie director", type="string", ), AttributeInfo(name="rating", description="A 1-10 rating for the movie", type="float" ), ] # 创建 SelfQueryRetriever 实例 document_content_description = "Brief summary of a movie" retriever = SelfQueryRetriever.from_llm( llm, vectorstore, document_content_description, metadata_field_info, ) # 执行检索 print(retriever.invoke("I want to watch a movie rated higher than 8.5")) print(retriever.invoke("Has Greta Gerwig directed any movies about women")) print(retriever.invoke("What's a highly rated (above 8.5) science fiction film?")) print(retriever.invoke( "What's a movie after 1990 but before 2005 that's all about toys, and preferably is animated" ))

解决复杂查询难题：通过 Self-querying Prompting 优化 RAG 系统效率

一、背景

1. 什么是 RAG 系统？

2. 为什么需要 Self-querying prompting？

二、Self-querying prompting 的步骤与原理

1. 信息抽取

关键属性与非属性类信息：

2. 生成过滤条件

更多推荐文章

相关免费在线工具

3. 生成新的查询

4. 执行检索

5. 排序和返回结果

三、示例应用

步骤 1：信息抽取

步骤 2：生成过滤条件

步骤 3：生成新的查询

步骤 4：执行检索

步骤 5：排序和返回结果

四、Self-querying prompting 的优势

五、实现示例

六、最佳实践与注意事项

七、总结

更多推荐文章

相关免费在线工具

解决复杂查询难题：通过 Self-querying Prompting 优化 RAG 系统效率

一、背景

1. 什么是 RAG 系统？

2. 为什么需要 Self-querying prompting？

二、Self-querying prompting 的步骤与原理

1. 信息抽取

关键属性与非属性类信息：

2. 生成过滤条件

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 生成新的查询

4. 执行检索

5. 排序和返回结果

三、示例应用

步骤 1：信息抽取

步骤 2：生成过滤条件

步骤 3：生成新的查询

步骤 4：执行检索

步骤 5：排序和返回结果

四、Self-querying prompting 的优势

五、实现示例

六、最佳实践与注意事项

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具