LangChain 实现灵活 Agents 与 RAG 集成实战 | 极客日志

PythonAI算法

LangChain 实现灵活 Agents 与 RAG 集成实战

综述由AI生成如何使用 LangChain 的 Agents 模块实现灵活的检索增强生成（RAG）系统。通过将 Retriever 封装为工具，使大模型能够自主判断何时调用检索器，从而在必要时检索外部知识，无需检索时直接使用模型原有能力。文章详细讲解了构建检索器、封装工具、配置 Prompt 及模型、创建 Agent 执行器的完整流程，并分析了不同场景下的运行结果。此外，还提供了关于工具描述优化、温度参数控制及成本权衡的最佳实践建议，旨在提升 AI 应用的智能化水平与效率。

DotNetGuy发布于 2025/2/6更新于 2026/6/123 浏览

LangChain 实现灵活 Agents 与 RAG 集成实战

背景与目标

在传统的检索增强生成（RAG）系统中，通常的做法是无论用户问题是否涉及外部知识，都会强制调用检索器去查询向量数据库。这种机制虽然保证了信息的准确性，但在处理通用对话或模型自身已掌握的知识时，会引入不必要的延迟和成本。

为了优化这一过程，我们需要让程序具备判断能力：仅在必要时才去检索，不必要时直接使用大模型的原有数据来回答。本文将介绍如何使用 LangChain 的 Agents（智能体）模块，将 Retriever（检索器）封装为工具，赋予大模型自主决定是否使用检索能力的权限。

1. 构建基础检索器 (Retriever)

首先，我们需要一个可用的检索器实例。这通常涉及加载文档、分块、向量化并存储到向量数据库中。以下是基于 Web 页面内容的标准构建流程：

import bs4
from langchain import hub
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import Chroma
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 加载网页内容
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_only=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)
docs = loader.load()

# 文本分块
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 创建向量库
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# 初始化检索器
retriever = vectorstore.as_retriever()

在此步骤中，我们使用了 WebBaseLoader 加载特定博客文章，并通过 RecursiveCharacterTextSplitter 进行文本切分，最后利用 Chroma 向量数据库存储嵌入向量。生成的对象将在后续作为 Agent 的工具被调用。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

retriever

from langchain.tools.retriever import create_retriever_tool

tool = create_retriever_tool(
    retriever,
    "search_agents_answer",
    "Searches and returns context from LLM Powered Autonomous Agents. Answering questions about the agents.",
)
tools = [tool]

from langchain import hub
from langchain_openai import ChatOpenAI

# 拉取官方工具 Agent 模板
prompt = hub.pull("hwchase17/openai-tools-agent")

# 初始化模型
llm = ChatOpenAI(temperature=0)

from langchain.agents import AgentExecutor, create_openai_tools_agent

agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

result = agent_executor.invoke({"input": "hi, 我是【同学小张】"})
print(result["output"])

result = agent_executor.invoke(
    {
        "input": "What is Task Decomposition?"
    }
)
print("output2: ", result["output"])

LangChain 实现灵活 Agents 与 RAG 集成实战

LangChain 实现灵活 Agents 与 RAG 集成实战

背景与目标

1. 构建基础检索器 (Retriever)

更多推荐文章

相关免费在线工具

2. 封装检索工具 (Retriever Tool)

3. 配置 Prompt 模板与模型

4. 创建 Agent 与执行器

原理简述

5. 运行测试与分析

场景一：通用问候

场景二：专业领域提问

6. 最佳实践与扩展建议

总结

更多推荐文章

相关免费在线工具

LangChain 实现灵活 Agents 与 RAG 集成实战

LangChain 实现灵活 Agents 与 RAG 集成实战

背景与目标

1. 构建基础检索器 (Retriever)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 封装检索工具 (Retriever Tool)

3. 配置 Prompt 模板与模型

4. 创建 Agent 与执行器

原理简述

5. 运行测试与分析

场景一：通用问候

场景二：专业领域提问

6. 最佳实践与扩展建议

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具