LangChain Agent 中间件详解：提升可靠性与可控性 | 极客日志

PythonAI

LangChain Agent 中间件详解：提升可靠性与可控性

介绍 LangChain Agent 中间件机制，涵盖内置中间件如对话总结、人工介入、限流、重试及降级功能，并详解基于装饰器和类的自定义中间件开发方法。通过钩子（Hook）与执行点概念，结合 AgentState 和 Runtime 对象，帮助开发者构建高可靠、可控的大模型应用。

竹影清风发布于 2026/3/21更新于 2026/5/2327 浏览

前言

在构建复杂的 LangChain Agent 时，我们常常面临上下文超限、成本失控、工具调用失败、敏感信息泄露等问题。LangChain 提供了一套生产就绪的预构建中间件，像乐高积木一样，让我们轻松为 Agent 添加对话总结、人工审核、调用限流、自动重试等能力。

一、中间件是什么？

中间件（Middleware）是 LangChain Agent 执行流程中的钩子函数，可以在模型调用前、工具执行前后、状态更新时插入自定义逻辑。预构建中间件覆盖了从成本控制到安全合规的常见场景，且支持灵活配置。

所有中间件通过 create_agent 的 middleware 参数传入：

from langchain.agents import create_agent
agent = create_agent(
    model="gpt-4.1",
    tools=[...],
    middleware=[Middleware1(...), Middleware2(...)]  # 按顺序执行
)

二、通用中间件详解（Provider-agnostic）

langchain 为我们提供了多个常用的现成的中间件，我们可以根据任务选择使用。这里讲解一些基础中间件，复杂中间件将在后续内容中讲解。

2.1 对话总结（SummarizationMiddleware）

场景：长对话易超 Token 限制，自动总结旧消息，保留最新上下文。
配置：
- trigger：触发总结的条件（如 token 数≥4000 或消息数≥6）
- keep：总结后保留的内容（如保留最近 20 条消息）
- model：用于生成总结的模型（通常用更便宜的模型）

from langchain.agents import create_agent
from langchain.agents.middleware import SummarizationMiddleware

agent = create_agent(
    model="gpt-4.1",
    tools=[weather_tool, calculator_tool],
    middleware=[
        SummarizationMiddleware(
            model="gpt-4.1-mini",  # 用迷你模型做总结
            trigger=[("tokens", 4000), ("messages", 6)],  # 任一条件触发
            keep=("messages", 20)  # 保留最近 20 条原始消息
        )
    ]
)

2.2 人工介入（HumanInTheLoopMiddleware）

场景：高风险操作（如发送邮件、修改数据库）需人工审批。
- interrupt_on：指定哪些工具需要人工介入，及允许的决策（approve/edit/reject）
- 必须搭配 checkpointer（如 InMemorySaver）实现状态暂停/恢复

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

from langchain.agents import create_agent
from langchain.agents.middleware import HumanInTheLoopMiddleware
from langgraph.checkpoint.memory import InMemorySaver

agent = create_agent(
    model="gpt-4.1",
    tools=[read_email_tool, send_email_tool],
    checkpointer=InMemorySaver(),
    middleware=[
        HumanInTheLoopMiddleware(
            interrupt_on={
                "send_email_tool": {"allowed_decisions": ["approve", "edit", "reject"]},
                "read_email_tool": False  # 无需人工介入
            }
        )
    ]
)

from langchain.agents.middleware import ModelCallLimitMiddleware

agent = create_agent(
    model="gpt-4.1",
    checkpointer=InMemorySaver(),  # 跨多轮对话限制需要 checkpointer
    tools=[],
    middleware=[
        ModelCallLimitMiddleware(
            thread_limit=10,  # 整个对话最多调 10 次模型
            run_limit=5,  # 单次请求最多调 5 次
            exit_behavior="end"
        )
    ]
)

from langchain.agents.middleware import ToolCallLimitMiddleware

agent = create_agent(
    model="gpt-4.1",
    tools=[search_tool, db_tool],
    middleware=[
        ToolCallLimitMiddleware(thread_limit=20, run_limit=10),  # 全局限制
        ToolCallLimitMiddleware(tool_name="search", thread_limit=5, run_limit=3)  # 特定工具
    ]
)

from langchain.agents.middleware import ModelFallbackMiddleware

agent = create_agent(
    model="gpt-4.1",
    tools=[],
    middleware=[
        ModelFallbackMiddleware(
            "gpt-4.1-mini",  # 第一备用
            "claude-3-5-sonnet-20241022"  # 第二备用
        )
    ]
)

from langchain.agents.middleware import ToolRetryMiddleware

agent = create_agent(
    model="gpt-4.1",
    tools=[api_tool],
    middleware=[
        ToolRetryMiddleware(
            max_retries=3,
            backoff_factor=2.0,  # 指数退避：1s, 2s, 4s
            retry_on=(ConnectionError, TimeoutError),
            on_failure="return_message"
        )
    ]
)

from langchain.agents.middleware import ModelRetryMiddleware

agent = create_agent(
    model="gpt-4.1",
    tools=[],
    middleware=[
        ModelRetryMiddleware(
            max_retries=4,
            retry_on=lambda e: hasattr(e, "status_code") and e.status_code == 429,  # 仅重试限流
            on_failure="continue"  # 返回错误消息让 Agent 继续
        )
    ]
)

from langchain.agents.middleware import after_model
from langchain.messages import AIMessage

@after_model(can_jump_to=["end"])  # 声明允许跳转到 end 节点
def block_sensitive_output(state, runtime):
    last_msg = state["messages"][-1]
    if "password" in last_msg.content.lower():  # 修改最后一条消息，并跳转到结束节点
        return {"messages": [AIMessage("I cannot reveal that information.")], "jump_to": "end"}
    return None

装饰器	执行时机	函数签名	典型用途
@before_agent	整个代理调用开始时（仅一次）	(state: AgentState, runtime: Runtime) -> dict	None
@before_model	每次模型调用之前	(state: AgentState, runtime: Runtime) -> dict	None
@after_model	每次模型调用之后	(state: AgentState, runtime: Runtime) -> dict	None
@after_agent	整个代理调用结束时（最多一次）	(state: AgentState, runtime: Runtime) -> dict	None

装饰器	作用范围	函数签名	典型用途
@wrap_model_call	每次模型调用	(request: ModelRequest, handler: Callable) -> ModelResponse	重试、缓存、动态模型切换
@wrap_tool_call	每次工具调用	(request: ToolRequest, handler: Callable) -> ToolResponse	重试、模拟、权限检查
@dynamic_prompt	生成动态系统提示词	(request: ModelRequest) -> str	个性化提示词、根据上下文调整系统消息

from langchain.agents.middleware import wrap_model_call
import time

@wrap_model_call
def retry_with_backoff(request, handler):
    max_retries = 3
    for attempt in range(max_retries):
        try:
            return handler(request)
        except Exception as e:
            if attempt == max_retries - 1:
                raise  # 最后一次失败则向上抛出异常
            wait = (2 ** attempt)  # 指数退避：1, 2, 4 秒
            time.sleep(wait)
            print(f"Retry {attempt+1}/{max_retries} after {wait}s")

from langchain.agents.middleware import AgentMiddleware

class MyMiddleware(AgentMiddleware):
    def before_agent(self, state, runtime):  # 返回 None 或字典
        pass

    def before_model(self, state, runtime):
        pass

    def after_model(self, state, runtime):
        pass

    def after_agent(self, state, runtime):
        pass

class MyMiddleware(AgentMiddleware):
    def wrap_model_call(self, request, handler):
        # 在调用前可以修改 request
        # 可以选择是否调用 handler，以及调用几次
        response = handler(request)
        # 在调用后可以修改 response
        return response

    def wrap_tool_call(self, request, handler):
        # 类似 wrap_model_call，但 request 是 ToolRequest 类型
        pass

class RetryMiddleware(AgentMiddleware):
    def __init__(self, max_retries=3):
        self.max_retries = max_retries
        super().__init__()

LangChain Agent 中间件详解：提升可靠性与可控性

前言

一、中间件是什么？

二、通用中间件详解（Provider-agnostic）

2.1 对话总结（SummarizationMiddleware）

2.2 人工介入（HumanInTheLoopMiddleware）

更多推荐文章

相关免费在线工具

2.3 模型调用限流（ModelCallLimitMiddleware）

2.4 工具调用限流（ToolCallLimitMiddleware）

2.5 模型降级（ModelFallbackMiddleware）

2.6 工具重试（ToolRetryMiddleware）

2.7 模型重试（ModelRetryMiddleware）

三、自定义中间件

3.1 核心概念：钩子（Hook）与执行点

3.2 基于装饰器的中间件

3.2.1 节点式装饰器

3.2.2 包装式装饰器

3.3 基于类的中间件

3.3.1 节点式钩子方法

3.3.2 包装式钩子方法

3.3.3 类中间件的初始化

四、深入理解 AgentState 和 Runtime

4.1 AgentState

4.2 Runtime

更多推荐文章

相关免费在线工具

LangChain Agent 中间件详解：提升可靠性与可控性

前言

一、中间件是什么？

二、通用中间件详解（Provider-agnostic）

2.1 对话总结（SummarizationMiddleware）

2.2 人工介入（HumanInTheLoopMiddleware）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3 模型调用限流（ModelCallLimitMiddleware）

2.4 工具调用限流（ToolCallLimitMiddleware）

2.5 模型降级（ModelFallbackMiddleware）

2.6 工具重试（ToolRetryMiddleware）

2.7 模型重试（ModelRetryMiddleware）

三、自定义中间件

3.1 核心概念：钩子（Hook）与执行点

3.2 基于装饰器的中间件

3.2.1 节点式装饰器

3.2.2 包装式装饰器

3.3 基于类的中间件

3.3.1 节点式钩子方法

3.3.2 包装式钩子方法

3.3.3 类中间件的初始化

四、深入理解 AgentState 和 Runtime

4.1 AgentState

4.2 Runtime

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具