AI Agent 开发进阶：架构、规划、记忆与工具编排 | 极客日志

PythonAI算法

AI Agent 开发进阶：架构、规划、记忆与工具编排

AI Agent 开发进阶涵盖架构设计、规划、记忆与工具编排。文章介绍分层架构（表达、决策、执行、记忆），提供工具注册与函数调用接口实现。包含记忆系统上下文管理、ReAct 循环规划、多代理协作管道及 RAG 知识增强。结合 FastAPI 服务化部署，强调安全治理、日志监控与质量评测。通过完整代码示例展示从零构建工具增强 Agent 的流程，适用于希望落地 Agent 能力的工程师。

PentesterX发布于 2026/2/9更新于 2026/7/1944 浏览

AI Agent 开发进阶：架构、规划、记忆与工具编排

在这里插入图片描述

1. 导读与目标

1.1 背景与主题

1.1.1 为什么是 AI Agent

AI Agent 将大语言模型与外部工具、记忆系统、规划器结合，形成可执行的智能体。它能理解复杂任务、主动调用工具、跨多步达成目标，在研发、数据、客服与自动化场景中显著提升效率与质量。

1.1.2 典型应用场景

代码助理：阅读代码、搜索、修改与测试联动。
数据分析：检索、清洗、分析与可视化流水线。
运营与客服：诊断、执行工具操作与闭环处理。

1.2 目标与受众

1.2.1 本文目标

构建 AI Agent 的参考架构与能力边界。
实现工具调用、记忆管理、规划执行与多代理协作的原型代码。
提供部署、可观察性、安全治理与评测的工程化建议。

1.2.2 适用读者

希望落地 Agent 能力的工程师与架构师。
评估与改造开源框架的技术负责人。

2. 总览：参考架构与设计原则

2.1 架构分层

2.1.1 表达层

系统提示词、角色约束与模板管理，决定 Agent 的目标与边界。

2.1.2 决策层

规划器与策略选择，决定是否调用工具、如何分解与执行任务。

2.1.3 执行层

工具路由与调用、结果解析与持久化，保障事实与行动的可用性。

2.1.4 记忆层

短期会话上下文与长期知识库，提供跨轮与跨任务的持续性。

2.2 能力边界

2.2.1 原则

事实优先：用工具或检索获取事实，避免臆测。
安全先行：白名单、沙箱与审计贯穿始终。
可观察性：日志与指标可追踪每个决策与行动。

2.3 设计原则

2.3.1 最小耦合与可替换

各层之间通过清晰接口解耦，支持替换模型、工具或存储实现。

3. 工具与函数调用接口

在这里插入图片描述

3.1 统一工具描述

3.1.1 工具模型与注册

from typing import , , 

 :
     ():
        .name = name
        .description = description
        .schema = schema
        .func = func

 :
     ():
        ._tools: [, Tool] = {}

     ():
        ._tools[tool.name] = tool

     () -> [, [, ]]:
         {k: v.schema  k, v  ._tools.items()}

     () -> [, ]:
         name   ._tools:
             {: }
         ._tools[name].func(args)

search_tool = Tool(
    name=,
    description=,
    schema={:,:{:{:}},:[]},
    func= args: {: []}
)

calc_tool = Tool(
    name=,
    description=,
    schema={:,:{:{:}},:[]},
    func= args: {: (args[])}
)

registry = ToolRegistry()
registry.register(search_tool)
registry.register(calc_tool)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from typing import Optional

class ModelOutput:
    def __init__(self, content: str, tool_name: Optional[str] = None, tool_args: Optional[Dict[str, Any]] = None):
        self.content = content
        self.tool_name = tool_name
        self.tool_args = tool_args

class SimpleDecider:
    def decide(self, prompt: str) -> ModelOutput:
        if "search:" in prompt:
            q = prompt.split("search:")[-1].strip()
            return ModelOutput(content="use_tool", tool_name="web_search", tool_args={"query": q})
        if "calc:" in prompt:
            e = prompt.split("calc:")[-1].strip()
            return ModelOutput(content="use_tool", tool_name="calculator", tool_args={"expr": e})
        return ModelOutput(content="answer")

class Executor:
    def __init__(self, registry: ToolRegistry):
        self.registry = registry

    def step(self, decision: ModelOutput) -> str:
        if decision.tool_name:
            result = self.registry.call(decision.tool_name, decision.tool_args or {})
            return str(result)
        return "no_tool"

class Memory:
    def __init__(self, max_turns: int = 12):
        self.turns = []
        self.max_turns = max_turns

    def add(self, role: str, content: str):
        self.turns.append({"role": role, "content": content})
        if len(self.turns) > self.max_turns:
            self.turns = self.turns[-self.max_turns:]

    def to_prompt(self) -> str:
        return "\n".join([f"{t['role']}: {t['content']}" for t in self.turns])

import math

class VectorStore:
    def __init__(self):
        self.items = []

    def embed(self, text: str) -> list:
        return [
            float(len(text) % 7),
            float(sum(ord(c) for c in text) % 11),
            float(text.count(' '))
        ]

    def add(self, text: str):
        self.items.append((text, self.embed(text)))

    def search(self, query: str, top_k: int = 3):
        q = self.embed(query)
        scored = []
        for t, v in self.items:
            dot = sum(a * b for a, b in zip(q, v))
            qa = math.sqrt(sum(a * a for a in q))
            va = math.sqrt(sum(a * a for a in v))
            s = dot / (qa * va + 1e-9)
            scored.append((s, t))
        scored.sort(reverse=True)
        return [t for _, t in scored[:top_k]]

class PlannerExecutor:
    def __init__(self, decider: SimpleDecider, registry: ToolRegistry, memory: Memory):
        self.decider = decider
        self.registry = registry
        self.memory = memory

    def run(self, goal: str, max_steps: int = 6) -> str:
        self.memory.add("system", "You are a helpful agent.")
        self.memory.add("user", goal)
        for _ in range(max_steps):
            decision = self.decider.decide(self.memory.to_prompt())
            if decision.tool_name:
                result = self.registry.call(decision.tool_name, decision.tool_args or {})
                self.memory.add("tool", str(result))
                continue
        return "Final: " + goal

class Decomposer:
    def split(self, goal: str) -> list:
        parts = goal.split(";")
        return [p.strip() for p in parts if p.strip()]

class Aggregator:
    def combine(self, results: list) -> str:
        return " | ".join(results)

class SearchAgent:
    def __init__(self, registry: ToolRegistry):
        self.registry = registry

    def act(self, query: str) -> str:
        return str(self.registry.call("web_search", {"query": query}))

class AnalystAgent:
    def synthesize(self, facts: str) -> str:
        return "Summary: " + facts

class Pipeline:
    def __init__(self, searcher: SearchAgent, analyst: AnalystAgent):
        self.searcher = searcher
        self.analyst = analyst

    def run(self, query: str) -> str:
        facts = self.searcher.act(query)
        return self.analyst.synthesize(facts)

class RAG:
    def __init__(self, store: VectorStore):
        self.store = store

    def ingest(self, text: str, chunk_size: int = 200):
        chunks = [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]
        for c in chunks:
            self.store.add(c)

    def retrieve(self, query: str) -> list:
        return self.store.search(query, top_k=3)

from fastapi import FastAPI
from pydantic import BaseModel

app = FastAPI()
memory = Memory()
planner = PlannerExecutor(SimpleDecider(), registry, memory)

class GoalReq(BaseModel):
    goal: str

@app.post("/run")
async def run(req: GoalReq):
    return {"result": planner.run(req.goal)}

registry = ToolRegistry()
registry.register(search_tool)
registry.register(calc_tool)
memory = Memory(max_turns=12)
planner = PlannerExecutor(SimpleDecider(), registry, memory)
store = VectorStore()
rag = RAG(store)
rag.ingest("Python release notes and docs content")

goal = "search: Python 3.12 features; calc: 1+2*3"
decomposer = Decomposer()
steps = decomposer.split(goal)
results = []
for s in steps:
    memory.add("user", s)
    results.append(planner.run(s, max_steps=3))
agg = Aggregator().combine(results)
print(agg)

context = rag.retrieve("Python features")
print(context)

AI Agent 开发进阶：架构、规划、记忆与工具编排

AI Agent 开发进阶：架构、规划、记忆与工具编排

1. 导读与目标

1.1 背景与主题

1.1.1 为什么是 AI Agent

1.1.2 典型应用场景

1.2 目标与受众

1.2.1 本文目标

1.2.2 适用读者

2. 总览：参考架构与设计原则

2.1 架构分层

2.1.1 表达层

2.1.2 决策层

2.1.3 执行层

2.1.4 记忆层

2.2 能力边界

2.2.1 原则

2.3 设计原则

2.3.1 最小耦合与可替换

3. 工具与函数调用接口

3.1 统一工具描述

3.1.1 工具模型与注册

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 函数调用协议

3.2.1 模型输出结构与解析

3.2.2 决策循环与工具执行

4. 记忆系统与上下文管理

4.1 会话与短期记忆

4.1.1 会话窗口管理

4.2 长期记忆与向量检索

4.2.1 轻量向量索引

4.3 记忆策略

4.3.1 摘要与优先级

5. 规划与多步执行

5.1 ReAct 循环

5.1.1 计划与执行

5.2 任务分解与合并

5.2.1 简易分解器

5.2.2 汇总器

5.3 策略选择与路由

5.3.1 路由器

6. 多代理协作与角色分工

6.1 角色

6.1.1 搜索员与分析员

6.2 协作管道

6.2.1 管道执行

7. RAG 集成与知识增强

7.1 文档摄取与切片

7.1.1 切片与索引

7.2 检索与合成

7.2.1 组合输出

8. 部署与接口

8.1 FastAPI 服务化

8.1.1 运行接口

8.2 任务编排与批处理

8.2.1 批量执行

9. 可观察性与安全治理

9.1 日志与指标

9.1.1 建议

9.2 安全与权限

9.2.1 策略

10. 评测与质量保障

10.1 任务集与基准

10.1.1 评测框架

10.2 鲁棒性与演练

10.2.1 建议

11. 组合示例：从零到跑通的工具增强 Agent

11.1 初始化与依赖

11.1.1 组件初始化

11.2 运行与协作

11.2.1 示例执行

11.3 RAG 增强查询

11.3.1 检索片段

12. 总结与扩展

12.1 知识点回顾与扩展

12.2 更多阅读资料

12.3 新问题与其它方案

微信扫一扫，关注极客日志