PythonAI算法

AI Agent 开发进阶：架构、规划、记忆与工具编排

综述由AI生成AI Agent 的开发进阶内容，涵盖参考架构设计（表达层、决策层、执行层、记忆层）、工具函数调用接口实现、记忆系统与上下文管理策略、规划与多步执行（ReAct 循环、任务分解）、多代理协作模式、RAG 知识增强集成、服务化部署与接口、可观察性与安全治理以及评测质量保障。通过 Python 代码示例展示了组件初始化、运行协作及 RAG 查询流程，为构建工程化的智能体应用提供架构指导与实施建议。

极光发布于 2026/4/5更新于 2026/5/2124 浏览

1. 导读与目标

1.1 背景与主题

1.1.1 为什么是 AI Agent

AI Agent 将大语言模型与外部工具、记忆系统、规划器结合，形成可执行的智能体。它能理解复杂任务、主动调用工具、跨多步达成目标，在研发、数据、客服与自动化场景中显著提升效率与质量。

1.1.2 典型应用场景

代码助理：阅读代码、搜索、修改与测试联动。
数据分析：检索、清洗、分析与可视化流水线。
运营与客服：诊断、执行工具操作与闭环处理。

1.2 目标与受众

1.2.1 本文目标

构建 AI Agent 的参考架构与能力边界。
实现工具调用、记忆管理、规划执行与多代理协作的原型代码。
提供部署、可观察性、安全治理与评测的工程化建议。

1.2.2 适用读者

希望落地 Agent 能力的工程师与架构师。
评估与改造开源框架的技术负责人。

2. 总览：参考架构与设计原则

2.1 架构分层

2.1.1 表达层

系统提示词、角色约束与模板管理，决定 Agent 的目标与边界。

2.1.2 决策层

规划器与策略选择，决定是否调用工具、如何分解与执行任务。

2.1.3 执行层

工具路由与调用、结果解析与持久化，保障事实与行动的可用性。

2.1.4 记忆层

短期会话上下文与长期知识库，提供跨轮与跨任务的持续性。

2.2 能力边界

2.2.1 原则

事实优先：用工具或检索获取事实，避免臆测。
安全先行：白名单、沙箱与审计贯穿始终。
可观察性：日志与指标可追踪每个决策与行动。

2.3 设计原则

2.3.1 最小耦合与可替换

各层之间通过清晰接口解耦，支持替换模型、工具或存储实现。

3. 工具与函数调用接口

3.1 统一工具描述

3.1.1 工具模型与注册

from typing import Dict, Any, Callable

class Tool:
    def __init__(self, name: str, description: str, schema: Dict[str, Any], func: Callable[[[, ]], [, ]]):
        .name = name
        .description = description
        .schema = schema
        .func = func

 :
     ():
        ._tools: [, Tool] = {}

     ():
        ._tools[tool.name] = tool

     () -> [, [, ]]:
         {k: v.schema  k, v  ._tools.items()}

     () -> [, ]:
         name   ._tools:
             {: }
         ._tools[name].func(args)

search_tool = Tool(
    name=,
    description=,
    schema={:,:{:{:}},:[]},
    func= args: {: []}
)

calc_tool = Tool(
    name=,
    description=,
    schema={:,:{:{:}},:[]},
    func= args: {: (args[])}
)

registry = ToolRegistry()
registry.register(search_tool)
registry.register(calc_tool)

from typing import Optional

class ModelOutput:
    def __init__(self, content: str, tool_name: Optional[str] = None, tool_args: Optional[Dict[str, Any]] = None):
        self.content = content
        self.tool_name = tool_name
        self.tool_args = tool_args

class SimpleDecider:
    def decide(self, prompt: str) -> ModelOutput:
        if "search:" in prompt:
            q = prompt.split("search:")[-1].strip()
            return ModelOutput(content="use_tool", tool_name="web_search", tool_args={"query": q})
        if "calc:" in prompt:
            e = prompt.split("calc:")[-1].strip()
            return ModelOutput(content="use_tool", tool_name="calculator", tool_args={"expr": e})
        return ModelOutput(content="answer")

class Executor:
    def __init__(self, registry: ToolRegistry):
        self.registry = registry

    def step(self, decision: ModelOutput) -> str:
        if decision.tool_name:
            result = self.registry.call(decision.tool_name, decision.tool_args or {})
            return str(result)
        return "no_tool"

class Memory:
    def __init__(self, max_turns: int = 12):
        self.turns = []
        self.max_turns = max_turns

    def add(self, role: str, content: str):
        self.turns.append({"role": role, "content": content})
        if len(self.turns) > self.max_turns:
            self.turns = self.turns[-self.max_turns:]

    def to_prompt(self) -> str:
        return "\n".join([f"{t['role']}: {t['content']}" for t in self.turns])

import math

class VectorStore:
    def __init__(self):
        self.items = []

    def embed(self, text: str) -> list:
        return [
            float(len(text) % 7),
            float(sum(ord(c) for c in text) % 11),
            float(text.count(' '))
        ]

    def add(self, text: str):
        self.items.append((text, self.embed(text)))

    def search(self, query: str, top_k: int = 3):
        q = self.embed(query)
        scored = []
        for t, v in self.items:
            dot = sum(a*b for a, b in zip(q, v))
            qa = math.sqrt(sum(a*a for a in q))
            va = math.sqrt(sum(a*a for a in v))
            s = dot / (qa*va + 1e-9)
            scored.append((s, t))
        scored.sort(reverse=True)
        return [t for _, t in scored[:top_k]]

class PlannerExecutor:
    def __init__(self, decider: SimpleDecider, registry: ToolRegistry, memory: Memory):
        self.decider = decider
        self.registry = registry
        self.memory = memory

    def run(self, goal: str, max_steps: int = 6) -> str:
        self.memory.add("system", "You are a helpful agent.")
        self.memory.add("user", goal)
        for _ in range(max_steps):
            decision = self.decider.decide(self.memory.to_prompt())
            if decision.tool_name:
                result = self.registry.call(decision.tool_name, decision.tool_args or {})
                self.memory.add("tool", str(result))
                continue
        return "Final: " + goal

class Decomposer:
    def split(self, goal: str) -> list:
        parts = goal.split(";")
        return [p.strip() for p in parts if p.strip()]

class Aggregator:
    def combine(self, results: list) -> str:
        return " | ".join(results)

class SearchAgent:
    def __init__(self, registry: ToolRegistry):
        self.registry = registry

    def act(self, query: str) -> str:
        return str(self.registry.call("web_search", {"query": query}))

class AnalystAgent:
    def synthesize(self, facts: str) -> str:
        return "Summary: " + facts

class Pipeline:
    def __init__(self, searcher: SearchAgent, analyst: AnalystAgent):
        self.searcher = searcher
        self.analyst = analyst

    def run(self, query: str) -> str:
        facts = self.searcher.act(query)
        return self.analyst.synthesize(facts)

class RAG:
    def __init__(self, store: VectorStore):
        self.store = store

    def ingest(self, text: str, chunk_size: int = 200):
        chunks = [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]
        for c in chunks:
            self.store.add(c)

    def retrieve(self, query: str) -> list:
        return self.store.search(query, top_k=3)

from fastapi import FastAPI
from pydantic import BaseModel

app = FastAPI()
memory = Memory()
planner = PlannerExecutor(SimpleDecider(), registry, memory)

class GoalReq(BaseModel):
    goal: str

@app.post("/run")
async def run(req: GoalReq):
    return {"result": planner.run(req.goal)}

registry = ToolRegistry()
registry.register(search_tool)
registry.register(calc_tool)
memory = Memory(max_turns=12)
planner = PlannerExecutor(SimpleDecider(), registry, memory)
store = VectorStore()
rag = RAG(store)
rag.ingest("Python release notes and docs content")

goal = "search: Python 3.12 features; calc: 1+2*3"
decomposer = Decomposer()
steps = decomposer.split(goal)
results = []
for s in steps:
    memory.add("user", s)
    results.append(planner.run(s, max_steps=3))
agg = Aggregator().combine(results)
print(agg)

context = rag.retrieve("Python features")
print(context)

AI Agent 开发进阶：架构、规划、记忆与工具编排

1. 导读与目标

1.1 背景与主题

1.1.1 为什么是 AI Agent

1.1.2 典型应用场景

1.2 目标与受众

1.2.1 本文目标

1.2.2 适用读者

2. 总览：参考架构与设计原则

2.1 架构分层

2.1.1 表达层

2.1.2 决策层

2.1.3 执行层

2.1.4 记忆层

2.2 能力边界

2.2.1 原则

2.3 设计原则

2.3.1 最小耦合与可替换

3. 工具与函数调用接口

3.1 统一工具描述

3.1.1 工具模型与注册

AI Agent 开发进阶：架构、规划、记忆与工具编排

1. 导读与目标

1.1 背景与主题

1.1.1 为什么是 AI Agent

1.1.2 典型应用场景

1.2 目标与受众

1.2.1 本文目标

1.2.2 适用读者

2. 总览：参考架构与设计原则

2.1 架构分层

2.1.1 表达层

2.1.2 决策层

2.1.3 执行层

2.1.4 记忆层

2.2 能力边界

2.2.1 原则

2.3 设计原则

2.3.1 最小耦合与可替换

3. 工具与函数调用接口

3.1 统一工具描述

3.1.1 工具模型与注册

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 函数调用协议

3.2.1 模型输出结构与解析

3.2.2 决策循环与工具执行

4. 记忆系统与上下文管理

4.1 会话与短期记忆

4.1.1 会话窗口管理

4.2 长期记忆与向量检索

4.2.1 轻量向量索引

4.3 记忆策略

4.3.1 摘要与优先级

5. 规划与多步执行

5.1 ReAct 循环

5.1.1 计划与执行

5.2 任务分解与合并

5.2.1 简易分解器

5.2.2 汇总器

5.3 策略选择与路由

5.3.1 路由器

6. 多代理协作与角色分工

6.1 角色

6.1.1 搜索员与分析员

6.2 协作管道

6.2.1 管道执行

7. RAG 集成与知识增强

7.1 文档摄取与切片

7.1.1 切片与索引

7.2 检索与合成

7.2.1 组合输出

8. 部署与接口

8.1 FastAPI 服务化

8.1.1 运行接口

8.2 任务编排与批处理

8.2.1 批量执行

9. 可观察性与安全治理

9.1 日志与指标