AI Agent 生产级框架实战：架构设计与核心实现

2023 年 ChatGPT 引爆了大模型应用，2024 年多模态能力迅速成熟，而当前阶段，AI Agent 正从概念验证走向实际生产力落地。在实际工程中，我们常遇到上下文记忆丢失、工具调用成功率低、成本不可控以及复杂任务规划困难等问题。本文将带你从零构建一个生产级的 AI Agent 框架，解决上述痛点。

AI Agent 的核心架构

简单来说，AI Agent = LLM + 记忆 + 规划 + 工具。用户输入经过感知层进入大脑（LLM 推理引擎），结合记忆层的短期与长期信息，由规划层分解任务，最终通过工具层执行动作并输出结果。

在技术选型上，编排框架推荐 LangChain 或 LangGraph，运行时可选 AutoGen，向量数据库使用 Milvus 或 Chroma，工具生态依赖 OpenAI Function Calling，记忆管理可参考 MemGPT，评估则用 Ragas 或 TruLens。

从零搭建生产级 Agent 框架

项目结构设计

合理的目录结构是工程化的基础。核心模块包括 Agent 基类、记忆管理、任务规划器和工具注册器。记忆层需区分短期（Redis）和长期（向量 DB），工具层包含基类和内置功能，评估层负责成本和性能监控。

agent-framework/
├── core/
│   ├── agent.py      # Agent 核心类
│   ├── memory.py     # 记忆管理模块
│   ├── planner.py    # 任务规划器
│   └── tools.py      # 工具注册器
├── memory/
│   ├── short_term.py # 短期记忆（Redis）
│   ├── long_term.py  # 长期记忆（向量 DB）
│   └── semantic.py   # 语义记忆检索
├── tools/
│   ├── base.py       # 工具基类
│   ├── registry.py   # 工具注册中心
│   └── builtin/      # 内置工具
├── evaluators/
│   ├── cost.py       # 成本评估
│   └── performance.py# 性能评估
└── utils/
    ├── logger.py     # 日志系统
    └── retry.py      # 重试机制

核心代码：Agent 基类

Agent 的状态管理至关重要。我们需要定义空闲、思考、执行等状态，并维护消息历史。主循环负责迭代推理、检索上下文、构建提示词、LLM 推理及工具调用。

from typing import List, Dict, Any, Optional
from dataclasses import dataclass
from enum import Enum
import asyncio
import json

class AgentState():
    
    IDLE =         
    THINKING = 
    ACTING =     
    WAITING =   
    ERROR =       


 :
    
    role:             
    content:          
    tool_calls: [[]] = 
    timestamp:  = 
    metadata: [, ] = 

 :
    
     ():
        .llm = llm_client
        .memory = memory_manager
        .tools = tool_registry
        .max_iterations = max_iterations
        .verbose = verbose
        .state = AgentState.IDLE
        .conversation_history: [Message] = []

      () -> :
        
        .conversation_history.append(Message(role=, content=user_input))
        .state = AgentState.THINKING

         iteration  (.max_iterations):
            ._log()
            context =  ._retrieve_context(user_input)
            prompt = ._build_prompt(context)
            response =  ._llm_inference(prompt)

             response.tool_calls:
                .state = AgentState.ACTING
                tool_results =  ._execute_tools(response.tool_calls)
                 result  tool_results:
                    .conversation_history.append(
                        Message(role=, content=result[], tool_name=result[])
                    )
            :
                .state = AgentState.IDLE
                .conversation_history.append(Message(role=, content=response.content))
                 response.content

         

      () -> :
          .memory:
             
          .memory.search(query, top_k=)

     () -> :
        system_prompt = 
         system_prompt

      () -> :
        messages = [{: , : prompt},
                    *[{: m.role, : m.content}  m  .conversation_history]]
        response =  .llm.chat.completions.create(
            model=, messages=messages,
            tools=.tools.get_tool_schemas()  .tools  ,
            temperature=
        )
         response.choices[].message

      () -> []:
        results = []
         call  tool_calls:
            tool_name = call[][]
            arguments = json.loads(call[][])
            ._log()
            :
                tool = .tools.get_tool(tool_name)
                result =  tool.execute(**arguments)
                results.append({: tool_name, : json.dumps(result, ensure_ascii=)})
             Exception  e:
                results.append({: tool_name, : json.dumps({: (e)})})
         results

     ():
         .verbose:
            ()

from abc import ABC, abstractmethod from typing import List, Dict, Any import redis import numpy as np from datetime import datetime, timedelta class MemoryBackend(ABC): @abstractmethod async def add(self, content: str, metadata: Dict = None) -> str: pass @abstractmethod async def search(self, query: str, top_k: int = 5) -> List[Dict]: pass class ShortTermMemory(MemoryBackend): def __init__(self, redis_url: str = "redis://localhost:6379", ttl: int = 3600): self.client = redis.from_url(redis_url) self.ttl = ttl async def add(self, content: str, metadata: Dict = None) -> str: memory_id = f"mem:{datetime.now().timestamp()}" memory_data = {"content": content, "metadata": metadata or {}, "timestamp": datetime.now().isoformat()} self.client.setex(memory_id, self.ttl, json.dumps(memory_data, ensure_ascii=False)) return memory_id async def search(self, query: str, top_k: int = 5) -> List[Dict]: keys = self.client.keys("mem:*") memories = [] for key in keys[-top_k:]: data = json.loads(self.client.get(key)) memories.append(data) return memories class LongTermMemory(MemoryBackend): def __init__(self, embedding_model: Any, vector_db: Any): self.embedding_model = embedding_model self.vector_db = vector_db async def add(self, content: str, metadata: Dict = None) -> str: embedding = await self.embedding_model.embed(content) memory_id = self.vector_db.insert(vector=embedding, payload={"content": content, "metadata": metadata or {}}) return memory_id async def search(self, query: str, top_k: int = 5) -> List[Dict]: query_embedding = await self.embedding_model.embed(query) results = self.vector_db.search(vector=query_embedding, top_k=top_k, score_threshold=0.7) return results class HybridMemory: def __init__(self, short_term: ShortTermMemory, long_term: LongTermMemory): self.short_term = short_term self.long_term = long_term async def remember(self, content: str, importance: float = 0.5, metadata: Dict = None): await self.short_term.add(content, metadata) if importance > 0.7: await self.long_term.add(content, metadata) async def recall(self, query: str, top_k: int = 5) -> List[Dict]: short_results = await self.short_term.search(query, top_k // 2) long_results = await self.long_term.search(query, top_k // 2) all_results = short_results + long_results return all_results[:top_k]

from typing import Callable, Dict, Any, List import inspect from pydantic import BaseModel, Field class Tool(BaseModel): name: str = Field(description="工具名称") description: str = Field(description="工具功能描述") parameters: Dict[str, Any] = Field(default_factory=dict, description="参数 schema") function: Callable = Field(description="工具执行函数") class Config: arbitrary_types_allowed = True async def execute(self, **kwargs) -> Any: return await self.function(**kwargs) def to_openai_schema(self) -> Dict: return {"type": "function", "function": {"name": self.name, "description": self.description, "parameters": self.parameters}} def tool(name: str = None, description: str = None): def decorator(func: Callable) -> Tool: sig = inspect.signature(func) parameters = {} for param_name, param in sig.parameters.items(): param_type = param.annotation if param.annotation != inspect.Parameter.empty else "string" parameters[param_name] = { "type": param_type.__name__ if hasattr(param_type, "__name__") else "string", "description": f"参数 {param_name}" } return Tool( name=name or func.__name__, description=description or func.__doc__ or "", parameters={"type": "object", "properties": parameters, "required": [p for p in sig.parameters if p.default == inspect.Parameter.empty]}, function=func ) return decorator class ToolRegistry: def __init__(self): self._tools: Dict[str, Tool] = {} def register(self, tool: Tool): self._tools[tool.name] = tool def get_tool(self, name: str) -> Tool: return self._tools.get(name) def get_tool_names(self) -> List[str]: return list(self._tools.keys()) def get_tool_descriptions(self) -> str: descriptions = [] for tool in self._tools.values(): descriptions.append(f"- {tool.name}: {tool.description}") return "\n".join(descriptions) def get_tool_schemas(self) -> List[Dict]: return [tool.to_openai_schema() for tool in self._tools.values()]

import asyncio from typing import Optional class CustomerServiceAgent(ReActAgent): def __init__(self, knowledge_base, ticket_system, *args, **kwargs): super().__init__(*args, **kwargs) self.knowledge_base = knowledge_base self.ticket_system = ticket_system self._register_customer_service_tools() def _register_customer_service_tools(self): @self.tools.register @tool(name="search_policy", description="搜索政策信息") async def search_policy(query: str): results = await self.knowledge_base.search(query, top_k=3) return "\n".join([r['content'] for r in results]) @self.tools.register @tool(name="get_process_guide", description="获取办事流程") async def get_process_guide(service_type: str): guide = await self.knowledge_base.get_guide(service_type) return guide @self.tools.register @tool(name="create_ticket", description="创建工单") async def create_ticket(category: str, description: str, priority: str = "normal"): ticket_id = await self.ticket_system.create(category=category, description=description, priority=priority) return f"工单已创建，编号：{ticket_id}，我们将在 1 个工作日内处理" @self.tools.register @tool(name="transfer_to_human", description="转人工客服") async def transfer_to_human(reason: str): queue_number = await self.ticket_system.human_transfer(reason) return f"已为您转接人工客服，当前排队人数：{queue_number}人，预计等待时间：{queue_number * 2}分钟" async def handle_customer_query(self, user_input: str) -> str: intent = await self._detect_intent(user_input) system_prompt = self._get_system_prompt(intent) return await self.run(user_input) async def _detect_intent(self, user_input: str) -> str: intent_prompt = f"""分类以下用户咨询的意图类型：用户输入：{user_input} 意图类型： 1. policy_inquiry - 政策咨询 2. process_guide - 办事流程咨询 3. complaint - 投诉建议 4. complex - 复杂问题需人工只返回意图类型代码：""" response = await self.llm.generate(intent_prompt) return response.strip() def _get_system_prompt(self, intent: str) -> str: prompts = { "policy_inquiry": "你是政策咨询专员，请准确引用政策文件内容...", "process_guide": "你是办事引导员，请给出清晰的办事步骤...", "complaint": "你是投诉处理专员，请先安抚情绪，再记录问题...", "complex": "你是客服助理，对于复杂问题，请主动建议转人工..." } return prompts.get(intent, "你是智能客服助手...")

AI Agent 生产级框架实战：架构设计与核心实现

AI Agent 的核心架构

从零搭建生产级 Agent 框架

项目结构设计

核心代码：Agent 基类

更多推荐文章

相关免费在线工具

记忆管理系统

三大核心技术实现

ReAct 框架：推理 + 行动协同

工具调用系统

任务规划器

实战案例：智能客服 Agent

性能优化与成本控制

总结

更多推荐文章

相关免费在线工具

AI Agent 生产级框架实战：架构设计与核心实现

AI Agent 的核心架构

从零搭建生产级 Agent 框架

项目结构设计

核心代码：Agent 基类

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

记忆管理系统

三大核心技术实现

ReAct 框架：推理 + 行动协同

工具调用系统

任务规划器

实战案例：智能客服 Agent

性能优化与成本控制

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具