大模型智能体（Agent）核心概念与架构解析 | 极客日志

PythonAI算法

大模型智能体（Agent）核心概念与架构解析

详细解析了大模型智能体（Agent）的核心概念与架构。智能体是在大语言模型基础上，增加了规划、记忆和工具使用能力的通用问题解决器。文章深入探讨了规划的三种模式（子任务分解、思维链 CoT、思维树 ToT）及 ReAct 推理行动机制，阐述了短期与长期记忆的实现原理，并重点介绍了 Function Calling 作为连接外部工具的关键技术。通过 MetaGPT 调研员案例展示了智能体的实际应用，并提及了主流开发框架。随着 LLM 能力提升，智能体将在重构软件形态和提升生产效率方面发挥重要作用。

游戏玩家发布于 2025/2/7更新于 2026/7/2346 浏览

大语言模型 vs 人类

大语言模型非常强大，就像人类的大脑一样拥有思考的能力。如果人类只有大脑，没有四肢，没有工具，是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢？大模型是不是就会打破次元壁，从数字世界走向现实世界，与现实世界实现梦幻联动呢？

大语言模型（后文将用 LLM 指代）可以接受输入，可以分析推理、可以输出文字、代码、媒体。然而，其无法像人类一样，拥有规划思考能力、运用各种工具与物理世界互动，以及拥有人类的记忆能力。

LLM：接受输入、思考、输出
人类：LLM（接受输入、思考、输出）+ 记忆 + 工具 + 规划

如果我们给 LLM 配备上：与物理世界互动的工具、记忆能力、规划思考能力。LLM 是否就可以像人类一样，能够自主思考并规划完成任务的过程，能检索记忆，能使用各种工具提高效率，最终完成某个任务。

智能体是什么

智能体的英文是 Agent，AI 业界对智能体提出了各种定义。个人理解，智能体是一种通用问题解决器。从软件工程的角度看来，智能体是一种基于大语言模型的，具备规划思考能力、记忆能力、使用工具函数的能力，能自主完成给定任务的计算机程序。

由 LLM 驱动的智能体系统

图 1. 由 LLM 驱动的智能体系统

如图 1 所示，在基于 LLM 的智能体中，LLM 充当着智能体的'大脑'的角色，同时还有 3 个关键部分：

规划（Planning）

智能体会把大型任务分解为子任务，并规划执行任务的流程；智能体会对任务执行的过程进行思考和反思，从而决定是继续执行任务，或判断任务完结并终止运行。

记忆（Memory）

短期记忆，是指在执行任务的过程中的上下文，会在子任务的执行过程产生和暂存，在任务完结后被清空。长期记忆是长时间保留的信息，一般是指外部知识库，通常用向量数据库来存储和检索。

工具使用（Tool use）

为智能体配备工具 API，比如：计算器、搜索工具、代码执行器、数据库查询工具等。有了这些工具 API，智能体就可以与物理世界交互，解决实际的问题。

智能体能做什么

如果你还觉得智能体这个概念有点抽象，没关系，现在我们来点好玩的，一起来看看智能体能玩出什么花样？

智能体之调研员

调研员智能体，可以根据用户的调研问题，从搜索引擎上搜索资料并总结，然后生成调研报告。这里使用 MetaGPT 框架中的调研员示例来展示一个智能体的实际作用及其构成。

运行一下试试

输入调研课题：调研特斯拉 FSD 和华为 ADS 这两个自动驾驶系统

python3 -m metagpt.roles.researcher "特斯拉FSD vs 华为ADS"

智能体执行调研

从搜索引擎进行搜索并获取 Url 地址列表

图 2. 从搜索引擎进行搜索并获取 Url 地址列表

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

template = "Answer the question: Q: {question}? Let's think step by step:"

from openai import OpenAI

def chat_completion_request(messages, tools=None, tool_choice=None, model="gpt-3.5-turbo"):
    try:     
        response = client.chat.completions.create(        
            model=model,            
            messages=messages,            
            tools=tools,            
            tool_choice=tool_choice,        
        )       
        return response    
    except Exception as e:     
        print("Unable to generate ChatCompletion response")        
        print(f"Exception: {e}")        
        return e

if __name__ == "__main__":
    messages = []    
    messages.append({"role": "system", "content": "不要假设将哪些值输入到函数中。如果用户请求不明确，请要求澄清"})    
    messages.append({"role": "user", "content": "未来 5 天深圳南山区的天气怎么样"})    
    chat_response = chat_completion_request(        
        messages, tools=tools    
    ) 
 
 tool_calls = chat_response.choices[0].message.tool_calls 
 print("===回复===") 
 print(tool_calls)

===回复===
[ChatCompletionMessageToolCall(id='call_7qGdyUEWp34ihubinIUCTXyH', function=Function(arguments='{"location":"深圳市南山区","format":"celsius","num_days":5}', name='get_n_day_weather_forecast'), type='function')
]
// 格式化看看：chat_response.choices[0].message.tool_calls:
[
  {   
    "id": "call_7qGdyUEWp34ihubinIUCTXyH",    
    "function": {      
      "arguments": {       
        "location": "深圳市南山区",        
        "format": "celsius",        
        "num_days": 5      
      },      
      "name": "get_n_day_weather_forecast"    
    },    
    "type": "function"  
  }
]

===get_n_day_weather_forecast===
[{'date': '2023-04-01', 'location': '深圳市南山区', 'temperature': '20°C', 'description': '晴朗'}, {'date': '2023-04-02', 'location': '深圳市南山区', 'temperature': '21°C', 'description': '多云'}, {'date': '2023-04-03', 'location': '深圳市南山区', 'temperature': '22°C', 'description': '晴朗'}, {'date': '2023-04-04', 'location': '深圳市南山区', 'temperature': '23°C', 'description': '多云'}, {'date': '2023-04-05', 'location': '深圳市南山区', 'temperature': '24°C', 'description': '晴朗'}]
===回复===
未来 5 天深圳南山区的天气情况如下：
- 4 月 1 日：晴朗，温度 20°C
- 4 月 2 日：多云，温度 21°C
- 4 月 3 日：晴朗，温度 22°C 
- 4 月 4 日：多云，温度 23°C 
- 4 月 5 日：晴朗，温度 24°C

请注意天气预报仅供参考，实际情况可能会有所变化。

大模型智能体（Agent）核心概念与架构解析

大语言模型 vs 人类

智能体是什么

规划（Planning）

记忆（Memory）

工具使用（Tool use）

智能体能做什么

智能体之调研员

运行一下试试

更多推荐文章

相关免费在线工具

拆解调研员

调研员智能体构成

图解调研员智能体

智能体的关键构成

规划（Planning）

子任务分解

思维链（Chain of Thoughts, CoT）

思维树（Tree-of-thought, ToT）

反思和完善

ReAct

记忆（Memory）

工具使用（Tool use）

Function Calling

函数描述

调用 LLM 获得函数的请求参数

调用函数

智能体的开发框架

展望

更多推荐文章

相关免费在线工具

大模型智能体（Agent）核心概念与架构解析

大语言模型 vs 人类

智能体是什么

规划（Planning）

记忆（Memory）

工具使用（Tool use）

智能体能做什么

智能体之调研员

运行一下试试

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

拆解调研员

调研员智能体构成

图解调研员智能体

智能体的关键构成

规划（Planning）

子任务分解

思维链（Chain of Thoughts, CoT）

思维树（Tree-of-thought, ToT）

反思和完善

ReAct

记忆（Memory）

工具使用（Tool use）

Function Calling

函数描述

调用 LLM 获得函数的请求参数

调用函数

智能体的开发框架

展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具