从零搭建可落地 AI Agent：智能体开发全流程实战 | 极客日志

PythonAI

从零搭建可落地 AI Agent：智能体开发全流程实战

介绍 AI Agent 的核心定义与四大能力，对比主流框架如 Coze、Dify、LangChain 等，并提供基于 LangChain、OpenAI 和 Chroma 的邮件处理 Agent 实战案例。内容涵盖环境搭建、代码实现（工具、记忆、调度模块）、运行测试及避坑指南，适合希望从 0 到 1 掌握智能体开发的开发者参考。

清酒独酌发布于 2026/4/5更新于 2026/7/2348 浏览

一、AI Agent 核心概念解析

很多新手容易把 Agent 和传统 AI 应用搞混，其实核心区别就一个：传统 AI 是'被动执行指令'，Agent 是'主动完成任务'。

举个直观的对比：

传统 AI：你说'帮我分析这组销售数据'，它只会返回数据分析结果，不会主动询问数据来源、补充缺失维度； AI Agent：你说'帮我分析这组销售数据'，它会主动询问'数据文件在哪里？需要重点分析哪个维度？是否需要生成可视化报表？'，甚至会自动调用工具处理数据、生成图表，全程无需你额外操作。

1.1 Agent 的核心定义

AI Agent（智能体）是一个基于大模型，具备「感知 - 规划 - 行动 - 记忆」闭环能力的智能系统，能自主理解用户需求、拆解复杂任务、调用外部工具、积累经验，最终独立完成目标，本质是'大模型 + 工具 + 工作流'的组合体，也是实现'通用人工智能'的关键载体。

1.2 Agent 的 4 大核心能力

这是区分'伪 Agent'和'真 Agent'的关键，也是搭建可落地 Agent 的核心基础，结合最新技术趋势，整理如下：

核心能力	通俗解释	落地场景举例	关键技术支撑
自主规划	将复杂任务拆解为可执行的子任务，制定执行策略	安排团队会议（拆解为协调时间、发邀请、备资料）	思维链（CoT）、任务拆解算法
工具调用	自主选择、调用外部工具（API、数据库、插件等）	数据分析 Agent 调用 Excel、Python 脚本处理数据	Function Calling、工具注册机制
记忆能力	存储短期上下文和长期经验，支持多轮交互	客服 Agent 记住用户历史咨询，无需重复说明	向量数据库（Chroma）、RAG 检索增强
自主决策	根据任务进展和反馈，动态调整执行策略	邮件 Agent 发现收件人未回复，自动发送提醒	强化学习、反馈机制

1.3 热门落地场景

新手不用追求'大而全'，优先选择低门槛、高复用的场景，快速实现从 0 到 1 的突破，这 3 个场景目前需求最旺、落地难度最低：

办公自动化 Agent：自动处理邮件、生成会议纪要、整理文档（无需复杂开发，依托低代码框架即可实现）；
数据分析 Agent：连接数据库，自动查询数据、生成分析报表、识别异常数据（适合程序员、数据分析师）；
客服辅助 Agent：自动回复常见咨询、提取用户需求、转接复杂问题（企业刚需，易落地变现）。

二、框架选型：主流 Agent 框架对比

新手搭建 Agent，最容易踩的坑就是'盲目跟风选框架'——有的框架适合低代码快速上手，有的适合深度定制，有的擅长多 Agent 协作。整理了 6 大主流框架的横向对比，帮你快速选型，避免走弯路（重点看'新手友好度'和'适用场景'）：

框架名称	开发难度	新手友好度	核心优势	多 Agent 协作能力	适用场景
Coze（扣子）	低（零代码/低代码）	★★★★★	可视化拖拽、内置 60+ 插件、支持私有化部署	中等（需手动编排工作流）	快速搭建聊天机器人、办公自动化
Dify	低 - 中（可视化 + 轻度编码）	★★★★☆	开源、企业级支持、内置知识库功能	中等（复杂协作需手动配置）	企业知识库、客服助手
n8n

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

python --version# 输出 Python 3.11.x 即为成功
pip --version# 输出 pip 版本即可

# 创建虚拟环境
python -m venv agent-env
# 激活虚拟环境（Windows）
agent-env\Scripts\activate
# 激活虚拟环境（Mac/Linux）
source agent-env/bin/activate

pip install langchain openai chromadb python-dotenv smtplib email

OPENAI_API_KEY=your_api_key_here # 替换成你的 OpenAI API Key

email-agent/
├── .env                 # API 密钥配置
├── tools.py             # 工具定义（邮件读取、发送、草稿保存）
├── memory.py            # 记忆模块（Chroma 配置）
├── agent.py             # Agent 核心逻辑
└── main.py              # 入口文件（运行 Agent）

from langchain.tools import tool
from typing import List
import smtplib
from email.mime.text import MIMEText

# 工具 1：读取邮箱邮件（简化实现，实际可连接 IMAP 服务器）
@tool
def read_emails(folder:str="inbox") -> List[dict]:
    """
    读取邮箱中的邮件，用于获取用户的邮件内容
    Args:
        folder: 邮箱文件夹名称（默认 inbox，可选 sent、draft）
    Returns:
        邮件列表，每封邮件包含 id、subject（主题）、from（发件人）、body（正文）
    """
    # 实际场景中，需连接 IMAP 服务器（如 QQ 邮箱、企业邮箱），这里用模拟数据演示
    mock_emails = [
        {"id":"001","subject":"关于项目进度的询问","from":"[email protected]","body":"你好，请问我们合作的项目什么时候能完成？目前进度如何？请尽快回复，谢谢！"},
        {"id":"002","subject":"技术方案讨论邀请","from":"[email protected]","body":"我们计划明天下午 3 点召开技术方案讨论会，请你准备好相关资料，准时参加。"}
    ]
    print(f"✅ 已读取{folder}文件夹中的邮件，共{len(mock_emails)}封")
    return mock_emails

# 工具 2：发送邮件（简化实现，实际可连接 SMTP 服务器）
@tool
def send_email(to:str, subject:str, body:str) -> str:
    """
    发送邮件给指定收件人
    Args:
        to: 收件人邮箱地址（如 [email protected]）
        subject: 邮件主题
        body: 邮件正文
    Returns:
        发送结果（成功/失败提示）
    """
    # 实际场景中，需配置 SMTP 服务器（如 QQ 邮箱 SMTP：smtp.qq.com，端口 465）
    # 这里简化处理，模拟发送流程
    print(f"\n📧 正在发送邮件：")
    print(f"收件人：{to}")
    print(f"主题：{subject}")
    print(f"正文：\n{body}\n")
    return f"✅ 邮件已成功发送到 {to}"

# 工具 3：起草邮件回复（保存草稿）
@tool
def draft_reply(email_id:str, content:str) -> str:
    """
    起草邮件回复，并保存为草稿
    Args:
        email_id: 原邮件的 ID（对应 read_emails 返回的 id）
        content: 回复的正文内容
    Returns:
        草稿保存结果
    """
    # 实际场景中，可将草稿保存到邮箱草稿箱，这里简化处理
    print(f"\n📝 正在保存回复草稿：")
    print(f"回复邮件 ID：{email_id}")
    print(f"草稿内容：\n{content}\n")
    return f"✅ 回复草稿已保存，对应原邮件 ID：{email_id}"

# 工具列表：将所有工具整理成列表，供 Agent 调用
tools = [read_emails, send_email, draft_reply]

from langchain.vectorstores import Chroma
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.memory import VectorStoreRetrieverMemory

# 初始化 OpenAI 嵌入模型（用于将文本转换为向量）
embeddings = OpenAIEmbeddings()

# 初始化 Chroma 向量数据库（存储记忆数据，持久化到本地）
vector_store = Chroma(
    embedding_function=embeddings,
    persist_directory="./chroma_memory",# 记忆数据存储路径
    collection_name="email_agent_memory"# 集合名称
)
vector_store.persist()# 持久化数据，避免程序退出后丢失

# 初始化记忆检索器（用于 Agent 查询记忆）
retriever = vector_store.as_retriever(
    search_kwargs={"k":3}# 每次查询返回 3 条最相关的记忆
)

# 初始化 Agent 记忆模块
memory = VectorStoreRetrieverMemory(
    retriever=retriever,
    memory_key="chat_history",# 记忆的键名，供 Agent 调用
    input_key="input",# 输入的键名
    output_key="output"# 输出的键名
)

# 测试记忆模块（可选）
def test_memory():
    # 存入一条记忆
    memory.save_context(
        inputs={"input":"用户询问项目进度"}, 
        outputs={"output":"项目目前完成 80%，预计 3 天后交付"}
    )
    # 查询记忆
    result = memory.load_memory_variables({"input":"用户之前问过什么？"})
    print("📖 记忆查询结果：", result)

# 运行测试（注释掉可避免运行入口文件时触发）
# test_memory()

from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_openai import ChatOpenAI
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from tools import tools
from memory import memory
from dotenv import load_dotenv
import os

# 加载.env 文件中的 API 密钥
load_dotenv()

# 初始化大模型（GPT-4，推理能力更强，适合复杂决策）
llm = ChatOpenAI(
    model="gpt-4",
    temperature=0.3,# 温度越低，决策越稳定，避免乱调用工具
    api_key=os.getenv("OPENAI_API_KEY")
)

# 定义 Agent 提示词（核心！告诉 Agent 它的角色、能力和工作规则）
prompt = ChatPromptTemplate.from_messages([
    ("system","""你是一个专业的邮件处理 AI 智能体，你的核心任务是帮助用户自动处理邮箱相关任务，包括读取邮件、起草回复、发送邮件和保存草稿。
工作规则：
1. 先明确用户的核心需求，再规划执行步骤，不要盲目调用工具；
2. 调用工具前，确认工具的参数是否正确（如发送邮件需要收件人、主题、正文）；
3. 读取邮件后，先分析邮件的核心内容和发件人需求，再决定是否需要回复、发送或保存草稿；
4. 每次执行完一个子任务，都要检查是否完成了用户的最终需求，若未完成，继续执行下一个子任务；
5. 利用记忆模块，记住之前处理过的邮件内容和回复记录，避免重复操作；
6. 若遇到不确定的情况（如缺少收件人邮箱），不要随意猜测，及时反馈给用户。"""),
    MessagesPlaceholder(variable_name="chat_history"),# 记忆模块的上下文
    ("user","{input}"),# 用户输入
    MessagesPlaceholder(variable_name="agent_scratchpad")# Agent 的思考过程
])

# 创建 Agent（基于 OpenAI 工具调用能力）
agent = create_openai_tools_agent(
    llm=llm,
    tools=tools,
    prompt=prompt
)

# 创建 Agent 执行器（负责调度 Agent、工具和记忆）
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    memory=memory,
    verbose=True,# 开启详细日志，便于调试（新手建议开启）
    handle_parsing_errors=True# 自动处理解析错误
)

# 定义 Agent 运行函数（供入口文件调用）
def run_email_agent(user_input:str):
    try:
        print(f"\n📋 用户指令：{user_input}")
        print("🚀 Agent 开始执行任务...\n")
        result = agent_executor.invoke({"input": user_input})
        print(f"\n✅ 任务执行完成！")
        print(f"📄 执行结果：{result['output']}")
        return result
    except Exception as e:
        print(f"\n❌ 任务执行失败：{str(e)}")
        return{"output":f"任务执行失败，请检查配置：{str(e)}"}

from agent import run_email_agent

if __name__ == "__main__":
    print("🎉 邮件处理 AI 智能体已启动！")
    print("💡 请输入你的指令（例如：读取收件箱邮件，回复 id 为 001 的邮件，告诉对方项目进度 80%，3 天后交付）")
    print("❌ 输入'退出'即可结束程序\n")
    while True:
        user_input = input("你：")
        if user_input == "退出":
            print("👋 程序已结束，再见！")
            break
        # 运行 Agent
        run_email_agent(user_input)

🎉 邮件处理 AI 智能体已启动！
💡 请输入你的指令（例如：读取收件箱邮件，回复 id 为 001 的邮件，告诉对方项目进度 80%，3 天后交付）
❌ 输入'退出'即可结束程序
你：读取收件箱邮件，回复 id 为 001 的邮件，告诉对方项目目前完成 80%，预计 3 天后交付，然后发送邮件
📋 用户指令：读取收件箱邮件，回复 id 为 001 的邮件，告诉对方项目目前完成 80%，预计 3 天后交付，然后发送邮件
🚀 Agent 开始执行任务...
> Entering new AgentExecutor chain...
我需要先读取收件箱的邮件，找到 id 为 001 的邮件，然后起草回复，最后发送邮件。首先调用 read_emails 工具读取收件箱邮件。
Tool 调用：read_emails
Tool 输入：{"folder":"inbox"}
✅ 已读取 inbox 文件夹中的邮件，共 2 封
Tool 返回：[{'id':'001', 'subject':'关于项目进度的询问', 'from':'[email protected]', 'body':'你好，请问我们合作的项目什么时候能完成？目前进度如何？请尽快回复，谢谢！'}, {'id':'002', 'subject':'技术方案讨论邀请', 'from':'[email protected]', 'body':'我们计划明天下午 3 点召开技术方案讨论会，请你准备好相关资料，准时参加。'}]
现在找到了 id 为 001 的邮件，发件人是 [email protected]，需求是询问项目进度。接下来需要起草回复，调用 draft_reply 工具，然后发送邮件。
Tool 调用：draft_reply
Tool 输入：{"email_id":"001","content":"你好，感谢你的询问！目前项目已完成 80%，预计 3 天后即可交付，后续有任何问题请随时联系我。"}
📝 正在保存回复草稿：
回复邮件 ID：001
草稿内容：
你好，感谢你的询问！目前项目已完成 80%，预计 3 天后即可交付，后续有任何问题请随时联系我。
Tool 返回：✅ 回复草稿已保存，对应原邮件 ID：001
草稿已保存，接下来需要发送邮件，收件人是 [email protected]，主题和正文使用起草的内容。
Tool 调用：send_email
Tool 输入：{"to":"[email protected]","subject":"Re: 关于项目进度的询问","body":"你好，感谢你的询问！目前项目已完成 80%，预计 3 天后即可交付，后续有任何问题请随时联系我。"}
📧 正在发送邮件：
收件人：[email protected]
主题：Re: 关于项目进度的询问
正文：
你好，感谢你的询问！目前项目已完成 80%，预计 3 天后即可交付，后续有任何问题请随时联系我。
Tool 返回：✅ 邮件已成功发送到 [email protected]
所有任务已完成：读取了收件箱邮件，回复了 id 为 001 的邮件并发送成功。
> Finished chain.
✅ 任务执行完成！
📄 执行结果：已成功读取收件箱邮件，找到 id 为 001 的邮件（主题：关于项目进度的询问），起草并保存了回复草稿，随后将回复邮件发送至发件人 [email protected]，任务全部完成。

从零搭建可落地 AI Agent：智能体开发全流程实战

一、AI Agent 核心概念解析

1.1 Agent 的核心定义

1.2 Agent 的 4 大核心能力

1.3 热门落地场景

二、框架选型：主流 Agent 框架对比

更多推荐文章

相关免费在线工具

三、实战环节：从 0 到 1 搭建可落地的'邮件处理 Agent'

3.1 实战准备：环境搭建

3.1.1 安装 Python 环境

3.1.2 创建虚拟环境（避免依赖冲突）

3.1.3 安装核心依赖包

3.1.4 配置 API 密钥

3.2 架构设计：邮件处理 Agent 的核心流程

3.3 代码实现：分模块编写

3.3.1 工具模块：tools.py（核心工具定义）

3.3.2 记忆模块：memory.py（Chroma 配置）

3.3.3 Agent 核心逻辑：agent.py（调度中心）

3.3.4 入口文件：main.py（运行 Agent）

3.4 运行测试：验证 Agent 功能

四、避坑指南：新手搭建 Agent 最容易踩的 5 个坑

坑 1：盲目追求'多 Agent 协作'，忽略单 Agent 落地

坑 2：选错框架，要么太复杂，要么功能不足

坑 3：不重视提示词（Prompt），Agent'乱决策'

坑 4：忽略记忆模块，Agent'记不住事'

坑 5：直接用真实数据测试，导致风险

五、2026 年 Agent 学习路线（新手进阶指南）

结尾：Agent 的核心不是'技术炫技'，而是'落地解决问题'

更多推荐文章

相关免费在线工具

从零搭建可落地 AI Agent：智能体开发全流程实战

一、AI Agent 核心概念解析

1.1 Agent 的核心定义

1.2 Agent 的 4 大核心能力

1.3 热门落地场景

二、框架选型：主流 Agent 框架对比

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、实战环节：从 0 到 1 搭建可落地的'邮件处理 Agent'

3.1 实战准备：环境搭建

3.1.1 安装 Python 环境

3.1.2 创建虚拟环境（避免依赖冲突）

3.1.3 安装核心依赖包

3.1.4 配置 API 密钥

3.2 架构设计：邮件处理 Agent 的核心流程

3.3 代码实现：分模块编写

3.3.1 工具模块：tools.py（核心工具定义）

3.3.2 记忆模块：memory.py（Chroma 配置）

3.3.3 Agent 核心逻辑：agent.py（调度中心）

3.3.4 入口文件：main.py（运行 Agent）

3.4 运行测试：验证 Agent 功能

四、避坑指南：新手搭建 Agent 最容易踩的 5 个坑

坑 1：盲目追求'多 Agent 协作'，忽略单 Agent 落地

坑 2：选错框架，要么太复杂，要么功能不足

坑 3：不重视提示词（Prompt），Agent'乱决策'

坑 4：忽略记忆模块，Agent'记不住事'

坑 5：直接用真实数据测试，导致风险

五、2026 年 Agent 学习路线（新手进阶指南）

结尾：Agent 的核心不是'技术炫技'，而是'落地解决问题'

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具