Python + Agent 入门实战：从零搭建可复用 AI 智能体

随着大模型能力的下沉，AI Agent 的开发门槛正在降低。借助 Python 生态和开源框架，开发者可以构建具备自主决策能力的智能体。

架构图

一、先理清：Python+Agent，到底强在哪里？

很多新手容易混淆'Python 脚本'和'Python+Agent'的区别。普通 Python 脚本是'写死的指令执行'，而 Python+Agent 则是'智能的任务闭环'。核心优势在于自主决策、自动执行、可复用、可扩展。

1.1 核心区别：Python 脚本 vs Python+Agent

对比维度	普通 Python 脚本	Python+Agent 智能体	核心优势体现
执行逻辑	按固定步骤执行，一步错全流程崩	自主拆解任务、动态调整步骤，容错性强	无需手动修改代码，适配不同场景
交互方式	被动执行，需手动触发，无法多轮交互	主动理解需求，支持多轮对话，记住上下文	像'助手'一样沟通，无需懂代码也能使用
功能扩展	新增功能需修改全部代码，复用性差	通过工具注册、插件扩展，无需改动核心逻辑	一次搭建，多场景复用（如办公、数据分析）
技术依赖	仅依赖 Python 基础语法，无 AI 能力	结合大模型+Python 生态，具备智能决策能力	依托开源框架，零基础也能快速上手

1.2 热门入门场景

新手不用追求复杂场景，优先选择'代码量少、落地快、能直接用'的方向。这 3 个场景是目前最适合入门的，也是企业刚需：

自动化办公 Agent：自动处理 Excel、生成报表、批量发送消息（Python 基础 + 简单 Agent 框架，1 天就能落地）；
本地知识库 Agent：上传文档（PDF、Word），用自然语言查询内容，无需手动检索（结合 RAG 技术，新手易上手）；
代码辅助 Agent：自动检查 Python 代码错误、优化代码、生成注释（贴合开发者自身需求，边学边用）。

1.3 新手入门核心技术栈

不用堆砌复杂技术，这 4 个工具/框架就够了，全程 Python 编写，零基础也能快速掌握，按优先级排序：

核心语言：Python 3.10+（稳定、生态完善，新手优先选 3.11 版本）；
大模型：OpenAI GPT-3.5/4（新手用 GPT-3.5，免费额度足够，推理速度快）；
Agent 框架：LangChain（最主流、资料最多，新手友好，无需从零造轮子）；
辅助工具：Chroma（轻量级向量数据库，用于存储 Agent 记忆，配置简单）。

建议初学者先聚焦 LangChain 与 Python 的组合，避免过早分散精力在 AutoGen 或 CrewAI 等复杂框架上。本文实战案例仅用这 4 个核心工具，代码简洁，可直接复制运行。

二、环境搭建：10 分钟搞定 Python+Agent 开发环境

环境搭建是新手最容易卡壳的地方，这里一步一步拆解，确保每个人都能搞定，无需复杂操作。

from langchain.tools import tool import pandas as pd import matplotlib.pyplot as plt import os # 工具 1：读取 Excel 文件（核心工具，调用 pandas） @tool def read_excel(file_path: str) -> str: """ 读取 Excel 文件内容，返回数据的基本信息（行数、列数、字段名、前 5 行数据） Args: file_path: Excel 文件路径（如 ./test.xlsx） Returns: 数据基本信息，便于 Agent 分析数据 """ # 检查文件是否存在 if not os.path.exists(file_path): return f"❌ 错误：文件{file_path}不存在，请检查路径是否正确" # 读取 Excel 文件 df = pd.read_excel(file_path) # 返回数据基本信息 info = f"""✅ 成功读取 Excel 文件：{file_path} - 数据总行数：{len(df)} - 数据总列数：{len(df.columns)} - 字段名称：{list(df.columns)} - 前 5 行数据： {df.head().to_string()}""" print(info) return info # 工具 2：分析 Excel 数据（调用大模型辅助分析，结合 pandas） @tool def analyze_excel_data(file_path: str) -> str: """ 分析 Excel 数据的核心信息，包括均值、中位数、异常值等（针对数值型字段） Args: file_path: Excel 文件路径（如 ./test.xlsx） Returns: 数据详细分析结果 """ if not os.path.exists(file_path): return f"❌ 错误：文件{file_path}不存在，请检查路径是否正确" df = pd.read_excel(file_path) # 筛选数值型字段，进行分析 numeric_cols = df.select_dtypes(include=['int64', 'float64']).columns if len(numeric_cols) == 0: return "❌ 错误：Excel 文件中无数值型字段，无法进行数据分析" # 计算核心统计信息 analysis = f"📊 Excel 数据详细分析结果（仅数值型字段）：\n" for col in numeric_cols: analysis += f"- {col}：\n" analysis += f" 均值：{df[col].mean():.2f}\n" analysis += f" 中位数：{df[col].median():.2f}\n" analysis += f" 最小值：{df[col].min()}\n" analysis += f" 最大值：{df[col].max()}\n" # 简单判断异常值（超出均值±2 倍标准差） mean = df[col].mean() std = df[col].std() outliers = df[(df[col] < mean - 2 * std) | (df[col] > mean + 2 * std)] analysis += f" 异常值数量：{len(outliers)}\n\n" print(analysis) return analysis # 工具 3：生成数据可视化报表（调用 matplotlib） @tool def generate_excel_report(file_path: str, save_path: str = "./report.png") -> str: """ 生成 Excel 数据的可视化报表（柱状图），保存到指定路径 Args: file_path: Excel 文件路径（如 ./test.xlsx） save_path: 报表保存路径（默认 ./report.png） Returns: 报表生成结果 """ if not os.path.exists(file_path): return f"❌ 错误：文件{file_path}不存在，请检查路径是否正确" df = pd.read_excel(file_path) numeric_cols = df.select_dtypes(include=['int64', 'float64']).columns if len(numeric_cols) == 0: return "❌ 错误：Excel 文件中无数值型字段，无法生成报表" # 生成柱状图（取第一个数值型字段为例） plt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文乱码 plt.figure(figsize=(10, 6)) plt.bar(df.index, df[numeric_cols[0]], color='#1f77b4', alpha=0.8) plt.title(f'{numeric_cols[0]} 数据分布', fontsize=14) plt.xlabel('索引', fontsize=12) plt.ylabel(numeric_cols[0], fontsize=12) plt.grid(axis='y', alpha=0.3) # 保存报表 plt.savefig(save_path, dpi=300, bbox_inches='tight') plt.close() result = f"✅ 可视化报表已生成，保存路径：{os.path.abspath(save_path)}" print(result) return result # 工具 4：保存分析结果到文件 @tool def save_analysis_result(content: str, save_path: str = "./analysis_result.txt") -> str: """ 将数据分析结果保存到文本文件中 Args: content: 要保存的分析结果内容 save_path: 保存路径（默认 ./analysis_result.txt） Returns: 保存结果 """ with open(save_path, 'w', encoding='utf-8') as f: f.write(content) result = f"✅ 分析结果已保存，保存路径：{os.path.abspath(save_path)}" print(result) return result # 工具列表：将所有工具整理成列表，供 Agent 调用 excel_tools = [read_excel, analyze_excel_data, generate_excel_report, save_analysis_result]

from langchain.agents import AgentExecutor, create_openai_tools_agent from langchain_openai import ChatOpenAI from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder from langchain.memory import VectorStoreRetrieverMemory from langchain.vectorstores import Chroma from langchain.embeddings.openai import OpenAIEmbeddings from tools import excel_tools from dotenv import load_dotenv import os # 加载.env 文件中的 API Key load_dotenv() # 1. 初始化大模型（新手用 gpt-3.5-turbo，速度快、免费额度足） llm = ChatOpenAI( model="gpt-3.5-turbo", temperature=0.4, # 温度越低，决策越稳定，避免乱调用工具 api_key=os.getenv("OPENAI_API_KEY") ) # 2. 初始化记忆模块（Chroma 向量数据库，存储操作记录和数据信息） embeddings = OpenAIEmbeddings() vector_store = Chroma( embedding_function=embeddings, persist_directory="./agent_memory", # 记忆数据存储路径 collection_name="excel_agent_memory" ) vector_store.persist() # 记忆检索器，供 Agent 查询历史记录 retriever = vector_store.as_retriever(search_kwargs={"k": 2}) memory = VectorStoreRetrieverMemory( retriever=retriever, memory_key="chat_history", input_key="input", output_key="output" ) # 3. 定义 Agent 提示词（核心！告诉 Agent 它的角色和工作规则） prompt = ChatPromptTemplate.from_messages([ ("system", """你是一个专业的 Excel 处理 AI 智能体，基于 Python 实现，负责帮助用户自动处理 Excel 相关任务。工作规则： 1. 你的核心工具是 python 的 pandas、matplotlib 库，所有 Excel 操作都通过调用提供的工具完成； 2. 接收用户指令后，先拆解任务步骤（例如：读取 Excel→分析数据→生成报表→保存结果），再逐步调用工具； 3. 调用工具前，必须检查参数是否正确（如文件路径是否合理），若参数缺失，及时询问用户； 4. 每次执行完一个工具，查看返回结果，确认无错误后，再执行下一个步骤； 5. 利用记忆模块，记住之前处理过的文件路径、分析结果，避免重复操作； 6. 最终将所有结果整理成清晰的文字，反馈给用户，包括文件保存路径、核心分析结论。"""), MessagesPlaceholder(variable_name="chat_history"), # 记忆上下文 ("user", "{input}"), # 用户输入指令 MessagesPlaceholder(variable_name="agent_scratchpad") # Agent 思考过程 ]) # 4. 创建 Agent（基于 OpenAI 工具调用能力，结合 Python 工具） agent = create_openai_tools_agent( llm=llm, tools=excel_tools, prompt=prompt ) # 5. 创建 Agent 执行器（调度 Agent、工具、记忆） agent_executor = AgentExecutor( agent=agent, tools=excel_tools, memory=memory, verbose=True, # 开启详细日志，便于新手调试 handle_parsing_errors=True # 自动处理解析错误 ) # 定义 Agent 运行函数（供入口文件调用） def run_excel_agent(user_input: str): try: print(f"\n📋 用户指令：{user_input}") print("🚀 Agent 开始执行任务...\n") result = agent_executor.invoke({"input": user_input}) print(f"\n✅ 任务执行完成！") print(f"📄 最终结果：{result['output']}") return result except Exception as e: error_msg = f"❌ 任务执行失败：{str(e)}" print(error_msg) return {"output": error_msg}

Python + Agent 入门实战：从零搭建可复用 AI 智能体