大模型 Agent 开发指南：基于 LangChain 的实战应用 | 极客日志

PythonAI算法

大模型 Agent 开发指南：基于 LangChain 的实战应用

综述由AI生成深入解析大模型 Agent 的核心概念与开发流程，重点介绍基于 LangChain 框架实现工具调用与自主决策的方法。内容涵盖 ReAct 模式原理、Prompt 工程优化、自定义工具构建及完整代码示例，旨在帮助开发者快速掌握 Agent 应用开发技能，解决复杂任务规划问题。文章详细阐述了从工具定义、调度原理到标准 Agent 初始化的全过程，并补充了错误处理、Token 限制及安全注意事项，提供了一套完整的实战指南。

时间旅人发布于 2025/2/6更新于 2026/6/323 浏览

大模型 Agent 开发指南：基于 LangChain 的实战应用

一、Agent 简介与核心概念

大模型 Agent（智能体）是结合了大规模神经网络模型和自主计算实体的技术，它具备强大的表达、学习和交互能力，能够在无人干预的情况下，根据环境信息自主决策和控制行为。简单来说，Agent 是增强大模型能力的技术方案路径。

1.1 Agent 的三大组成部分

一个完整的 Agent 系统通常包含以下三个核心部分：

工具（Tools）：Agent 可以调用的外部能力，如搜索、计算器、数据库查询等。
工具选择方案（Tool Selection）：Agent 根据当前任务判断应该使用哪个工具的过程。
大模型工具应用：将工具的执行结果反馈给大模型，由模型生成最终回答。

1.2 运行流程

Agent 的运行大体遵循以下闭环流程：

用户给出一个任务（Prompt）：用户输入自然语言指令。
思考（Thought）：大模型分析任务，决定下一步行动。
行动（Action）：调用相应的工具或 API。
观察（Observation）：获取工具返回的结果，作为新的上下文输入。

这一过程会循环执行，直到大模型认为已经获得足够的信息来回答用户问题。

二、LangChain 框架下的 Agent 开发

LangChain 是目前最流行的 LLM 应用开发框架之一，它提供了丰富的组件来构建 Agent。在 LangChain 中，我们可以灵活地定义工具、配置提示词模板以及管理对话状态。

2.1 自定义工具的定义

在 LangChain 中，我们需要为每个工具定义清晰的描述和参数。这有助于大模型理解何时以及如何调用该工具。

2.1.1 工具代码示例

以下是一个基于天气查询的自定义工具示例，展示了如何使用 Pydantic 进行参数校验：

from pydantic import BaseModel, Field
import requests

# 模拟 API Key 配置
SENIVERSE_API_KEY = "your_api_key_here"

def weather(location: str, api_key: str):
    url = f"https://api.seniverse.com/v3/weather/now.json?key={api_key}&location={location}&language=zh-Hans&unit=c"
    try:
        response = requests.get(url)
        if response.status_code == 200:
            data = response.json()
            weather_info = {
                "temperature": data["results"][][][],
                : data[][][][],
            }
             weather_info
        :
             Exception()
     Exception  e:
         

 ():
     weather(location, SENIVERSE_API_KEY)

 ():
    location:  = Field(description=)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain.utilities import ArxivAPIWrapper
from langchain_experimental.tools import PythonAstREPLTool
from typing import Dict, Tuple
import os
import json

arxiv = ArxivAPIWrapper()
python_tool = PythonAstREPLTool()

class ElectricityBillTool:
    def run(self, name, start_date, end_date):
        # 实际场景中应连接数据库查询电费
        return f"电费查询结果：姓名：{name}, 期间：{start_date} 到 {end_date}, 电费：100 元"

def tool_wrapper_for_model(tool, expects_kwargs=True):
    def tool_(args_json):
        args = json.loads(args_json)
        if expects_kwargs:
            return tool.run(**args)
        else:
            return tool.run(args['query'])
    return tool_

TOOLS = [
    {
        'name_for_human': 'Arxiv',
        'name_for_model': 'Arxiv',
        'description_for_model': 'A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics...',
        'parameters': [{"name": "query", "type": "string", "description": "the document id of arxiv to search", 'required': True}], 
        'tool_api': tool_wrapper_for_model(arxiv, expects_kwargs=False)
    },
    {
        'name_for_human': 'ElectricityBill',
        'name_for_model': 'ElectricityBill',
        'description_for_model': '查询电费工具，根据姓名、开始时间和结束时间查询电费。',
        'parameters': [
            {"name": "name", "type": "string", "description": "姓名", 'required': True},
            {"name": "start_date", "type": "string", "description": "开始时间", 'required': True},
            {"name": "end_date", "type": "string", "description": "结束时间", 'required': True}
        ],
        'tool_api': tool_wrapper_for_model(ElectricityBillTool(), expects_kwargs=True)
    }
]

TOOL_DESC = "{name_for_model}: Call this tool to interact with the {name_for_human} API. What is the {name_for_human} API useful for? {description_for_model} Parameters: {parameters} Format the arguments as a JSON object."

REACT_PROMPT = """Answer the following questions as best you can. You have access to the following tools:

{tool_descs}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can be repeated zero or more times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {query}"""

def build_planning_prompt(TOOLS, query):
    tool_descs = []
    tool_names = []
    for info in TOOLS:
        tool_descs.append(
            TOOL_DESC.format(
                name_for_model=info['name_for_model'],
                name_for_human=info['name_for_human'],
                description_for_model=info['description_for_model'],
                parameters=json.dumps(info['parameters'], ensure_ascii=False),
            )
        )
        tool_names.append(info['name_for_model'])
    tool_descs = '\n\n'.join(tool_descs)
    tool_names = ','.join(tool_names)
    prompt = REACT_PROMPT.format(tool_descs=tool_descs, tool_names=tool_names, query=query)
    return prompt

def parse_latest_plugin_call(text: str) -> Tuple[str, str]:
    i = text.rfind('\nAction:')
    j = text.rfind('\nAction Input:')
    k = text.rfind('\nObservation:')
    if 0 <= i < j:
        if k < j:
            text = text.rstrip() + '\nObservation:'
            k = text.rfind('\nObservation:')
    if 0 <= i < j < k:
        plugin_name = text[i + len('\nAction:'):j].strip()
        plugin_args = text[j + len('\nAction Input:'):k].strip()
        return plugin_name, plugin_args
    return '', ''

def use_api(tools, response):
    use_toolname, action_input = parse_latest_plugin_call(response)
    if use_toolname == "":
        return "no tool founds"
    used_tool_meta = list(filter(lambda x: x["name_for_model"] == use_toolname, tools))
    if len(used_tool_meta) == 0:
        return "no tool founds"
    api_output = used_tool_meta[0]["tool_api"](action_input)
    return api_output

def get_model_response(prompt, stop):
    from openai import OpenAI
    client = OpenAI()
    completion = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        stream=False,
        stop=stop,
    )
    response = completion.choices[0].message.content
    return response

def main(query, choose_tools):
    prompt = build_planning_prompt(choose_tools, query)
    stop = ["Observation:", "Observation:\n"]
    print("Initial Prompt:")
    print(prompt)
    response = get_model_response(prompt, stop)

    while "Final Answer:" not in response:
        api_output = use_api(choose_tools, response)
        api_output = str(api_output)
        if "no tool founds" == api_output:
            break
        print(f"Response: \033[32m{response}\033[0m")
        print(f"Output: \033[34m{api_output}\033[0m")
        prompt = prompt + response + ' ' + api_output
        response = get_model_response(prompt, stop)

    print("\033[32m" + response + "\033[0m")

if __name__ == "__main__":
    query = "查一下张三 2024 年 1 月的电费"
    choose_tools = TOOLS
    print("=" * 10)
    main(query, choose_tools)

from langchain.agents import initialize_agent, AgentType
from langchain_community.llms import ChatOpenAI
from langchain.tools import Tool

def get_llm():
    api_key = os.getenv("PROXY_API_KEY")
    api_url = os.getenv("PROXY_SERVER_URL")
    api_url = api_url.split('/chat')[0]
    model = os.getenv("PROXYLLM_BACKEND")

    if "openai" in api_url:
        llm = ChatOpenAI(temperature=0, model=model, openai_api_base=api_url, openai_api_key=api_key)
    elif "bigmodel" in api_url:
        from langchain_community.chat_models import ChatZhipuAI
        llm = ChatZhipuAI(temperature=0.01, api_key=api_key, model="glm-4")
    elif "dashscope" in api_url:
        from langchain_community.chat_models.tongyi import ChatTongyi
        llm = ChatTongyi(model="qwen-max", top_p=0.01, streaming=True, dashscope_api_key=api_key)
    return llm

def get_tools():
    llm = get_llm()
    tools = [
        Tool(
            name="查询负荷数据及同比环比",
            func=calculate_growth,
            description="当你想要查询某地负荷（最大值、最小值、平均值），查询最大/最小值发生时间，或者查询同比或环比变化的时候很有用。输入格式：地区 | 时间 | 指标 | 对比类型。例如：上海|2023|最大 | 环比。"
        ),
        Tool(
            name="查询负荷新高 (低)",
            func=find_record_breaking_loads,
            description="当你想要查询某地负荷几创新高或几创新低的时候很有用。输入格式：地区 | 基础时间 | 对比时间 | 高/低。"
        ),
    ]
    return tools

def get_tools_agent_prompt(query, history=None):
    from datetime import datetime
    current_time = datetime.now()
    prompt = (
        f"""
        如果查询未指定年/月，请参考当前时刻：{current_time}。
        请用中文思考及回复。
        优先考虑使用工具解决问题，当工具无法解决时，尝试根据经验直接回答。
        最终回复时若内容较多需要注意保持可读性，添加合理的换行。
        下面是用户问题:
        """
        + query
    )
    return prompt

def get_tools_agent():
    llm = get_llm()
    tools = get_tools()
    agent = initialize_agent(
        tools, 
        llm, 
        agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, 
        verbose=True, 
        max_iterations=5,
        handle_parsing_errors=True,
    )
    return agent

# 使用示例
agent = get_tools_agent()
prompt = get_tools_agent_prompt("查询北京 2023 年夏季最高负荷")
response = agent.run(prompt)
print(response)

import pandas as pd
from dateutil.parser import parse

df = pd.DataFrame({'公司': ['北京', '上海'], '时间': ['2023-01-01', '2023-01-02'], '负荷': [100, 120]})

def calculate_growth(context):
    params = context.split("|")
    if len(params) < 3:
        return "至少需要三个参数（region, time_period, compare_type）。"
    region = params[0]
    time_period = params[1]
    compare_type = params[2]
    growth_type = params[3] if len(params) > 3 else None
    # 此处应接入真实数据库查询逻辑
    return f"{region} 在{time_period}的{compare_type}增长率为 5%。"

def find_record_breaking_loads(context):
    params = context.split("|")
    if len(params) not in [3, 4]:
        return "您输入的参数数量不匹配，请仔细核对。"
    region = params[0]
    current_time_period = params[1]
    high_low = params[-1]
    compare_time_period = params[2] if len(params) == 4 else str(int(current_time_period[:4])-1) + current_time_period[4:]
    
    df_region = df[df['公司'] == region]
    # 模拟计算逻辑
    return f"{region}在{current_time_period}相较{compare_time_period}共有 1 次创下新{high_low}。"

大模型 Agent 开发指南：基于 LangChain 的实战应用

大模型 Agent 开发指南：基于 LangChain 的实战应用

一、Agent 简介与核心概念

1.1 Agent 的三大组成部分

1.2 运行流程

二、LangChain 框架下的 Agent 开发

2.1 自定义工具的定义

2.1.1 工具代码示例

更多推荐文章

相关免费在线工具

2.2 工具调度原理

2.2.1 ReAct 模式详解

2.2.2 工具描述构建

2.3 完整 Agent 实现流程

三、LangChain 标准 Agent 开发模式

3.1 初始化 Agent

3.2 关键 Agent 类型说明

四、工具函数实现细节

4.1 负荷数据查询工具

五、最佳实践与注意事项

5.1 错误处理

5.2 Token 限制

5.3 安全性

六、总结

更多推荐文章

相关免费在线工具

大模型 Agent 开发指南：基于 LangChain 的实战应用

大模型 Agent 开发指南：基于 LangChain 的实战应用

一、Agent 简介与核心概念

1.1 Agent 的三大组成部分

1.2 运行流程

二、LangChain 框架下的 Agent 开发

2.1 自定义工具的定义

2.1.1 工具代码示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 工具调度原理

2.2.1 ReAct 模式详解

2.2.2 工具描述构建

2.3 完整 Agent 实现流程

三、LangChain 标准 Agent 开发模式

3.1 初始化 Agent

3.2 关键 Agent 类型说明

四、工具函数实现细节

4.1 负荷数据查询工具

五、最佳实践与注意事项

5.1 错误处理

5.2 Token 限制

5.3 安全性

六、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具