执行式 AI 入门：API 调用与网络请求基础

导读：AI Agent 正在从单纯的对话工具进化为能够主动完成任务的执行引擎。理解 API 调用与网络请求机制，是掌握这一变革的关键。

为什么需要关注 API 调用？

在 AI Agent 快速发展的今天，网络请求能力已成为开发者必须掌握的核心技能。无论是技术背景还是非技术背景，理解 Agent 如何通过 API 与外部世界交互，将帮助你更好地把握智能化转型的机遇。

从 2023 年 AutoGPT 的横空出世，到如今百花齐放的 Agent 生态，短短一年多时间，执行式 AI 已经从概念走向落地。全球 AI Agent 市场规模已突破百亿美元，背后是无数企业和个人正在经历的智能化转型。

核心概念解析

基本定义

API 调用在 AI Agent 领域中，指的是智能体通过标准接口与外部系统（如数据库、第三方服务、本地文件）进行数据交换的过程。它涉及人工智能、软件工程及系统架构等多个学科的交叉。

从技术角度看，这一概念包含以下几个层面：

维度	说明	重要程度
理论基础	支撑该技术的算法和架构原理	⭐⭐⭐⭐⭐
工程实现	将理论转化为可运行系统的过程	⭐⭐⭐⭐
应用场景	技术可以解决的实际问题	⭐⭐⭐⭐⭐
发展趋势	技术的未来演进方向	⭐⭐⭐

关键术语

以下术语是理解本章内容的基础：

核心概念：指在 AI Agent 执行过程中，实现特定功能的方法和机制。
技术指标：评估相关技术时关注的指标，包括执行效率、准确率、稳定性及可扩展性。

与传统 AI 的区别

概念	定义	与本章主题的关系
传统 AI	被动响应式系统	是 AI Agent 的演进基础
执行式 AI	主动完成任务	是本章主题的核心特征
工具调用	调用外部能力	是执行的具体手段

技术原理深入

底层架构

API 调用基础：执行式 AI 必备网络请求知识的底层架构通常概括为以下几个层次：

应用层：用户直接交互的界面，负责接收指令并展示结果。
Agent 层：核心智能体，负责理解意图、规划步骤、协调工具调用。
工具层：提供具体执行能力，如文件操作、网络请求、数据处理等。
模型层：LLM（大语言模型），作为大脑进行推理。
基础设施层：支撑运行的硬件与网络环境。

核心算法实现

在实际开发中，我们常使用 Python 构建基础执行框架。以下是两个典型的算法实现思路。

基础执行框架

class :
    
     ():
        .llm = llm  
        .tools = tools  []  
        .memory = []  

     ():
        
        
        understanding = ._understand(task)
        
        plan = ._plan(understanding)
        
        results = []
         step  plan:
            result = ._execute_step(step)
            results.append(result)
            
              ._verify(result):
                plan = ._replan(step, result)
        
        output = ._summarize(results)
         output

     ():
        
        prompt = 
         .llm.generate(prompt)

     ():
        
        prompt = 
        plan_text = .llm.generate(prompt)
         ._parse_plan(plan_text)

     ():
        
        tool = ._select_tool(step)
        result = tool.execute(step)
        .memory.append({: step, : tool.name, : result})
         result

     ():
        
         result.get(, )

     ():
        
        prompt = 
        new_plan = .llm.generate(prompt)
         ._parse_plan(new_plan)

     ():
        
        prompt = 
         .llm.generate(prompt)

     ():
        
         [line.strip()  line  plan_text.split()  line.strip()]

     ():
        
         tool  .tools:
             tool.can_handle(step):
                 tool
         DefaultTool()


agent = AIAgent(llm=MockLLM(), tools=[FileTool(), WebTool()])
result = agent.execute()
(result)

class ReActAgent: """基于 ReAct 范式的 AI Agent""" def __init__(self, llm, tools): self.llm = llm self.tools = {tool.name: tool for tool in tools} self.max_iterations = 10 def run(self, task): """运行 ReAct 循环""" context = f"任务：{task}\n" for i in range(self.max_iterations): # 思考阶段 thought = self._think(context) print(f"[思考] {thought}") # 判断是否完成 if "任务完成" in thought or "Final Answer:" in thought: return self._extract_answer(thought) # 行动阶段 action, action_input = self._decide_action(thought) print(f"[行动] {action}({action_input})") # 观察阶段 observation = self._observe(action, action_input) print(f"[观察] {observation}") # 更新上下文 context += f"\n思考：{thought}\n行动：{action}({action_input})\n观察：{observation}" return "达到最大迭代次数，任务未完成" def _think(self, context): """思考下一步""" prompt = f""" {context} 请思考下一步应该做什么。如果任务已完成，请回答"任务完成：[结果]" """ return self.llm.generate(prompt) def _decide_action(self, thought): """决定执行什么行动""" prompt = f"根据思考'{thought}'，选择要执行的工具和参数" response = self.llm.generate(prompt) return self._parse_action(response) def _observe(self, action, action_input): """执行行动并观察结果""" if action in self.tools: return self.tools[action].execute(action_input) return f"未知工具：{action}" def _extract_answer(self, thought): """提取最终答案""" return thought.split("任务完成：")[-1].strip() def _parse_action(self, response): """解析行动响应""" lines = response.strip().split('\n') action = "default" action_input = "" for line in lines: if "工具：" in line or "tool:" in line.lower(): action = line.split("：")[-1].strip() if "参数：" in line or "input:" in line.lower(): action_input = line.split("：")[-1].strip() return action, action_input # 工具基类 class Tool: name = "base_tool" def execute(self, input_data): raise NotImplementedError def can_handle(self, task): return False class FileTool(Tool): name = "file_tool" def execute(self, input_data): return f"文件操作完成：{input_data}" def can_handle(self, task): return "文件" in task or "file" in task.lower() class WebTool(Tool): name = "web_tool" def execute(self, input_data): return f"网络请求完成：{input_data}" def can_handle(self, task): return "搜索" in task or "网页" in task or "web" in task.lower() class DefaultTool(Tool): name = "default" def execute(self, input_data): return f"默认处理：{input_data}" # Mock LLM for demo class MockLLM: def generate(self, prompt): if "思考" in prompt: return "我需要先搜索相关信息" elif "选择" in prompt: return "工具：web_tool\n参数：搜索 AI Agent" return "处理完成"

阶段	时间	关键突破	代表性项目
萌芽期	2022	大模型具备工具调用能力	GPT-3.5
爆发期	2023	自主执行 Agent 诞生	AutoGPT、BabyAGI
发展期	2024	多 Agent 协作成熟	MetaGPT、AutoGen
应用期	2025	行业落地加速	各类垂直 Agent

指标	实施前	实施后	提升幅度
处理时间	4 小时/天	30 分钟/天	87%
分类准确率	70%	95%	36%
人力投入	2 人	0.5 人	75%

场景	推荐模型	理由
简单任务	GPT-3.5/国产小模型	成本低、速度快
复杂推理	GPT-4/Claude	推理能力强
代码任务	GPT-4/Claude	代码能力强
本地部署	LLaMA/Qwen	数据安全

阶段	学习重点	时间投入
入门期	基础概念、工具使用	1-2 个月
进阶期	原理理解、项目实践	2-4 个月
专业期	架构设计、优化调优	4-8 个月
专家期	创新研究、团队领导	1 年以上

执行式 AI 入门：API 调用与网络请求基础