基于 Function Calling 构建自主 AI Agent 实例

大语言模型拥有令人惊叹的语言理解和生成能力，却也存在自主决策、与外部系统交互等方面的不足。函数调用（Function Calling）技术的出现，正是为解决这一难题而生的创新方案，它赋予了大语言模型更强的自主能力和与外部世界连接的能力，成为实现真正智能自主 Agent 的关键一环。

函数调用并非一个新鲜概念。早在 2023 年 7 月，OpenAI 就为其 GPT 模型引入了这一功能，现在这一功能也被其他竞争对手采用。比如，谷歌的 Gemini API 最近也开始支持函数调用，Anthropic 也在将其整合到 Claude 中。函数调用（Function Calling，允许模型通过调用特定的函数来执行某些复杂任务。）已经成为大语言模型（LLMs）的关键功能之一，能够显著增强大模型应用能力。因此，学习这项技术是极其有意义的。

本教程将专注于实际应用上，展示如何构建一个 fully autonomous AI agent（能够独立运行和做出决策的、不需要人为干预的 AI agent），并将其与 Streamlit 集成来实现类似 ChatGPT 的 Web 交互界面。虽然本教程使用 OpenAI 进行演示，但本文内容同样适用于其他支持函数调用的大语言模型，例如 Gemini。

01 函数调用（Function Calling）的用途有哪些？

Function Calling 这一技术让开发者能够定义函数（也被称为工具（tools），可以将其视为模型要执行的操作，如进行数学运算或下订单），并让模型智能地选择并输出一个包含调用这些函数所需参数的 JSON 对象。简单来说，这一技术具备以下功能：

自主决策（Autonomous decision making）：模型能够智能地选择所需工具来回答问题。
可靠地解析过程（Reliable parsing）：响应一般以 JSON 格式呈现，而非更典型的对话式响应（dialogue-like response）。乍看之下似乎没什么，但正是这种技术使得 LLM 能够通过结构化输入（structured inputs）连接到外部系统，比如通过 API 进行交互。

这种技术为人们带来了各种各样的新机遇、新机会：

Autonomous AI assistants：机器人不仅可以回答用户咨询的问题，还能与内部系统交互，处理客户下订单和退货等任务。
Personal research assistants：比方说，当我们需要制定旅行计划时，可以请这些助理在互联网搜索内容、爬取内容、比较内容，并将结果汇总到 Excel 中。
IoT voice commands：模型可以根据检测到的用户意图来控制设备或给出操作建议，例如调节空调温度。

02 函数调用功能的运行流程

参考 Gemini 的函数调用文档，函数调用功能的运行流程如下，OpenAI 中此功能的工作原理基本相同：

用户向应用程序发出提示词（prompt）
应用程序会传递用户提供的提示词和函数声明（Function Declaration(s)），即对模型所需工具的描述信息
根据函数声明，模型会给出工具选取建议和相关的请求参数。注意，模型仅会输出建议的工具和请求参数，并不会实际调用函数
& 5. 应用程序根据模型响应调用相关 API
& 7. 将 API 的响应内容再次输入模型，生成人类可读的内容
应用程序将最终响应返回给用户，然后再次回到第 1 步，如此循环往复

上述的介绍内容可能看起来有些许复杂，接下来将通过实例详细解释该概念。

03 该 Agents 的整体设计和总体架构

在深入讲解具体代码之前，先简要介绍一下本文介绍的这个 Agents 的整体设计和总体架构。

3.1 Solution：旅游服务助手

在本文，我们将为外出旅游的酒店顾客构建一个旅游服务助手，该产品可以使用以下工具（这些工具使得该服务助手能够访问外部应用程序）。

get_items 和 purchase_item：通过 API 连接到数据库中的产品目录（product catalog），这两个工具分别用于获取商品列表和进行商品购买
rag_pipeline_func：通过检索增强生成（RAG）连接到存储和管理文档数据的存储系统，以便从非结构化文本中获取相关信息，例如酒店的宣传册

tools = [ { "type": "function", "function": { "name": "get_items", "description": "Get a list of items from the database", "parameters": { "type": "object", "properties": { "ids": { "type": "string", "description": "Comma separated list of item ids to fetch", }, "categories": { "type": "string", "description": "Comma separated list of item categories to fetch", }, }, "required": [], }, } }, { "type": "function", "function": { "name": "purchase_item", "description": "Purchase a particular item", "parameters": { "type": "object", "properties": { "id": { "type": "string", "description": "The given product ID, product name is not accepted here. Please obtain the product ID from the database first.", }, "quantity": { "type": "integer", "description": "Number of items to purchase", }, }, "required": [], }, } }, { "type": "function", "function": { "name": "rag_pipeline_func", "description": "Get information from hotel brochure", "parameters": { "type": "object", "properties": { "query": { "type": "string", "description": "The query to use in the search. Infer this from the user's message. It should be a question or a statement", } }, "required": ["query"], }, } } ]

基于 Function Calling 构建自主 AI Agent 实例