AI 核心概念解析：Skill、MCP 与 Function Call

在构建 AI 应用时，我们常听到 Skill（技能）、MCP（模型上下文协议） 和 Function Call（函数调用） 这三个词。它们听起来很像，但层级和用途其实完全不同。

简单来说，你可以这样理解它们的定位关系：

Function Call 是基础的'能力调用机制'，让模型知道何时调用工具。
Skill 是面向用户的'功能产品'，把复杂逻辑打包成一个可复用的模块。
MCP 则是连接 AI 与外部资源的'新一代通信协议'，解决标准化问题。

Function Call：最基础的交互机制

这是目前大模型生态中最广泛使用的概念，主要由 OpenAI 在 2023 年引入并普及。它本质上是一种机制，让大语言模型能够智能地决定在何时、以何种参数调用开发者预先定义好的函数。

它不是直接执行代码，而是输出一个结构化的调用请求。

实际工作流程通常是这样的：

定义：开发者向模型描述一系列可用的函数，包括函数名、描述、参数列表及类型。
决策：用户提问后，模型根据上下文判断是否需要调用函数，以及调用哪个、参数是什么。
响应：模型返回一个结构化的 JSON 对象（例如 {"name": "get_weather", "arguments": {"location": "Beijing"}}），而不是自然语言。
执行：应用程序收到 JSON 后，在本地或服务器端实际执行对应的代码，获取结果（如调用天气 API）。
回复：将执行结果返回给模型，模型再组织成自然语言回复给用户。

特点：

标准化：已成为众多模型（OpenAI, Anthropic, 国内大模型等）支持的标准特性。
核心机制：是实现 AI 与外部世界交互的基石。
开发层：主要面向开发者，普通用户感知不强。

举个例子，你问'北京天气怎么样？'，模型不会瞎猜，而是'调用'了你定义的 get_weather(location) 函数，拿到真实数据后再告诉你。

Skill：封装好的功能模块

这是一个更高层、更产品化的概念，常见于 AI 智能体（AI Agent）和 AI 应用平台（如 Coze, GPTs, Dify）。

什么是 Skill？ 它是一个封装好的、可重复使用的功能模块或 AI 能力。一个 Skill 内部可能包含提示词、知识库、一个或多个 Function Call，甚至是工作流。

如何工作：

构建：在平台上通过可视化或配置化方式，将一个完整的能力打包。比如一个'订机票'Skill，可能包含查询航班、获取价格、填写订单等多个步骤。
调用：用户通过自然语言触发（如'我想去上海'），AI 智能体自动识别并调用最匹配的 Skill。
执行：Skill 作为一个整体在后台运行，可能串联多个动作，最终返回结果。

特点：

产品化：终端用户可以直接理解和使用（如'翻译技能'、'画图技能'）。
可组合性：可以在智能体中安装多个 Skills，让它具备多种能力。
封装性：隐藏了底层复杂的函数调用和逻辑，提供端到端的体验。

比如在 Coze 平台上安装了一个'全网搜索'Skill。当用户问'最近有什么科技新闻？'时，Bot 会自动使用这个 Skill 去搜索并返回结果。其底层其实就是通过 Function Call 来调用搜索 API。

特性	Function Call	Skill	MCP
层级	基础机制（原子操作）	产品模块（功能集合）	通信协议（基础设施）
目标	让模型能调用单个外部函数	为用户提供完整的、可复用的能力	标准化模型与外部工具的交互方式
面向对象	开发者	终端用户 / 低代码开发者	工具开发者 & AI 应用开发者
关键优势	直接、灵活、广泛支持	易用、可组合、端到端	标准化、可发现、安全、资源感知
类比	单个'积木'	打包好的'乐高套装'	统一的'积木连接接口标准'

维度	Function Call	Skill	MCP
抽象层级	模型原生接口	应用功能模块	通信协议标准
厂商绑定	是（OpenAI/Anthropic 等）	否（框架无关）	否（开放标准）
互操作性	低（各厂格式不同）	中（依赖框架）	高（统一协议）
开发复杂度	低（直接用 API）	中（需封装逻辑）	中（需实现 server）
适用场景	快速集成简单工具	构建复杂 Agent	企业级多模型/多工具集成

AI 核心概念解析：Skill、MCP 与 Function Call