AI 核心概念解析:Skill、MCP 与 Function Call
在构建 AI 应用时,我们常听到 Skill(技能)、MCP(模型上下文协议) 和 Function Call(函数调用) 这三个词。它们听起来很像,但层级和用途其实完全不同。
简单来说,你可以这样理解它们的定位关系:
- Function Call 是基础的'能力调用机制',让模型知道何时调用工具。
- Skill 是面向用户的'功能产品',把复杂逻辑打包成一个可复用的模块。
- MCP 则是连接 AI 与外部资源的'新一代通信协议',解决标准化问题。
Function Call:最基础的交互机制
这是目前大模型生态中最广泛使用的概念,主要由 OpenAI 在 2023 年引入并普及。它本质上是一种机制,让大语言模型能够智能地决定在何时、以何种参数调用开发者预先定义好的函数。
它不是直接执行代码,而是输出一个结构化的调用请求。
实际工作流程通常是这样的:
- 定义:开发者向模型描述一系列可用的函数,包括函数名、描述、参数列表及类型。
- 决策:用户提问后,模型根据上下文判断是否需要调用函数,以及调用哪个、参数是什么。
- 响应:模型返回一个结构化的 JSON 对象(例如
{"name": "get_weather", "arguments": {"location": "Beijing"}}),而不是自然语言。 - 执行:应用程序收到 JSON 后,在本地或服务器端实际执行对应的代码,获取结果(如调用天气 API)。
- 回复:将执行结果返回给模型,模型再组织成自然语言回复给用户。
特点:
- 标准化:已成为众多模型(OpenAI, Anthropic, 国内大模型等)支持的标准特性。
- 核心机制:是实现 AI 与外部世界交互的基石。
- 开发层:主要面向开发者,普通用户感知不强。
举个例子,你问'北京天气怎么样?',模型不会瞎猜,而是'调用'了你定义的 get_weather(location) 函数,拿到真实数据后再告诉你。
Skill:封装好的功能模块
这是一个更高层、更产品化的概念,常见于 AI 智能体(AI Agent)和 AI 应用平台(如 Coze, GPTs, Dify)。
什么是 Skill? 它是一个封装好的、可重复使用的功能模块或 AI 能力。一个 Skill 内部可能包含提示词、知识库、一个或多个 Function Call,甚至是工作流。
如何工作:
- 构建:在平台上通过可视化或配置化方式,将一个完整的能力打包。比如一个'订机票'Skill,可能包含查询航班、获取价格、填写订单等多个步骤。
- 调用:用户通过自然语言触发(如'我想去上海'),AI 智能体自动识别并调用最匹配的 Skill。
- 执行:Skill 作为一个整体在后台运行,可能串联多个动作,最终返回结果。
特点:
- 产品化:终端用户可以直接理解和使用(如'翻译技能'、'画图技能')。
- 可组合性:可以在智能体中安装多个 Skills,让它具备多种能力。
- 封装性:隐藏了底层复杂的函数调用和逻辑,提供端到端的体验。
比如在 Coze 平台上安装了一个'全网搜索'Skill。当用户问'最近有什么科技新闻?'时,Bot 会自动使用这个 Skill 去搜索并返回结果。其底层其实就是通过 Function Call 来调用搜索 API。



