提示词、Agent、MCP、Skill 到底是什么？一文搞懂 AI 圈最火的四个概念

优质文章学习记录

09 Apr 2026 — 10 min read

最近 AI 圈有几个词被反复提起：提示词、Agent、MCP、Skill。很多人听了半天还是一头雾水——它们到底是什么？有什么区别？什么时候用哪个？这篇文章用一个贯穿始终的比喻，把这四个概念讲清楚。

先建立一个统一的比喻

想象你开了一家外卖店，雇了一个聪明的员工来处理订单。

提示词 = 你给员工的工作指令
Skill = 员工手边的操作手册
MCP = 员工能用的各种工具和设备（电话、收银机、外卖平台）
Agent = 员工本人——能自主思考、决策、行动的那个人

这四个东西不是竞争关系，而是同一个系统里的不同层次。

一、提示词（Prompt）：你说的每一句话

是什么

提示词就是你输入给 AI 的文字。最简单的形式：

帮我写一封请假邮件

复杂一点的，叫系统提示词（System Prompt），在对话开始前就告诉 AI 它的角色和规则：

你是一个专业的客服助手，只回答关于我们产品的问题， 语气要友好，回答要简洁，不超过 100 字。

类比

提示词就是你对员工说的话。"今天重点处理退款投诉"、"回复客户要有礼貌"——这些都是提示词。

局限性

提示词有个根本问题：每次对话都要重新说。

你今天告诉员工"要有礼貌"，明天他忘了，你还得再说一遍。而且提示词越长，AI 的注意力越分散，效果越差。

这就是为什么需要 Skill。

二、Skill：员工手边的操作手册

是什么

Skill 是一个 Markdown 文件（SKILL.md），开头用 YAML 格式标注名称和描述，正文写操作指南：

--- name: refund-handler # 技能名称 description: 处理退款申请 # 简短描述 ---

# 退款处理流程

当用户申请退款时：
1. 核实订单号和购买时间
2. 如果在 7 天内，直接批准
3. 如果超过 7 天，转人工审核
4. 回复用户预计到账时间

类比

Skill 是员工桌上的操作手册。不用每次都口头交代，员工遇到退款问题，自己翻手册就知道怎么做。

和提示词的区别

	提示词	Skill
作用范围	当次对话	按需加载，可复用
适合写什么	临时指令、角色设定	特定任务的操作流程
管理方式	每次手动输入	文件形式，统一管理
典型场景	"帮我改一下这段话"	"遇到退款请求，这样处理"

一句话：提示词是你说的话，Skill 是写下来的规范。

三、MCP：员工能用的工具和设备

是什么

MCP（Model Context Protocol，模型上下文协议）是 Anthropic 在 2024 年 11 月发布的开放标准。2025 年 12 月，MCP 已捐赠给 Linux 基金会下的 Agentic AI Foundation，由 Anthropic、Block、OpenAI 共同创立，AWS、Google、Microsoft 等为白金支持方，成为行业事实标准。

它解决的问题是：AI 怎么连接外部世界？

在 MCP 出现之前，每个 AI 应用想接入一个外部工具（数据库、GitHub、飞书……），都要单独写一套对接代码。10 个工具，10 套代码，维护噩梦。

MCP 的做法是：定义一套统一的通信协议。工具方按这个协议暴露能力，AI 按这个协议调用工具。一次对接，到处可用。

🔌 MCP 之于 AI，就像 USB-C 之于电子设备——不管是手机、平板还是笔记本，一个接口全搞定。

类比

MCP 是员工能用的工具和设备：电话（打给供应商）、收银机（处理支付）、外卖平台后台（查看订单）。

这些工具不是员工自带的，是店里配备的。员工（AI）通过标准接口使用它们，不需要关心每个设备内部怎么工作。

工作原理

MCP 采用客户端-服务器架构：

MCP 服务器：包装外部工具（数据库、API、文件系统等），暴露标准接口
MCP 客户端：AI 应用通过客户端连接服务器，调用工具能力
通信协议：双方通过 JSON-RPC 2.0 协议通信

一次配置，到处可用——这就是 MCP 的核心价值。

MCP 能做什么

MCP 服务器可以向 AI 暴露三类能力：

能力类型	说明	举例
Resources（资源）	让 AI 读取数据	读取数据库记录、文件内容
Tools（工具）	让 AI 执行操作	发送消息、创建工单、查询 API
Prompts（模板）	预置工作流模板	代码审查模板、报告生成模板

目前有哪些 MCP 服务器

截至 2026 年初，GitHub 上已有超过 13,000 个 MCP 服务器（数据来源：tolearn.blog），覆盖：

数据库：PostgreSQL、MySQL、MongoDB、Redis
协作工具：飞书/Lark、Slack、Notion、GitHub
云服务：AWS、阿里云、腾讯云
本地文件系统、浏览器控制等

Skill 和 MCP 的区别

这是最容易混淆的地方。

TL;DR：MCP 连接工具，Skill 告诉 AI 怎么用工具。

	Skill	MCP
本质	Markdown 文件，给 AI 看的说明	通信协议，连接 AI 和外部系统
解决什么问题	AI 不知道怎么做某件事	AI 无法访问外部数据和工具
类比	操作手册	工具和设备本身
举例	"遇到退款请求，按这个流程处理"	连接到订单系统，能查询和修改订单

两者经常配合使用：MCP 提供能力，Skill 告诉 AI 如何运用这个能力。

四、Agent：能自主干活的员工

是什么

Agent（智能体）是能自主观察、思考、决策、行动的 AI 助手。

普通 AI 对话是这样的：

你说一句 → AI 回一句 → 结束

Agent 是这样的：

你说一句 → AI 思考 → AI 行动 → AI 观察结果 → AI 再思考 → AI 再行动 → ... → 完成任务

Agent 可以：
- 调用工具（通过 MCP）
- 执行代码
- 浏览网页
- 存储记忆
- 把任务拆分给其他 Agent

类比

Agent 就是员工本人。他不只是被动执行指令，而是能主动思考：

"客户说退款没到账，我先查一下订单状态（调用 MCP 工具），发现是银行处理延迟，然后给客户发一条解释消息（再次调用工具），最后在系统里记录这个问题（又一次调用工具）。"

整个过程，你只说了一句"处理一下这个退款投诉"，Agent 自己完成了后续所有步骤。

Agent 和其他概念的关系

你的指令（提示词） ↓ Agent（员工） ├── 加载 Skill（查操作手册） └── 调用 MCP（使用工具） ├── 查询数据库 ├── 发送飞书消息 └── 操作 GitHub

Agent 是执行主体，其他三个都是它的"装备"。

五、四个概念的完整对比

	提示词	Skill	MCP	Agent
是什么	给 AI 的文字指令	任务操作手册	连接外部工具的协议	自主行动的 AI 实例
解决什么	告诉 AI 做什么	规范 AI 怎么做	让 AI 能访问外部世界	让 AI 自主完成复杂任务
类比	你说的话	操作手册	工具和设备	员工本人
谁在用它	用户	Agent	Agent	你
能独立存在吗	✅	✅	✅	✅
典型形式	文字	SKILL.md 文件	MCP 服务器	运行中的 AI 进程

六、什么时候用哪个？

场景一：临时问一个问题

"帮我把这段英文翻译成中文"

→ 只需要提示词，不需要其他任何东西。

场景二：重复性的标准化任务

每次有用户投诉，都按同一套流程处理

→ 写一个 Skill，把流程固化下来，AI 每次遇到投诉自动加载。

场景三：AI 需要访问你的系统

"帮我查一下今天的销售数据"、"在飞书上发一条通知"

→ 需要 MCP，把你的数据库、飞书等系统通过 MCP 协议暴露给 AI。

场景四：复杂的多步骤任务

"分析本周的用户反馈，整理出 Top 10 问题，生成报告，发给产品团队"

→ 需要 Agent，它会自主拆解任务、调用工具、完成整个流程，你只需要说一句话。

和场景三的区别：场景三是"你告诉 AI 每一步做什么"，场景四是"你只说目标，AI 自己规划步骤"。

七、一个真实的例子串起来

假设你要搭建一个智能客服系统：

提示词：设定 AI 的角色——"你是XX公司的客服助手，语气友好，只回答产品相关问题"
Skill：写几个操作手册——退款处理流程、投诉升级流程、常见问题解答
MCP：接入公司系统——订单数据库（查询订单）、飞书（通知人工客服）、工单系统（创建工单）
Agent：把以上三者组合起来，让 AI 自主处理用户咨询，遇到复杂问题自动升级，全程不需要人工干预

这四个东西，缺一不可。

总结

概念	一句话
提示词	你对 AI 说的话
Skill	AI 的操作手册，告诉它怎么做某件事
MCP	AI 连接外部世界的标准接口，像 USB-C
Agent	能自主思考和行动的 AI，是执行主体

它们不是竞争关系，而是同一个 AI 系统的不同层次：

你用提示词告诉 Agent 做什么，Agent 查阅 Skill 知道怎么做，通过 MCP 调用工具完成任务。

AI 的能力边界，正在从"回答问题"扩展到"完成任务"。提示词、Skill、MCP、Agent——这四样东西，就是这场扩展的基础设施。下次再看到这些词，你应该不会一头雾水了。

看完就想试！通义千问2.5-7B打造的智能写作案例展示

看完就想试！通义千问2.5-7B打造的智能写作案例展示 1. 引言：为什么选择通义千问2.5-7B-Instruct？在当前大模型快速演进的背景下，如何在性能、成本与实用性之间取得平衡，成为开发者和企业关注的核心问题。通义千问2.5-7B-Instruct 正是在这一需求下脱颖而出的一款“中等体量、全能型、可商用”大语言模型。该模型于2024年9月随Qwen2.5系列发布，基于70亿参数全权重激活架构（非MoE），专为指令理解与任务执行优化，在多项权威基准测试中表现优异。更重要的是，它具备出色的中文理解能力、代码生成水平、数学推理能力以及工具调用支持，非常适合用于构建智能写作助手、自动化内容生成系统等实际应用场景。本文将围绕该模型的技术特性，结合真实可运行的实践案例，展示其在智能写作领域的强大潜力，并提供完整的本地部署与调用方案，帮助你快速上手并落地应用。 2. 模型核心能力解析 2.1 多维度性能优势通义千问2.5-7B-Instruct并非简单的参数堆叠产物，而是在多个关键维度进行了深度优化：能力维度具体表现上下文长度支持高达128k tokens

打造专属DIY智能设备：ESP32语音交互智能家居DIY指南

打造专属DIY智能设备：ESP32语音交互智能家居DIY指南【免费下载链接】xiaozhi-esp32Build your own AI friend 项目地址: https://gitcode.com/GitHub_Trending/xia/xiaozhi-esp32 你是否遇到过这样的困扰：深夜起床摸黑找开关？忙碌时无法腾出手控制家电？市面上的智能音箱功能固定，无法满足个性化需求？现在，你可以亲手打造一款完全定制化的语音交互设备，既能听懂你的指令，又能根据生活习惯灵活扩展功能。本文将带你用ESP32开发板构建专属智能语音助手，从硬件选型到功能实现，让技术小白也能轻松上手开源语音助手项目。为什么选择ESP32？语音交互方案对比分析在众多开发平台中，ESP32之所以成为语音交互设备的理想选择，源于其独特的"全能型"特性。与树莓派相比，它体积更小、功耗更低；与Arduino相比，它内置Wi-Fi和蓝牙模块，无需额外扩展；与专用语音芯片相比，它支持灵活的软件开发，可随时升级功能。 ESP32语音助手的工作流程就像一个迷你"语音翻译官"

OpenClaw机器人引爆天网，首次拥有记忆，逆天了！

手把手教你一键部署OpenClaw，连接微信、QQ、飞书、钉钉等，1分钟全搞定！ OpenClaw这款开源机器人最近彻底火了，它让机器人第一次有了“记性”。这种原本只在科幻片里出现的“天网”级技术，居然直接在GitHub上公开了源代码。就在刚刚，全球搞开源机器人的圈子被推特上的一条动态给点燃了！手把手教你一键部署OpenClaw，连接微信、QQ、飞书、钉钉等，1分钟全搞定！视频里，一台装了OpenClaw系统的宇树人形机器人在屋里四处走动。它全身上下都是传感器——激光雷达、双目视觉外加RGB相机，这些设备捕捉到的海量数据都被喂进了一个大脑里。紧接着，奇迹发生了：这台宇树机器人竟然开始理解空间和时间了！这种事儿在以前的机器人身上压根没出现过。手把手教你一键部署OpenClaw，连接微信、QQ、飞书、钉钉等，1分钟全搞定！它不仅分得清房间、人和东西都在哪儿，甚至还记得在什么时间点发生了什么事。开发团队给这种神技起名叫“空间智能体记忆”。简单来说，就是机器人从此以后也有了关于世界的“长期记忆”！而把这种科幻照进现实的，正是最近在国际上大红大紫的开源项目OpenClaw。

火电场景机器人巡检未来前景和趋势

想象一下这样的火电厂：输煤皮带不再需要工人冒着粉尘和高温来回巡检，而是由轨道机器人24小时“盯梢”；锅炉、汽机区的高风险作业，交给带机械臂的机器人完成；集控室的大屏上，所有设备状态、报警信息由“智能监盘+巡检机器人”自动汇总分析，值班人员只需做“最终决策”。这不是科幻片，而是正在发生的现实。火电正从“人海战术”走向“少人值守、机器巡检、智能决策”的新阶段，而机器人，正是这场变革的主角之一。 📈 前景广阔：为何是火电巡检机器人？ 1. 政策强力驱动国家发改委、国家能源局在《关于推进“人工智能+”能源高质量发展的实施意见》中，明确将“机器人”与“大模型”并列为火电智能运维的关键技术，要求加快推广应用。文件还设定了明确目标：到2027年，推动5个以上专业大模型在发电等行业深度应用；到2030年，能源领域AI技术总体达到世界领先水平。这意味着，火电机器人已从“可选项”变为“