前段时间引起'SaaS 末日'惊呼的 Claude Cowork 专家插件(Plugins)系统吗?其背后的逻辑是 — 当 AI 助手可以通过插件接入各类企业应用,自动执行复杂任务,并在聊天框中生成交互式界面时,传统 SaaS 厚重的界面形态便显得可有可无。
而其中支撑'在对话框中运行交互式 UI 应用'的关键技术,已于上个月正式纳入 MCP 扩展规范,即 MCP Apps。这一由 OpenAI 与 Anthropic 等推动的开放标准,让传统对话式 AI 助手从'命令行'迈向'图形界面'时代。
1 认识 MCP Apps:价值、概念、场景、与 Web Apps 的区别
MCP 是为 LLM 对接外部数据和工具而设计的开放协议。MCP 扩展(Extensions)是在核心协议基础上增加的扩展功能规范,MCP Apps 就是 MCP 的官方扩展标准之一。
为什么需要 MCP Apps
如果用一句话总结,那就是:
尽管基础的 MCP 协议打通了外部的'数据管道',但在很多场景下,它还需要更友好、灵活的呈现与交互方式。
看一个具体的例子:
假设在你的 AI 助手客户端中新增一个功能:能够连接企业的 CRM 系统,统计上个季度的销售与订单数据。
以前的方式是:
开发一些 MCP Tool,调用 CRM API 查询数据,并将工具注册给 AI 助手。于是,LLM 可以借助这些工具获得数据,并按要求以合适的方式展示结果;用户通过反复的多轮对话来获得信息。

但这里可能存在的问题是:
- 单纯的 Markdown 表格或冗长文本,表现力十分有限
- 展示实时变化的'监控面板'或非文本媒体数据较为麻烦
- 探索性交互(如排序、点击查看详情)需要来回反复对话
- 多轮对话会造成上下文膨胀、污染与 token 消耗
这个问题就像:我们给电脑插上了连接外部资源的'管道'(通过 MCP 这个 USB 口),但却缺乏一个'可互动的高清显示器'来展示数据。
什么是 MCP Apps
MCP Apps 正是用 UI 交互来弥合这道鸿沟:
MCP Apps 允许 MCP Server 不再仅仅返回文本、代码或结构化数据,而是直接返回交互式的 HTML 前端界面。

比如:当用户要求'分析本季度销售数据'时,AI 不再回复一堆数字,而是在对话框中直接渲染出一个带有筛选器、折线图和钻取功能的交互式仪表盘(嵌入在 iframe 中)。用户可以直接浏览、操作、点击;数据也可以根据需要动态更新;甚至可以直接查看 PDF 等非文本内容。
这种自然顺畅的体验,使 AI 真正具备了替代传统 UI 软件的潜力。
具体而言,MCP Apps 定义了一套标准:
- MCP Server 中的工具可以声明关联的交互式 UI 资源
- 返回的交互式 UI 可内嵌渲染在客户端应用(如 AI 对话)中
- 支持嵌入 UI 与客户端应用之间的双向通信
或者说,用户仿佛在聊天里直接收到了一个可以操作的'小程序'。
MCP Apps 的核心应用场景
哪些场景适合用 MCP Apps 来增强 AI 助手的体验呢?
- 数据探索与可视化:如上文所述 — 销售分析工具返回一个交互式大屏。用户可以直接在 AI 生成的界面中按地区过滤、向下钻取客户详情,并导出报告,全程无需离开对话窗口。
- 配置向导与多步表单:很多业务场景需要分步骤填写信息,比如创建项目、发起审批等。在纯文本对话中,用户往往需要反复交互;而 MCP Apps 可以呈现具备交互逻辑的表单,简化流程。
- 富文本/文档的审查:例如 AI 合同分析工具可以在聊天框内直接展示高亮争议条款的 PDF 原文件。你可以点击界面上的'批准'或'标记'按钮,AI 模型会实时感知这些操作。



