WebMCP：浏览器原生 AI 交互新范式 | 极客日志

JavaScriptSaaSAI大前端

WebMCP：浏览器原生 AI 交互新范式

WebMCP 是 Google 与 Microsoft 推动的浏览器原生协议，旨在让网页直接暴露业务动作供 AI Agent 调用。相比视觉识别或 DOM 解析，它通过语义化工具契约提升效率与稳定性。文章对比了其与 Anthropic MCP 的差异，详解了声明式与命令式接入方式，并强调了安全治理与风险控制。适用于内部系统、标准化流程等可控场景，是 AI 与 Web 交互的重要演进方向。

深海蔚蓝发布于 2026/4/7更新于 2026/7/2037 浏览

WebMCP：浏览器原生 AI 交互新范式

什么是 WebMCP

WebMCP（Web Model Context Protocol）是 Google 与 Microsoft 在 W3C 框架下联合推动的浏览器原生 Web API。Chrome 146 已推出早期预览版本，其核心目标是让网页主动将自身能力封装为结构化工具，供 AI Agent 直接调用，从而解决当前 Agent 操作网页时的稳定性与效率问题。

核心思路

把交互从 UI 层搬到语义层。不再依赖按钮点击、坐标定位或 DOM 解析，而是让网页直接暴露'提交请假'、'搜索航班'、'加入购物车'等业务动作，形成结构化工具契约。Agent 按契约调用而非'猜 UI'，这大幅提升了交互的确定性。

关键特性

双轨 API 设计：声明式 API（HTML 表单属性）+ 命令式 API（JavaScript 注册），兼顾易用性与灵活性。
浏览器内运行：纯客户端实现，网页本身就是'工具服务器'，天然继承用户登录态与权限上下文。
结构化上下文：支持网页提供 JSON 格式的业务状态（如购物车、表单草稿），大幅降低模型理解成本。
工具契约化：每个工具包含名称、描述、输入输出 Schema、执行逻辑，变更可控。

解决的核心痛点

当前 Agent 操作网页主要有两条路线，但都存在缺陷：

交互路线	核心问题	WebMCP 解决方案
视觉路线（截图识别）	慢、贵（约 2000 token/次）、易出错	语义化工具调用，Token 消耗减少约 89%
DOM/选择器路线	脆弱（改版即失效）、复杂场景难处理	工具契约不变则不受 UI 变更影响

WebMCP 让 Agent 从'呈现层倒推业务动作'转变为'直接调用业务动作'，稳定性与效率显著提升。

与 Anthropic MCP 的区别

WebMCP 与 Anthropic MCP（Model Context Protocol）虽同名，但架构完全不同，聚焦领域互补，成熟应用可同时部署。

对比维度	Anthropic MCP	WebMCP
协议基础	JSON-RPC 2.0	非 JSON-RPC，纯 Web 原生 API
架构模式	Client-Server（需后端服务器）	纯客户端（网页即'服务器'）
运行位置	后端独立服务	浏览器前端环境
认证机制	OAuth 2.1	浏览器原有认证（Cookie、Session）
可用性	服务器常驻运行	用户导航到页面时才可用
聚焦场景	后端服务集成、跨系统数据访问	前端浏览器交互、网页功能调用
核心优势	统一后端集成标准	天然复用浏览器上下文、低接入成本

关键结论：Anthropic MCP 解决'AI 如何连接后端服务'，WebMCP 解决'AI 如何操作前端网页'，二者相辅相成，非竞争关系。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online

<!-- 示例：请假申请表单 -->
<form toolname="submitLeaveRequest" tooldescription="Submit a leave request with date and reason">
  <input name="date" type="date" required toolhint="Leave date in YYYY-MM-DD format">
  <input name="reason" type="text" minlength="2" maxlength="200" required>
  <button type="submit">提交申请</button>
</form>

// 示例：注册'提交请假'工具
navigator.modelContext.registerTool({
  name: "submitLeaveRequest",
  description: "Submit a leave request in the current OA session",
  inputSchema: {
    type: "object",
    properties: {
      date: { type: "string", pattern: "^\\d{4}-\\d{2}-\\d{2}$" },
      reason: { type: "string", minLength: 2, maxLength: 200 }
    },
    required: ["date", "reason"]
  },
  outputSchema: { type: "string", description: "Result message" },
  annotations: { readOnlyHint: "false" }, // 非只读，需用户确认
  async execute({ date, reason }) {
    // 复用现有业务逻辑
    const result = await window.oa.leave.submit({ date, reason });
    return {
      content: [{ type: "text", text: result.message }]
    };
  }
});

// 示例：提供购物车上下文
navigator.modelContext.provideContext({
  name: "cart",
  description: "Current shopping cart snapshot",
  data: {
    items: [
      { sku: "SKU-001", qty: 2, name: "无线鼠标" }
    ],
    total: 199.0,
    currency: "CNY"
  }
});

WebMCP：浏览器原生 AI 交互新范式

WebMCP：浏览器原生 AI 交互新范式

什么是 WebMCP

核心思路

关键特性

解决的核心痛点

与 Anthropic MCP 的区别

更多推荐文章

相关免费在线工具

项目中如何接入 WebMCP

接入准备

两种接入方式

方式一：声明式 API（零 JS 代码）

方式二：命令式 API（JavaScript 注册）

方式三：上下文提供（增强 Agent 理解）

生产级接入最佳实践

工具设计原则

落地步骤（低风险到高风险）

配套设施

WebMCP 的风险与安全防护

核心风险点

安全风险

工程风险

安全防护建议

基础安全措施

企业级安全治理

风险权衡与使用边界

总结与未来展望

参考资料

更多推荐文章

相关免费在线工具

WebMCP：浏览器原生 AI 交互新范式

WebMCP：浏览器原生 AI 交互新范式

什么是 WebMCP

核心思路

关键特性

解决的核心痛点

与 Anthropic MCP 的区别

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

项目中如何接入 WebMCP

接入准备

两种接入方式

方式一：声明式 API（零 JS 代码）

方式二：命令式 API（JavaScript 注册）

方式三：上下文提供（增强 Agent 理解）

生产级接入最佳实践

工具设计原则

落地步骤（低风险到高风险）

配套设施

WebMCP 的风险与安全防护

核心风险点

安全风险

工程风险

安全防护建议

基础安全措施

企业级安全治理

风险权衡与使用边界

总结与未来展望

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具