WebMCP：浏览器原生 AI 交互新范式 | 极客日志

JavaScriptAI大前端

WebMCP：浏览器原生 AI 交互新范式

WebMCP 是 Google 与 Microsoft 联合推动的浏览器原生 Web API，旨在让网页主动封装能力供 AI Agent 直接调用。相比视觉识别或 DOM 解析，它通过语义化工具契约显著降低 Token 消耗并提升稳定性。接入支持声明式 HTML 属性与命令式 JS 注册两种方式，强调动作化暴露与强约束输入。实施时需遵循最小权限原则，优先在可控内部系统试点只读工具，逐步扩展至核心流程，兼顾安全审计与用户体验。

雾岛听风发布于 2026/3/23更新于 2026/7/2134 浏览

WebMCP 是什么

基本定义

WebMCP（Web Model Context Protocol）是 Google 与 Microsoft 在 W3C 框架下联合推动的浏览器原生 Web API。Chrome 146 已推出早期预览版本，核心目标是让网页主动将自身能力封装为结构化工具，供 AI Agent 直接调用，解决当前 Agent 操作网页的稳定性与效率问题。

核心思想

把交互从 UI 层搬到语义层。不再依赖按钮点击、坐标定位或 DOM 解析，而是让网页直接暴露'提交请假'、'搜索航班'、'加入购物车'等业务动作，形成结构化工具契约，Agent 按契约调用而非'猜 UI'。

关键特性

双轨 API 设计：声明式 API（HTML 表单属性）+ 命令式 API（JavaScript 注册），兼顾易用性与灵活性
浏览器内运行：纯客户端实现，网页本身就是'工具服务器'，天然继承用户登录态与权限上下文
结构化上下文：支持网页提供 JSON 格式的业务状态（如购物车、表单草稿），大幅降低模型理解成本
工具契约化：每个工具包含名称、描述、输入输出 Schema、执行逻辑，变更可控

解决的核心痛点

当前 Agent 操作网页的两大路线均存在缺陷：

交互路线	核心问题	WebMCP 解决方案
视觉路线（截图识别）	慢、贵（约 2000 token/次）、易出错	语义化工具调用，Token 消耗减少约 89%
DOM/选择器路线	脆弱（改版即失效）、复杂场景难处理	工具契约不变则不受 UI 变更影响

WebMCP 让 Agent 从'呈现层倒推业务动作'转变为'直接调用业务动作'，稳定性与效率显著提升。

与 Anthropic MCP 的区别

WebMCP 与 Anthropic MCP（Model Context Protocol）虽同名，但架构完全不同，聚焦领域互补，成熟应用可同时部署。

对比维度	Anthropic MCP	WebMCP
协议基础	JSON-RPC 2.0	非 JSON-RPC，纯 Web 原生 API
架构模式	Client-Server（需后端服务器）	纯客户端（网页即'服务器'）
运行位置	后端独立服务	浏览器前端环境
认证机制	OAuth 2.1	浏览器原有认证（Cookie、Session）
可用性	服务器常驻运行	用户导航到页面时才可用
聚焦场景	后端服务集成、跨系统数据访问	前端浏览器交互、网页功能调用
核心优势	统一后端集成标准	天然复用浏览器上下文、低接入成本

关键结论：Anthropic MCP 解决'AI 如何连接后端服务'，WebMCP 解决'AI 如何操作前端网页'，二者相辅相成，非竞争关系。

项目中如何接入 WebMCP

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online

<!-- 示例：请假申请表单 -->
<form toolname="submitLeaveRequest" tooldescription="Submit a leave request with date and reason">
  <input name="date" type="date" required toolhint="Leave date in YYYY-MM-DD format">
  <input name="reason" type="text" minlength="2" maxlength="200" required>
  <button type="submit">提交申请</button>
</form>

// 示例：注册"提交请假"工具
navigator.modelContext.registerTool({
  name: "submitLeaveRequest",
  description: "Submit a leave request in the current OA session",
  inputSchema: {
    type: "object",
    properties: {
      date: { type: "string", pattern: "^\\d{4}-\\d{2}-\\d{2}$" },
      reason: { type: "string", minLength: 2, maxLength: 200 }
    },
    required: ["date", "reason"]
  },
  outputSchema: { type: "string", description: "Result message" },
  annotations: { readOnlyHint: "false" }, // 非只读，需用户确认
  async execute({ date, reason }) {
    // 复用现有业务逻辑
    const result = await window.oa.leave.submit({ date, reason });
    return {
      content: [{ type: "text", text: result.message }]
    };
  }
});

// 示例：提供购物车上下文
navigator.modelContext.provideContext({
  name: "cart",
  description: "Current shopping cart snapshot",
  data: {
    items: [{ sku: "SKU-001", qty: 2, name: "无线鼠标" }],
    total: 199.0,
    currency: "CNY"
  }
});

WebMCP：浏览器原生 AI 交互新范式

WebMCP 是什么

基本定义

核心思想

关键特性

解决的核心痛点

与 Anthropic MCP 的区别

项目中如何接入 WebMCP

更多推荐文章

相关免费在线工具

接入准备

两种接入方式（从易到难）

方式一：声明式 API（零 JS 代码）

方式二：命令式 API（JavaScript 注册）

方式三：上下文提供（增强 Agent 理解）

生产级接入最佳实践

3.1 工具设计原则

3.2 落地步骤（低风险到高风险）

3.3 配套设施

WebMCP 的风险与安全防护

核心风险点

1.1 安全风险

1.2 工程风险

安全防护建议

2.1 基础安全措施

2.2 企业级安全治理

风险权衡与使用边界

总结与未来展望

更多推荐文章

相关免费在线工具

WebMCP：浏览器原生 AI 交互新范式

WebMCP 是什么

基本定义

核心思想

关键特性

解决的核心痛点

与 Anthropic MCP 的区别

项目中如何接入 WebMCP

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

接入准备

两种接入方式（从易到难）

方式一：声明式 API（零 JS 代码）

方式二：命令式 API（JavaScript 注册）

方式三：上下文提供（增强 Agent 理解）

生产级接入最佳实践

3.1 工具设计原则

3.2 落地步骤（低风险到高风险）

3.3 配套设施

WebMCP 的风险与安全防护

核心风险点

1.1 安全风险

1.2 工程风险

安全防护建议

2.1 基础安全措施

2.2 企业级安全治理

风险权衡与使用边界

总结与未来展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具