Playwright 与 MCP AI 实现自动化浏览器操作指南
一、什么是 Playwright MCP 浏览器扩展?
它是连接 AI 大模型与真实浏览器环境的核心桥梁,解决了传统自动化工具需要频繁启动新浏览器的痛点。
核心作用
允许 AI '看见'浏览器内容,并模拟人类行为(点击、输入、滚动),无需每次启动全新的空白浏览器窗口,大幅提升效率。
最大亮点
通过配套的 Chrome/Edge 扩展插件,AI 可以直接接管当前已打开的网页,复用现有登录状态(Cookies、Session),无需重新登录即可操作 Gmail、Jira、企业后台等需要鉴权的网站,这是传统无头浏览器无法实现的关键优势。
二、核心功能与特性
| 功能点 | 核心能力 |
|---|---|
| 接管现有会话 | 安装插件后,AI 直接操作当前 Chrome/Edge 标签页,保留所有登录态与历史记录,无需重新初始化环境。 |
| 精准操作 | 支持点击(Click)、输入(Fill)、截图(Screenshot)、滚动(Scroll)、鼠标悬停(Hover)等全场景交互,覆盖日常浏览器操作。 |
| 智能感知 | 将网页结构转换为 AI 易读的 Accessibility Tree 格式,让 AI 精准理解页面布局与元素关系,避免定位错误。 |
| 双模运行 | 同时支持有头浏览器可视化操作和后台自动化,灵活适配不同场景。 |
三、运行原理
Playwright MCP 采用分层架构,确保 AI 与浏览器的稳定通信:
[AI 模型 (Claude/Cursor)] <-- 指令交互 --> [MCP Client (宿主应用)] <-- 本地通信 --> [MCP Server (本地服务)]
适用场景
- AI 辅助办公:让 AI 直接操作已登录的企业后台、邮件系统,自动处理审批、发送邮件。
- 自动化测试:复用现有浏览器会话,无需重复登录,提升测试效率。
- 数据采集:在已登录状态下采集需要鉴权的页面数据,避免验证码与登录限制。
四、安装与配置指南
前提条件
- 已安装 Chrome/Edge 浏览器(推荐版本 110+)
- 已安装支持 MCP 的 AI 客户端(如 Cursor、Claude Desktop 等)
- 已安装 Node.js 环境(用于运行 MCP Server)
第一步:安装浏览器插件
- 在 Chrome/Edge 扩展商店搜索
Playwright MCP Extension进行安装。 - 若无法访问商店,可手动加载解压后的扩展程序。
- 重启浏览器,确认插件图标出现在工具栏中。
第二步:配置 MCP 客户端
- 打开 MCP 客户端工具设置,找到 MCP 服务器配置项。
- 开启开发者模式,添加新的 MCP Server。
- 选择手动配置,输入以下 JSON 配置信息:
{
"mcpServers":

