介绍
Agent-Browser 是 Vercel 专为 AI Agent 设计的一个浏览器自动化 CLI 工具,能让它们模拟人类操作浏览器(点击、滚动、截图和填表单等),是对 Playwright 作为封装和优化,默认是无头模式操作浏览器。
agent-browser 及关联 Skill vs playwright-skill 综合信息表
| Skill(技能 / 工具) | 来源(获取 / 运行方式) | 核心功能 | 核心技术(底层实现) |
|---|---|---|---|
| agent-browser | npm install -g agent-browser | 通用浏览器自动化(CLI 版) | Playwright + 自有 CLI 封装 |
| dogfood | agent-browser 内置子 skill | QA 测试、探索性测试 | 基于 agent-browser 核心能力 |
| electron | agent-browser 内置子 skill | Electron 桌面应用测试 | 无额外标注(默认基于 agent-browser) |
| slack | agent-browser 内置子 skill | Slack 聊天工具自动化 | 无额外标注(默认基于 agent-browser) |
| playwright-skill | 本地 skill(自定义 / 内置) | 浏览器自动化测试 | 原生 Playwright(无额外封装) |
agent-browser vs playwright-skill 功能特性对比表
| 特性 | agent-browser | playwright-skill |
|---|---|---|
| 接口 | CLI 命令(如 agent-browser click @e1) | Playwright 多语言 API(Python/JS/Java 代码调用,如 page.click('#btn')) |
| 元素引用 | 快照生成 @e1, @e2 简化引用 | CSS/XPath/ 文本选择器(如 //div[@id="e1"]),支持精准定位 |
| 会话管理 | 内置 --session 参数一键管理 | 自定义代码实现(通过 context 上下文对象手动管理) |
| 状态保存 | 内置 state save/load 命令 | 手动调用 storage_state 方法序列化 / 反序列化状态 |
| 认证 | auth save/login 命令,加密存储凭证 | 手动处理 Cookie/Token,需结合加密库 / 环境变量存储 |
| iOS 模拟器 | 原生支持 | 无原生支持,需结合 BrowserStack/Appium 等工具 |
| 浏览器引擎 | Chrome, Lightpanda | Chrome、Firefox、Safari、Edge 等全主流引擎 |
| Diff 测试 | 内置 diff 命令一键执行 | 原生支持 / ,内置 像素级比对 |


