Agent-Browser：面向 AI 的浏览器自动化 CLI 工具指南

Agent-Browser 是 Vercel 专为 AI Agent 设计的一个浏览器自动化 CLI 工具，能让它们模拟人类操作浏览器（点击、滚动、截图和填表单等），是对 Playwright 作为封装和优化，默认是无头模式操作浏览器。

Skill（技能 / 工具）	来源（获取 / 运行方式）	核心功能	核心技术（底层实现）
agent-browser	npm install -g agent-browser	通用浏览器自动化（CLI 版）	Playwright + 自有 CLI 封装
dogfood	agent-browser 内置子 skill	QA 测试、探索性测试	基于 agent-browser 核心能力
electron	agent-browser 内置子 skill	Electron 桌面应用测试	无额外标注（默认基于 agent-browser）
slack	agent-browser 内置子 skill	Slack 聊天工具自动化	无额外标注（默认基于 agent-browser）
playwright-skill	本地 skill（自定义 / 内置）	浏览器自动化测试	原生 Playwright（无额外封装）

特性	agent-browser	playwright-skill
接口	CLI 命令（如 `agent-browser click @e1`）	Playwright 多语言 API（Python/JS/Java 代码调用，如 `page.click('#btn')`）
元素引用	快照生成 @e1, @e2 简化引用	CSS/XPath/ 文本选择器（如 `//div[@id="e1"]`），支持精准定位
会话管理	内置 `--session` 参数一键管理	自定义代码实现（通过 `context` 上下文对象手动管理）
状态保存	内置 `state save/load` 命令	手动调用 `storage_state` 方法序列化 / 反序列化状态
认证	`auth save/login` 命令，加密存储凭证	手动处理 Cookie/Token，需结合加密库 / 环境变量存储
iOS 模拟器	原生支持	无原生支持，需结合 BrowserStack/Appium 等工具
浏览器引擎	Chrome, Lightpanda	Chrome、Firefox、Safari、Edge 等全主流引擎
Diff 测试	内置 `diff` 命令一键执行	原生支持 / ，内置像素级比对

更多推荐文章