JavaScriptNode.jsAI大前端

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

OpenClaw 的 browser 工具支持多种连接模式，包括内置浏览器、CDP 及扩展插件，使 AI 能像人一样点击、输入和截图。通过 navigate、snapshot 和 evaluate 组合，可绕过 API 直接抓取网页数据，如微博热搜或 B 站榜单。实战中需注意反爬机制、动态加载等待及登录态保持。调试时利用快照和截图定位问题，结合超时设置提升稳定性。适合需要复杂交互或无 API 接口的自动化场景。

草莓泡芙发布于 2026/4/10更新于 2026/7/2337 浏览

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

前言

在之前的实践中，我们探讨了自定义 Skill，核心在于 Prompt 模板的设计。但 Skill 只是告诉 AI'怎么做'，真正执行动作还需要 Tool。

今天重点介绍一个强大的 Tool：browser。它赋予 AI 像人一样操作浏览器的能力——点击、输入、截图、甚至执行 JS 脚本。

browser 工具概览

OpenClaw 的 browser 工具提供了多种连接模式，以适应不同场景：

1. 内置浏览器（默认）

OpenClaw 自带 Playwright 浏览器，AI 可直接调用，开箱即用。

功能	说明	示例
navigate	打开网页	访问百度、知乎
snapshot	获取页面快照	了解当前页面状态
screenshot	截图	保留证据
click	点击元素	登录、搜索、提交
type	输入文字	填表单、发评论
evaluate	执行 JS	提取数据、计算
select	下拉选择	选择日期、分类
hover	悬停	显示隐藏菜单

适合大多数日常场景。

2. CDP 模式（Chrome DevTools Protocol）

连接你已有的 Chrome 浏览器，通过调试端口控制。启动时加上调试端口即可：

# macOS
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222

# Windows
"C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222

# Linux
google-chrome --remote-debugging-port=9222

然后在 OpenClaw 配置中指定：

browser:
  remoteUrl: http://localhost:9222

优势：保持登录状态（Cookie、Session 持久化），不额外占用资源，支持多标签页。

3. 浏览器扩展插件模式

安装 OpenClaw 的 Chrome 扩展，可控制已打开的标签页，获取历史、书签，或在用户当前上下文中执行。适合需要「接管用户当前页面」的场景。

4. 远程浏览器服务

通过 CDP 协议连接远程服务器上的浏览器，适合服务器环境或需要更高隔离性的批量任务。

browser:

// 访问微博热搜
const result = await browser.navigate('https://weibo.com/hot')

// 获取快照了解页面结构
const page = await browser.snapshot()

// 提取热搜标题
const titles = await browser.evaluate(() => {
  return [...document.querySelectorAll('.hot-item .title')].map(el => el.innerText).slice(0, 10)
})

console.log(titles)

方式	优点	缺点
API 调用	速度快、代码简单、无反爬问题	依赖第三方服务、可能有频率限制
浏览器自动化	数据完整、可获取任意页面、无需 API Key	速度较慢、需处理反爬、占用资源

---
name: weibo_hot_browser
description: 获取微博热搜榜单，了解最新热点话题（浏览器方式）
---
# 微博热搜查询（browser 版）

## 什么时候触发
- 用户问 "微博热搜"
- 用户说 "今天有什么热点"
- 用户说 "帮我看看微博"

## 如何执行

### 访问微博热搜
使用 `browser.navigate` 打开：
```text
https://s.weibo.com/top/summary

const items = document.querySelectorAll('.c-table tbody tr')
return [...items].slice(0, 15).map(item => {
  const rank = item.querySelector('.td-01').innerText
  const title = item.querySelector('.td-02 a').innerText
  const hot = item.querySelector('.td-02 span')?.innerText || ''
  return `${rank}. ${title}${hot}`
})


测试时，用户输入'帮我看看微博热搜'，AI 将依次执行导航、快照、JS 评估并输出结果。

## 进阶：多步骤自动化

browser 工具的真正威力在于**多步骤串联**。

### 案例：自动登录知乎

```yaml
---
name: zhihu_login
description: 自动登录知乎（需要提供账号密码）
---
# 知乎自动登录

## 触发场景
用户说 "帮我登录知乎"、"登录我的知乎账号"

## 执行步骤

### 打开知乎登录页
```javascript
await browser.navigate('https://www.zhihu.com/signin')
await browser.snapshot()

await browser.click('[name="username"]')
await browser.type('[name="username"]', '你的手机号')

await browser.click('.SignFlow-tab')
await browser.click('.SignFlow-sendInput-button')

// 用户手动输入验证码后
await browser.click('.SignFlow-submitButton')
await browser.snapshot()
// 验证是否登录成功

---
name: bilibili_trend
description: 获取 B 站热门视频排行榜
---
# B 站热门榜查询

## 触发场景
- 用户问 "B 站热门"
- 用户说 "今天 B 站什么视频火"
- 用户说 "帮我看看哔哩哔哩排行榜"

## 执行步骤

### 访问 B 站排行榜
```javascript
await browser.navigate('https://www.bilibili.com/v/popular/rank/all')
await browser.snapshot()

const videos = await browser.evaluate(() => {
  return [...document.querySelectorAll('.video-item')].slice(0, 20).map(item => {
    const title = item.querySelector('.title').innerText
    const author = item.querySelector('.author').innerText
    const play = item.querySelector('.play').innerText
    const like = item.querySelector('.like').innerText
    return { title, author, play, like }
  })
})

// 保存为 JSON
const fs = require('fs')
const data = {
  date: new Date().toISOString(),
  platform: 'bilibili',
  videos: videos
}
fs.writeFileSync('/tmp/bilibili-trend.json', JSON.stringify(data, null, 2))

// 获取当前页面所有可交互元素
const snapshot = await browser.snapshot()
console.log(JSON.stringify(snapshot, null, 2))

// 在关键步骤截图
await browser.screenshot({ path: '/tmp/step1.png' })

// 出现问题时截图
try {
  await browser.click('.login-button')
} catch (e) {
  await browser.screenshot({ path: '/tmp/error.png' })
  throw e
}

// 等待元素出现（最多等 10 秒）
await browser.waitForSelector('.hot-list', { timeout: 10000 })

// 等待页面加载完成
await browser.waitForLoadState('networkidle')

// 等待某个条件
await browser.waitForFunction(() => {
  return document.querySelectorAll('.item').length > 0
})

await browser.navigate('https://example.com', {
  waitUntil: 'networkidle',
  timeout: 30000 // 30 秒超时
})

await browser.click('text=登录') // 用文本选择器
await browser.click('[aria-label="搜索"]') // 用 aria 属性

await browser.extra.setExtraHTTPHeaders({
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64) ...'
})

// 保存
await browser.contexts[0].storageState({ path: '/tmp/zhihu-state.json' })
// 恢复
await browser.newContext({ storageState: '/tmp/zhihu-state.json' })

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

前言

browser 工具概览

1. 内置浏览器（默认）

2. CDP 模式（Chrome DevTools Protocol）

3. 浏览器扩展插件模式

4. 远程浏览器服务

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

OpenClaw 浏览器自动化实战：让 AI 模拟人类操作网页

前言

browser 工具概览

1. 内置浏览器（默认）

2. CDP 模式（Chrome DevTools Protocol）

3. 浏览器扩展插件模式

4. 远程浏览器服务

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

快速上手：不依赖 API 的数据抓取

实战：自动获取微博热搜

方案对比

编写 Skill

等待页面加载

提取数据

格式化输出

输入用户名

点击获取验证码

等待用户输入验证码

完成登录

进阶：数据提取与保存

案例：定期抓取 B 站热门视频

等待内容加载

提取数据

格式化输出

保存数据（可选）

调试技巧

查看页面快照

截图 Debug

等待技巧

常见问题

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具