OpenClaw 驱动的 AI 网页自动化操作实践
在 AI 智能体(Agent)爆发的今天,让 AI 像人一样操作浏览器已不再是科幻。开源项目 OpenClaw 通过 Browser Relay 插件实现了 AI 对真实浏览器的接管。
本文介绍如何配置这套系统,并探讨它在实际应用中的优势与边界。
核心配置:打通 AI 与浏览器的隧道
OpenClaw 的强大之处在于它不直接发送网络请求,而是通过 CDP 协议接管你的真实浏览器。
1. 配置文件 (openclaw.json)
在源码安装模式下,关键配置位于 ~/.openclaw/openclaw.json。环境配置示例如下:
- 端口 (Port):
18789(注意:非默认的 18792,需手动对齐) - 认证 (Token):
[AUTH_TOKEN](在gateway.auth下获取)
2. 插件连接
安装 OpenClaw Browser Relay 后,填入上述 Token 和地址 (http://127.0.0.1:18789)。
注意事项:连接成功后,浏览器顶部会出现'正在调试此浏览器'的黄色警告。这是正常现象,说明 AI 已接管控制权,请勿点击取消。
实战:微博数据自动化整理
需求描述:
登录微博账号后,自动访问指定博主主页,将近 3 个月的微博分别保存为独立的 Markdown 文档,以标题命名,重复的跳过。
核心 Prompt 示例:
"请操作已登录的浏览器:访问 https://weibo.com/u/2534815875;滚动页面,提取近 3 个月的微博内容;每篇微博生成一个 .md 文件,包含标题和正文;文件名设为微博标题,若已存在则跳过。"
深度思考:OpenClaw 的优势与局限
通过这次实测,总结了以下几点:
优势
- 自带身份证明:由于是直接复用浏览器 Session,无需处理复杂的登录、Cookie 或验证码,只要浏览器里登录了,AI 就能操作。
- 理解非结构化数据:传统的爬虫需要写复杂的正则表达式或 XPath。OpenClaw 配合大模型(如 Kimi K2.5),能直接理解什么是标题、什么是内容,即使页面结构经常变。
局限
OpenClaw 不适合抓取海量数据。原因如下:
- 性能开销:它是模拟真人行为,包括渲染页面、模拟滚动、视觉解析。这比纯协议爬虫慢得多,且极其消耗 CPU 和内存。
- 上下文长度限制:大模型处理长网页时,如果数据量过大,可能会超出模型的 Context Window(上下文窗口),导致遗漏。
- 风控风险:虽然模拟真人,但如果短时间内频繁翻页,仍可能触发平台的频率限制。
结论:OpenClaw 是处理高价值、低频率、复杂交互任务的神器(如周报整理、竞品监控),但如果你想抓取全站数据,传统的 Scrapy 或 Go-Colly 仍然是更好的选择。
总结
OpenClaw 降低了浏览器自动化的门槛,让所见即所得的数据处理成为可能。它更像是一个懂业务的数字助理,而不是一台高效的抽水机。




