AI 也能操控浏览器了?OpenClaw Browser Relay 接入指南

AI 也能操控浏览器了?OpenClaw Browser Relay 接入指南

目录


为什么需要 Browser Relay?

兄弟姐妹们,有没有这些痛点:

😭 想自动化操作浏览器,但工具配置复杂、代码一大串还容易报错
😭 页面稍微变一下,脚本就失效,维护到头秃
😭 遇到登录态、Cookie、JavaScript 渲染的页面,直接歇菜

好消息来了! 🎉

OpenClaw Browser Relay 直接用 AI 控制浏览器!不用记 API、不用写复杂脚本,只要会说话(打字)就行!从此以后:

从此以后:

✅ “帮我去某某网站查个数据” —— AI 自动打开浏览器、登录、查询、返回结果
✅ “把这个表单填了” —— AI 自动识别表单字段、填写、提交
✅ “截个图” —— AI 秒开浏览器、访问网址、截图、发给你
✅ “点页面上那个蓝色按钮” —— AI 视觉识别 + 点击,一气呵成

一句话:让浏览器听你的话,像聊天一样简单。别废话了,开干!💪


浏览器模式

OpenClaw 提供了三种浏览器控制模式,每种对应不同的使用场景,这里只介绍Extension Relay模式。

扩展中继模式(Extension Relay)

适用场景

  • ✅ 需要访问已登录的网站(Gmail、飞书、企业后台)
  • ✅ 想复用浏览器的 Cookie 和 Session
  • ✅ 临时性、轻量级的自动化任务

工作原理
在你现有的 Chrome 浏览器上安装一个扩展程序,这个扩展会通过 WebSocket 连接到 OpenClaw 网关。当 AI 需要操作浏览器时,命令通过网关→扩展→浏览器的链路执行。

优点

  • 🎯 直接使用你的登录状态(不用重新登录)
  • 🎯 和你自己的浏览器共享配置(代理、插件等)
  • 🎯 轻量级,不需要启动额外的浏览器实例

缺点

  • ⚠️ 安全性较低(AI 理论上能访问你所有标签页)
  • ⚠️ 依赖扩展稳定性(扩展挂了就得重装)
  • ⚠️ 高级功能受限(截图、ARIA 快照需要额外配置)

配置方法

  1. 安装扩展:
openclaw browser extension install
  1. 获取扩展路径:
openclaw browser extension path 
  1. 在 Chrome 中加载:
    • 打开 chrome://extensions
    • 启用"开发者模式"
    • 选择上面命令输出的路径
  2. 配置扩展:
    • 点击扩展图标
    • 输入端口:18789,没有修改的话默认就是这个
    • 在下面输入token,下面显示绿色的一行表示成功

找到下面下图的token,cat ~/.openclaw/openclaw.json

在这里插入图片描述

点击"加载已解压的扩展程序"

在这里插入图片描述
在这里插入图片描述

使用
要先打开谷歌浏览器,开一个标签,点击下地址栏右边图标,会有个on显示在图标上(如果是个感叹号,说明没有配置对)。此时则可以使用openclaw操作谷歌浏览器了。

在这里插入图片描述

踩坑记录

1.在配置插件的时候会遇到连接不上,或者能够打开浏览器但是不能控制网页,执行openclaw gateway status有如下错误:

gateway connect failed: Error: pairing required ◇ Error: gateway closed (1008): pairing required Gateway target: ws://127.0.0.1:18789 Source: local loopback Config: /home/user/.openclaw/openclaw.json Bind: loopback 

解决方法

OpenClaw 采用了类似蓝牙的配对机制。为了防止你电脑上的恶意软件通过 127.0.0.1:18789 偷偷控制你的浏览器并窃取数据(如 Cookie 或登录状态),OpenClaw 要求每一个试图连接网关的客户端(包括 CLI 本身)都必须经过一次显式的配对授权。

openclaw gateway stop 

删除旧的身份限制文件

rm -rf ~/.openclaw/identity/ ~/.openclaw/devices/ openclaw gateway start 

重新进行配对(此时会授予默认权限):
openclaw browser --browser-profile chrome tabs


实战案例:AI 帮你干活

光说不练假把式,来看几个真实的使用场景!

案例一:自动查资料 + 总结

需求:去知乎搜索"人工智能",总结热门观点

对你的 AI助手说:

帮我去知乎搜索"人工智能",总结一下热门文章的核心观点 

AI 自动执行:

  1. 打开知乎
  2. 输入搜索词
  3. 浏览搜索结果
  4. 提取文章内容
  5. 生成总结报告

耗时:从 30-60 分钟降到 2-3 分钟

实际命令流(AI 内部执行):

openclaw browser open https://www.zhihu.com openclaw browser type e5 "人工智能"# 搜索框# e5 = 从快照中识别的搜索框元素引用 openclaw browser click e8 # 搜索按钮 openclaw browser snapshot openclaw browser text # 提取页面文本# AI 分析并生成总结

觉得有用?点个赞 + 收藏支持下!💖 关注我,获取更多 AI 实战干货!🚀

Read more

GitHub Copilot AI 编程超全使用教程,从入门到精通

GitHub Copilot AI 编程超全使用教程,从入门到精通

前言 作为 GitHub 推出的 AI 编程助手,GitHub Copilot 凭借强大的代码补全、自然语言交互、自动化开发等能力,成为了开发者提升编码效率的 “神器”。它能支持主流 IDE(VS Code、IntelliJ IDEA、Eclipse 等)、终端等多环境,还可自定义配置、切换 AI 模型,适配个人和团队的不同开发需求。本文结合 GitHub 官方文档和实际使用经验,用通俗易懂的方式讲解 Copilot 的完整使用方法,从环境搭建到高级技巧,再到故障排除,一站式搞定 Copilot AI 编程! 一、GitHub Copilot 核心能力一览 在开始使用前,先快速了解 Copilot 的核心功能,清楚它能帮我们解决哪些开发问题: 1. 智能代码补全:

GitHub Copilot提示词终极攻略:从“能用”到“精通”的AI编程艺术

摘要:GitHub Copilot作为当前最强大的AI编程助手,其真正的价值不仅在于自动补全代码,更在于开发者如何通过精准的提示词工程与之高效协作。本文系统解析Copilot提示词的核心原理、设计框架与实战技巧,涵盖从基础使用到高级功能的完整知识体系。通过四要素框架、WRAP法则、多场景应用指南,结合表格、流程图等可视化工具,帮助开发者掌握与AI协作的编程范式,提升300%以上的开发效率。文章深度结合当今AI技术发展趋势,提供理论性、可操作性、指导性并存的全面攻略。 关键词:GitHub Copilot、提示词工程、AI编程、代码生成、开发效率、人机协作 🌟 引言:当编程遇见AI,一场思维范式的革命 “写代码就像与一位天才但有点固执的同事合作——你需要用它能理解的语言,清晰地表达你的意图。”这是我在深度使用GitHub Copilot六个月后的最大感悟。 2023年以来,AI编程助手从概念验证走向生产力工具的核心转变,标志着一个新时代的到来。GitHub Copilot不再仅仅是“自动补全工具”,而是具备问答、编辑、自动执行能力的AI开发伙伴。然而,许多开发者仍停留在基础使

千里聆RPA数据采集机器人:AI+自动化如何颠覆传统采集?

千里聆RPA数据采集机器人:AI+自动化如何颠覆传统采集?

一份新债研报要花3天时间收集资料,其中数据收集就占了大半时间,某头部券商固收研究员的抱怨揭示了这个行业效率瓶颈的本质。 如今,解决这个问题的答案正在改写:人工智能与自动化技术融合下的RPA数据采集机器人,仅需数秒即可完成原先需要数小时甚至数天的数据抓取任务,智能化的数据采集机器人正在重塑企业获取和处理信息的方式。 01 效率枷锁:传统数据采集的困境 曾经的数据采集工作如同一场没有尽头的马拉松。在金融领域,固收研究需要覆盖上交所、银行间市场等至少12个核心数据源,抓取募集说明书、财报等20余类资料。 “人工操作不仅耗时,更存在数据重复、遗漏等隐患。”一位业内人士表示。单只新债信息收集就需要5小时,而解析10万字募集说明书的人工准确率仅82%。 在招投标领域,需要同时监控国家级网站、聚合类平台以及不同行业的招标网站,每个招标文件的内容和格式都不尽相同。企业需要快速响应招标要求,抓住商业机会,但人工处理的方式显然无法满足这一需求。 02 技术突破:AI+RPA双引擎驱动 RPA技术通过模拟人类操作,实现跨系统的数据采集与处理,而人工智能则赋予这些机器人理解和决策的能力。这种

WIN11必备!QTTabBar中文优化版保姆级安装教程(含常见问题解决)

WIN11效率革命:深度定制你的资源管理器,不止于多标签 如果你和我一样,每天要在Windows的资源管理器里花费大量时间,那你一定对那种反复在层层文件夹中穿梭、找不到上一个窗口的体验深恶痛绝。系统自带的文件管理工具,就像一个功能简陋的毛坯房,勉强能用,但毫无效率与舒适度可言。尤其是升级到WIN11后,虽然界面更现代,但核心的文件管理逻辑依然停留在上个时代,对于追求效率的用户来说,这无疑是一种巨大的生产力损耗。 这篇文章,就是为那些不愿忍受现状,但又不想投入过多精力去学习复杂新软件的WIN10/WIN11用户准备的。我们不讨论那些需要彻底改变操作习惯的“重型”第三方管理器,而是聚焦于一种更优雅、更无感的解决方案:增强你正在使用的资源管理器本身。今天的主角,是一个经过国内开发者精心“魔改”的经典工具——QTTabBar的中文优化版。它就像给你的文件管理器做了一次精装修,保留了熟悉的格局,却赋予了它全新的、高效的能力。接下来,我将带你从零开始,完成这次效率升级,并深入探讨如何根据你的习惯,将它调校成最趁手的工具。 1. 为什么选择增强,而非替换? 在深入安装细节之前,我们有必要先