OpenClaw 浏览器控制终极方案 - 让 AI 助手随时控制你的浏览器:

OpenClaw 浏览器控制终极方案 - 让 AI 助手随时控制你的浏览器:
🚀 懒人版:你可能都不用看这篇文章

直接把这篇文章发给 Claude Code,让它帮你执行就行了。它会:创建一个 Chrome Debug 浏览器实例配置好所有参数

然后去 OpenClaw 的 bot 里告诉它:

"更新下身份信息:当前你需要去查询信息资料、联网之类的,优先使用已经可以打开的可调试浏览器实例去控制打开搜索等。比如:

使用 --browser-profile mydebug 来控制已打开的浏览器实例。"

搞定!🎉
在这里插入图片描述

一个被忽视的痛点

你有没有遇到过这样的场景:

你让 AI 助手帮你搜索信息,它打开了一个全新的浏览器窗口。

然后你发现:

  • 推特要重新登录
  • GitHub 要重新登录
  • Google 要重新登录
  • 甚至有些网站直接把你当成机器人,拒绝访问

为什么?

因为 AI 助手用的是一个"干净"的浏览器环境,没有任何登录状态,没有任何 Cookies,没有任何浏览历史。

对于网站来说,这就是一个"可疑账号"。

另一个痛点:手动操作

如果你用过 OpenClaw 的 Chrome 插件,你会发现另一个问题:

每次都要手动点插件图标,AI 才能连接到浏览器。

更糟糕的是:

  • OpenClaw 重启后,需要重新点击
  • 切换标签页后,可能需要重新点击
  • 有时候点了也不生效,需要刷新页面

这不是自动化,这是"半自动化"。

我们想要什么?

理想的 AI 浏览器控制应该是这样的:

  1. 保留登录状态:AI 打开推特,直接就是登录状态,不需要重新输入密码
  2. 无需手动操作:AI 想控制浏览器,直接连接,不需要点任何东西
  3. 重启无忧:OpenClaw 重启后,自动重连,不需要任何配置
  4. 不被风控:网站看到的是你真实的浏览器指纹,不会把你当成机器人

这可能吗?

可能。而且很简单。

解决方案:Chrome Debug 模式

核心思路很简单:

让 Chrome 启动时自带远程调试端口,同时使用一个复制了登录信息的独立数据目录。

为什么不直接用默认的 Chrome?

Chrome 有个安全限制:不允许在默认数据目录上开启远程调试。

这是为了安全考虑。如果你的默认 Chrome 开启了调试端口,任何本地程序都可以控制你的浏览器,读取你的密码、Cookies、浏览历史。

所以我们需要:

  1. 创建一个新的 Chrome 数据目录
  2. 把登录相关的文件(Cookies、Login Data 等)复制过去
  3. 用这个新目录启动 Chrome,同时开启调试端口

这样就能:

  • ✅ 保留登录状态(推特、GitHub 等都不用重新登录)
  • ✅ AI 可以随时连接,不需要点任何东西
  • ✅ 重启 OpenClaw 后自动重连
  • ✅ 不会被风控(使用的是你真实的浏览器指纹)

配置步骤(5 分钟搞定)

第一步:创建 Chrome 数据目录并复制登录信息

# 创建新的数据目录mkdir -p "$HOME/Library/Application Support/Google/Chrome-Debug/Default"# 复制关键登录文件cd"$HOME/Library/Application Support/Google/Chrome/Default"cp Cookies "Login Data""Web Data" Preferences "Secure Preferences"\"$HOME/Library/Application Support/Google/Chrome-Debug/Default/"# 复制 Local Statecp"$HOME/Library/Application Support/Google/Chrome/Local State"\"$HOME/Library/Application Support/Google/Chrome-Debug/"

这一步做了什么?

  • Cookies:保存了所有网站的登录状态
  • Login Data:保存了密码(如果你开启了密码保存)
  • Web Data:保存了表单自动填充数据
  • PreferencesSecure Preferences:保存了浏览器设置
  • Local State:保存了全局配置

复制这些文件后,新的 Chrome 就会"继承"你的登录状态。

第二步:创建 Chrome Debug 启动器

# 创建 App 结构mkdir -p "/Applications/Chrome Debug.app/Contents/MacOS"# 创建启动脚本cat>"/Applications/Chrome Debug.app/Contents/MacOS/Chrome Debug"<<'EOF' #!/usr/bin/env bash exec arch -arm64 "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \ --remote-debugging-port=9222 \ --user-data-dir="$HOME/Library/Application Support/Google/Chrome-Debug" \ "$@" EOF# 添加执行权限chmod +x "/Applications/Chrome Debug.app/Contents/MacOS/Chrome Debug"

这一步做了什么?

创建了一个新的 Chrome 启动器,它会:

  • 使用独立的数据目录(Chrome-Debug
  • 开启远程调试端口(9222
  • 使用 ARM64 架构(如果你是 M1/M2/M3 Mac)

第三步:配置 OpenClaw

~/.openclaw/config.json 中添加浏览器配置:

{"browser":{"profiles":{"mydebug":{"cdpUrl":"http://127.0.0.1:9222","color":"#00AA00"}}}}

这一步做了什么?

告诉 OpenClaw:

  • 有一个名叫 mydebug 的浏览器配置
  • 它的调试端口是 http://127.0.0.1:9222
  • 用绿色标记(可选)

使用方法

1. 启动浏览器

open"/Applications/Chrome Debug.app"

或者直接在 Finder 中双击 Chrome Debug.app

2. 验证连接

curl -s http://127.0.0.1:9222/json/version 

如果返回一堆 JSON 数据,说明连接成功。

3. OpenClaw 控制浏览器

# 查看所有标签页 openclaw browser --browser-profile mydebug tabs # 打开网页 openclaw browser --browser-profile mydebug open"https://x.com"# 截图 openclaw browser --browser-profile mydebug screenshot # 执行操作(点击、输入等) openclaw browser --browser-profile mydebug act 

4. 在对话中使用

当你和 OpenClaw 对话时,它会自动使用 mydebug 配置:

你: “帮我搜索一下 GPT-5.3 Codex 的最新讨论”

OpenClaw: (自动打开 Chrome Debug,访问 X.com,搜索,截图,分析)

关键是:整个过程不需要你点任何东西。

效果对比

之前(使用插件)

  1. 你:帮我搜索 XXX
  2. OpenClaw:好的,请点击浏览器插件图标
  3. 你:(点击插件)
  4. OpenClaw:(开始搜索)
  5. OpenClaw 重启
  6. 你:帮我再搜索 YYY
  7. OpenClaw:好的,请点击浏览器插件图标
  8. 你:(又要点击插件)😤

现在(使用 Chrome Debug)

  1. 你:帮我搜索 XXX
  2. OpenClaw:(直接搜索,返回结果)
  3. OpenClaw 重启
  4. 你:帮我再搜索 YYY
  5. OpenClaw:(直接搜索,返回结果)

没有任何手动操作。

一键脚本

如果你觉得上面的步骤太麻烦,这里有一个一键脚本:

#!/bin/bash# setup-chrome-debug.shecho"🚀 设置 Chrome Debug 环境..."# 1. 创建数据目录mkdir -p "$HOME/Library/Application Support/Google/Chrome-Debug/Default"# 2. 复制登录文件cd"$HOME/Library/Application Support/Google/Chrome/Default"cp Cookies "Login Data""Web Data" Preferences "Secure Preferences"\"$HOME/Library/Application Support/Google/Chrome-Debug/Default/"2>/dev/null cp"$HOME/Library/Application Support/Google/Chrome/Local State"\"$HOME/Library/Application Support/Google/Chrome-Debug/"2>/dev/null # 3. 创建启动器mkdir -p "/Applications/Chrome Debug.app/Contents/MacOS"cat>"/Applications/Chrome Debug.app/Contents/MacOS/Chrome Debug"<<'EOF' #!/usr/bin/env bash exec arch -arm64 "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \ --remote-debugging-port=9222 \ --user-data-dir="$HOME/Library/Application Support/Google/Chrome-Debug" \ "$@" EOFchmod +x "/Applications/Chrome Debug.app/Contents/MacOS/Chrome Debug"echo"✅ 设置完成!"echo"👉 现在可以打开 /Applications/Chrome Debug.app 启动浏览器"echo"👉 OpenClaw 会自动连接到 http://127.0.0.1:9222"

保存为 setup-chrome-debug.sh,然后运行:

chmod +x setup-chrome-debug.sh ./setup-chrome-debug.sh 

常见问题

Q1: 两个 Chrome 可以同时运行吗?

可以。

Chrome Debug 和普通 Chrome 使用不同的数据目录,可以同时运行。

但建议只用 Chrome Debug,因为:

  • 它有所有的登录状态
  • OpenClaw 可以随时控制
  • 不需要切换

Q2: 登录状态会同步吗?

不会自动同步。

如果你在普通 Chrome 中登录了新账号,需要重新复制 Cookies 文件到 Chrome-Debug 目录:

cp"$HOME/Library/Application Support/Google/Chrome/Default/Cookies"\"$HOME/Library/Application Support/Google/Chrome-Debug/Default/"

或者直接在 Chrome Debug 中登录。

Q3: 安全吗?

相对安全。

开启调试端口意味着本机的任何程序都可以控制浏览器。

但是:

  • 调试端口只监听 127.0.0.1(本地),外网无法访问
  • 只有你信任的程序(OpenClaw)会连接
  • 如果你的电脑本身是安全的,这个方案就是安全的

不建议在公共电脑或不信任的环境中使用。

Q4: 为什么不用 Chrome 插件?

Chrome 插件的问题:

  • 需要手动点击才能连接
  • OpenClaw 重启后需要重新点击
  • 有时候会失效,需要刷新页面

Chrome Debug 的优势:

  • 完全自动化,不需要任何手动操作
  • OpenClaw 重启后自动重连
  • 更稳定,不会失效

Q5: 支持其他浏览器吗?

理论上支持所有基于 Chromium 的浏览器。

比如:

  • Microsoft Edge
  • Brave
  • Vivaldi
  • Opera

只需要修改启动脚本中的浏览器路径即可。

实战案例:让 AI 帮你调研

假设你想让 OpenClaw 帮你调研 GPT-5.3 Codex 的最新讨论。

之前的流程

  1. 你:帮我搜索 GPT-5.3 Codex 的最新讨论
  2. OpenClaw:好的,我需要打开浏览器,请点击插件图标
  3. 你:(点击插件)
  4. OpenClaw:(打开 X.com)
  5. OpenClaw:X.com 要求登录,请手动登录
  6. 你:(手动登录)
  7. OpenClaw:(搜索)
  8. OpenClaw:(返回结果)

总耗时:5-10 分钟(包括手动操作)

现在的流程

  1. 你:帮我搜索 GPT-5.3 Codex 的最新讨论
  2. OpenClaw:(自动打开 Chrome Debug,访问 X.com,搜索,截图,分析,返回结果)

总耗时:30 秒(全自动)

更进一步:让 AI 优先使用浏览器

在 OpenClaw 的配置中,你可以设置:

当需要查询信息、联网调研时,优先使用已经打开的可调试浏览器实例。

这样,OpenClaw 会:

  • 优先使用 Chrome Debug
  • 而不是调用 API 或其他工具
  • 因为浏览器有登录状态,可以访问更多内容

IDENTITY.mdTOOLS.md 中添加:

## 🌐 浏览器使用 当需要查询信息、搜索资料、联网调研时,**优先使用已打开的可调试浏览器实例**: ```bash # 查看浏览器标签页 openclaw browser --browser-profile mydebug tabs # 打开网页 openclaw browser --browser-profile mydebug open "https://x.com" # 截图查看 openclaw browser --browser-profile mydebug snapshot # 执行操作(点击、输入等) openclaw browser --browser-profile mydebug act 

使用 --browser-profile mydebug 来控制已打开的浏览器实例,而不是每次都启动新浏览器。
``

结语:自动化的本质

真正的自动化,不是"半自动化"。

真正的自动化,是:

  • 你说一句话
  • AI 自动完成
  • 不需要任何手动操作

这才是 AI 助手应该有的样子。

Chrome Debug 方案,就是为了实现这个目标:

  • ✅ 保留登录状态
  • ✅ 无需手动操作
  • ✅ 重启无忧
  • ✅ 不被风控

5 分钟配置,终身受益。

相关阅读:

Read more

RoboMaster SDK 终极指南:从零开始掌握机器人编程

RoboMaster SDK 终极指南:从零开始掌握机器人编程 【免费下载链接】RoboMaster-SDKDJI RoboMaster Python SDK and Sample Code for RoboMaster EP. 项目地址: https://gitcode.com/gh_mirrors/ro/RoboMaster-SDK 想要轻松控制DJI RoboMaster EP教育机器人吗?RoboMaster SDK就是你的完美选择!这是一个基于Python语言的开发工具包,让你用简单的代码就能实现复杂的机器人控制功能。无论你是编程新手还是资深开发者,都能快速上手这个强大的机器人开发平台。 🎯 快速上手:5分钟开启你的第一个机器人程序 核心概念速览 RoboMaster SDK采用了"模块化"设计理念,将机器人的各种功能封装成独立的模块。你可以像搭积木一样组合这些模块,创建出各种有趣的机器人应用。 环境配置三步走 第一步:安装Python环境 确保你的电脑上安装了Python 3.6.

论文阅读:Attention is all you need

Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in neural information processing systems, 2017, 30. 引言 文章首先引入循环模型存在一个根本性的计算瓶颈,即循环模型通常沿输入和输出序列的符号位置进行计算,在计算时刻t,模型会根据前一时刻的隐藏状态ht-1和当前位置的输入生成新的隐藏状态ht,这种固有的顺序性导致无法在训练样本内部进行并行化计算,当序列长度增加时,由于内存限制限制了批处理(batching)的大小,这一问题变得尤为严重。 文章提出了Transformer模型架构,完全摒弃了循环和卷积,并通过完全依赖注意力机制来建立输入和输出之间的全局依赖关系,具有高度并行化和训练速度极快的特点。 模型架构 Transformer 模型摒弃了传统的循环或卷积结构,采用了基于注意力机制的编码器-解码器(Encoder-Decoder)架构。其中编码器由6个相同的层堆叠而成,每层包含两个子层:一个是多头自注意力机制,另一个是简单

知识库问答机器人:基于SpringAI+RAG的完整实现

知识库问答机器人:基于SpringAI+RAG的完整实现

一、引言 随着大语言模型的快速发展,RAG(Retrieval-Augmented Generation)技术已成为构建知识库问答系统的核心技术之一。本文将带领大家从零开始,使用Spring AI框架构建一个支持文档上传的知识库问答机器人,帮助大家深入理解RAG技术的核心原理和实践应用。 1.1 什么是RAG? RAG(检索增强生成)是一种结合了信息检索和文本生成的技术。它的基本工作流程是: 用户提出问题 系统从知识库中检索相关信息 大语言模型基于检索到的信息生成答案 从系统设计角度触发,RAG 的核心作用可以被描述为: 在LLM调用生成响应之前,由系统动态构造一个“最小且相关的知识上下文”。 请注意两个关键词: 动态 :每次问题都不同,检索的知识也不同(比如用户问 A 产品时找 A 的文档,问 B 产品时找 B 的文档) 最小 :只注入必要信息(比如用户问 “A 产品的定价”,就只塞定价相关的片段,而非整份产品手册) RAG可以有效的弥补上下文窗口的先天不足:不再需要把所有知识塞进窗口,

Clawdbot(Moltbot) 飞书机器人配置,体验老板和助手沟通的感觉

Clawdbot(Moltbot) 飞书机器人配置,体验老板和助手沟通的感觉

一、背景说明 Clawdbot可以24小时待命(参考配置方式:Clawdbot(Moltbot) windows安装配置教程(含各种问题处理)),但是网页端使用起来比毕竟没那么方便,然而clawdbot支持多种渠道交互,这也正是这个AI助理的魅力所在,想想飞书发送一个消息,一个任务就完成了,这不就是老板指挥我做事的方式吗,来赶紧体验一波老板的感觉~ 二、飞书机器人创建 飞书开放平台构建机器人:https://open.feishu.cn/ 记录App ID 和 App Secret,一会要用: 三、自动安装插件 项目地址:https://github.com/m1heng/Clawdbot-feishu 这时候,就可以发挥clawdbot的能力了,直接让clawdbot给我安装: 我要安装飞书机器人,帮我按照这个命令安装:Clawdbot plugins install @m1heng-clawd/feishu 到这个过程有点慢,安装了好一会没反应,我开始问了: 又过了好一会没反应,