OpenClaw Zero Token 浏览器自动化实现大模型免 Token 调用

OpenClaw Zero Token 深度解析：浏览器自动化实现大模型免 Token 调用的原理与实战

快速摘要

OpenClaw Zero Token 是开源 AI 智能体框架 OpenClaw 的一个社区衍生版本，它的核心思路是：通过 Playwright 浏览器自动化技术，复用你在各大模型网页端的登录状态，从而绕过传统 API Token 调用的方式，实现对 DeepSeek、千问、Kimi、豆包等主流大模型的本地 Agent 调用。整个方案采用 MIT 开源协议，项目在 GitHub 上已获得 1800+ Star。如果你正在搭建本地 AI 智能体、或者对浏览器自动化与大模型结合的技术路线感兴趣，往下看有更详细的原理拆解和完整部署步骤。

从 OpenClaw 说起：为什么会出现 Zero Token 版本

2025 年底，奥地利开发者 Peter Steinberger 发布了一个名为 OpenClaw（早期叫 Clawdbot）的开源项目。这个项目迅速走红，不到三个月便登顶 GitHub Star 榜单，成为开源社区近年来最受关注的 AI Agent 框架之一。OpenClaw 的定位并不是一个简单的聊天机器人，而是一个可以拆解目标、调用工具、连续执行步骤的自主智能体——它能读写文件、运行脚本、对接外部应用，在获得目标后持续执行任务。

然而，原版 OpenClaw 在使用过程中有一个绕不开的问题：Token 消耗。AI 智能体的运行逻辑是不断地与大语言模型进行多轮对话，每一次任务拆解、工具调用、结果反馈都需要消耗 API Token。对于个人开发者和学习者来说，跑一个稍微复杂点的任务，API 调用费用就会快速累积。

OpenClaw Zero Token 正是为了解决这个痛点而诞生的。它是社区开发者基于 OpenClaw 的一个 Fork 版本，核心改动集中在大模型调用层——用浏览器自动化技术替代了传统的 API Token 调用，让你可以直接复用网页端的登录会话来与大模型交互。

技术原理深度拆解：Zero Token 到底怎么做到的

要理解 OpenClaw Zero Token 的工作原理，需要先搞清楚传统 API 调用和浏览器自动化调用之间的本质区别。

传统 API Token 调用的流程

当你通过 API 调用 DeepSeek 或 ChatGPT 时，流程大致是这样的：你的程序构造一个 HTTP 请求，带上 API Key 和对话内容，发送到模型提供商的服务器。服务器验证你的 API Key、扣除对应的 Token 额度，然后返回模型的回复。每一次请求都会计量 Token 数量并计费。

Zero Token 的浏览器自动化调用流程

而 Zero Token 方案的思路完全不同。它的核心逻辑是：你在浏览器里已经登录了 DeepSeek、千问这些平台的网页版，那么浏览器里已经保存了你的登录凭证（Cookie、Session Token 等）。OpenClaw Zero Token 通过 Playwright 浏览器自动化框架，连接到你已经登录的 Chrome 浏览器实例，捕获这些会话凭证，然后用程序模拟网页端发送消息的请求格式，直接与大模型平台进行交互。

从平台的角度看，这和你在网页上手动打字聊天没有区别——请求是从你的真实浏览器环境发出的，带着你的真实登录状态。

这里面有几个关键的技术环节值得深入了解：

Chrome DevTools Protocol（CDP） 是整个方案的底层基础。CDP 是 Chrome 浏览器内置的一套调试协议，允许外部程序通过 WebSocket 连接到浏览器，获取页面信息、操控页面行为、截取网络请求等。OpenClaw Zero Token 在启动时，会以调试模式（指定 --remote-debugging-port 参数）打开一个 Chrome 实例，然后通过 Playwright 的 connect_over_cdp 方法连接到这个实例。

具体的连接方式可以用一段伪代码来理解：

# 第一步：以调试模式启动 Chrome
chrome --remote-debugging-port=18892 --user-data-dir="你的数据目录"
# 此时 Chrome 在 18892 端口上暴露了 CDP 接口
# Playwright 可以通过这个端口连接并控制浏览器

// Playwright 连接已有的 Chrome 实例
const browser =  chromium.();
 context = browser.()[];

平台	标识	认证方式	备注
DeepSeek	deepseek-web	浏览器登录	需单独认证
千问（国际版）	qwen-web	浏览器登录	—
千问（国内版）	qianwen-web	浏览器登录	速度更快，支持深度搜索、代码助手
Kimi	kimi-web	浏览器登录	—
豆包	doubao-web	浏览器登录	深度适配，仅需两个 Cookie
ChatGPT	chatgpt-web	浏览器登录	—
Gemini	gemini-web	浏览器登录	—
Grok	grok-web	浏览器登录	—
智谱清言	glm-web	浏览器登录	—

对比维度	传统 API Token 方式	Zero Token 浏览器自动化方式
认证方式	API Key + Token 计费	浏览器 Cookie / Session
调用入口	平台 API 接口	模拟网页端请求
是否需要付费密钥	是	否
使用限制	按 Token 计量	受网页版额度限制
响应速度	通常较快	取决于网页端响应
稳定性	较高	受平台反爬策略影响
Function Calling 支持	原生支持	需要 XML 标签模拟
适用场景	生产环境、高频调用	学习研究、本地开发

OpenClaw Zero Token 浏览器自动化实现大模型免 Token 调用

OpenClaw Zero Token 深度解析：浏览器自动化实现大模型免 Token 调用的原理与实战

快速摘要

从 OpenClaw 说起：为什么会出现 Zero Token 版本

技术原理深度拆解：Zero Token 到底怎么做到的

传统 API Token 调用的流程

Zero Token 的浏览器自动化调用流程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

五层架构设计：从接入到执行的完整链路

接入层（Access Layer）

调度层（Scheduler Layer）

核心 Agent 层（Core Agent Layer）

大模型调用层（LLM Call Layer）

底层技术层（Infrastructure Layer）

目前支持的大模型平台

完整部署指南：从零开始搭建

环境准备

第一步：克隆项目代码

第二步：安装依赖并构建

第三步：启动浏览器调试模式

第四步：运行配置向导

第五步：检查配置文件

第六步：启动服务

配置文件结构说明

实际使用中的注意事项

关于使用合规性

凭证有效期

安全风险提醒

网络环境

与传统调用方式的对比

AskOnce 功能：一次提问，多模型回答

常见问题排查指南

浏览器启动失败

凭证捕获失败

服务启动后模型列表为空

对话过程中出现中断

依赖安装问题

技术原理补充：PoW 反爬挑战的实现

从 Zero Token 看 OpenClaw 生态的演变

写在最后

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具