一文读懂openClaw:GitHub史上增长最快的开源AI个人助手,附部署教程与免费大模型推荐

一文读懂openClaw:GitHub史上增长最快的开源AI个人助手,附部署教程与免费大模型推荐
哲人言:道生一,一生二,二生三,三生万物。——《道德经》
创作者:
查老师并不渣(ZEEKLOG)(一个在哲学与生活中寻找平衡的思考者😊

目录




引言

一、openClaw 是何方神圣?

与其他项目的对比

二、系统架构深度解析

1. Gateway(网关)

2. Agent(智能体)

3. Skills(技能)

4. Channels(通道)

5. Nodes(节点)

6. Memory(记忆)

三、为什么 openClaw 能引爆社区?

四、快速部署与配置指南

系统要求

一键安装

初始化配置

关键环境变量

Docker 部署(可选)

五、核心功能详解

1. 长期记忆系统

2. 技能系统(Skills)

3. 主动提醒(Cron 任务)

4. 语音支持(ElevenLabs)

5. 浏览器控制

六、免费大模型集成(智谱 AI)

配置步骤

七、总结与展望

附录:相关链接


引言

就在最近,一个名为 openClaw(曾用名 Clawdbot、Moltbot)的开源项目在 GitHub 上掀起了轩然大波。短短一个多月内,它狂揽 239,000+ stars,一举超越 langchain、dify 等知名项目,成为 GitHub 历史上增长最快的开源项目之一。

这款由 PSPDFKit 创始人 Peter Steinberger(现已入职 OpenAI)利用 AI 编程打造的本地、自托管 AI 个人助手,将消息平台与 LLM、智能体深度整合,不仅拥有友好的界面,还具备强大的第三方集成能力,实现了从电脑操作、日程提醒、会议摘要生成到网页操作的全场景自动化。

本文将带你全面拆解这个“神级”项目,从架构原理到部署实战,从核心功能到免费大模型集成,一文读懂 openClaw。


一、openClaw 是何方神圣?

openClaw 是一款 本地优先、自托管的 AI 个人助手。它不再满足于“只会聊天”,而是通过智能体(Agent)机制,真正替你完成电脑上的实际任务。

与其他项目的对比

项目特点局限
ChatGPT/Claude对话能力强无法执行实际操作
AutoGPT自治智能体工程负担重、成功率不稳定
Manus/OpenManus概念演示实用性不足
openClaw简单安装、真实可用、全场景自动化中文生态支持有待加强

openClaw 的火爆源于它填补了“只会说不会做”的断层:

  • 真简单:一条命令即可本地启动,无需复杂的向量数据库和调度系统。
  • 真能用:不是演示,而是真的能发消息、跑脚本、读写文件、操作浏览器。
  • 真惊喜:让普通用户第一次感受到“LLM 真的可以替我操作电脑”。

二、系统架构深度解析

openClaw 的架构设计清晰且富有弹性,主要包含以下核心组件:

text

┌─────────────────────────────────────────────────────────────┐ │ Gateway │ │ (中央控制平面) │ └─────────────────────────────────────────────────────────────┘ │ ┌─────────────────────┼─────────────────────┐ ▼ ▼ ▼ ┌───────────────┐ ┌───────────────┐ ┌───────────────┐ │ Agent │ │ Channels │ │ Nodes │ │ (推理大脑) │ │ (消息通道) │ │ (设备扩展) │ └───────────────┘ └───────────────┘ └───────────────┘ │ │ ▼ ▼ ┌───────────────┐ ┌───────────────┐ │ Skills │ │ Memory │ │ (能力扩展) │ │ (持久记忆) │ └───────────────┘ └───────────────┘

1. Gateway(网关)

中央控制平面,运行 Node.js 守护进程,负责会话管理、权限验证与路由。默认端口 18789(WebSocket)和 18793(Canvas 服务器)。

2. Agent(智能体)

推理大脑,负责理解意图、制定计划、调用工具。支持 Claude、GPT-4、Ollama 本地模型等多种 LLM 提供商。

3. Skills(技能)

模块化插件系统,通过 SKILL.md 文件定义功能,支持文件操作、浏览器控制、API 调用等。遵循 AgentSkills 开放标准,与 Claude Code、Cursor 等工具兼容。

4. Channels(通道)

连接 WhatsApp、Telegram、Discord、Slack 等即时通讯软件,让 AI 无缝接入你的日常对话。

5. Nodes(节点)

运行在 iOS/Android/macOS 上的轻量级智能体,允许 AI 访问摄像头、地理位置或发送系统通知。

6. Memory(记忆)

基于纯 Markdown 文件的持久化记忆系统,支持向量检索(混合搜索:BM25 + 向量),让 AI 真正“记住”你的偏好和历史。


三、为什么 openClaw 能引爆社区?

  • 即时反馈:大量“第一天就能复现”的体验分享,一键安装即可运行。
  • 可控性:用户能清晰看到 AI 的思考和执行过程,信任感倍增。
  • 实用性:从“监控新闻网页自动总结”到“连接 WhatsApp 变私人助理”,场景丰富。

四、快速部署与配置指南

系统要求

  • Node.js 22+
  • RAM 2GB+(浏览器自动化建议 4GB+)
  • 操作系统:macOS、Linux、Windows(WSL2)、树莓派
  • 端口:18789、18790

一键安装

macOS/Linux:

bash

curl -fsSL https://openclaw.bot/install.sh | bash

Windows (PowerShell):

powershell

iwr -useb https://openclaw.bot/install.ps1 | iex

或通过 npm 安装:

bash

npm install -g openclaw@latest

初始化配置

运行配置向导:

bash

openclaw onboard

向导将引导你:

  1. 确认安全须知
  2. 选择 AI 后端(Anthropic/OpenAI/本地模型)
  3. 配置消息平台(Telegram/WhatsApp 等)
  4. 安装 Gateway 服务
  5. 完成并获取访问地址(默认 Web UI: http://127.0.0.1:18789

关键环境变量

变量说明
ANTHROPIC_API_KEYAnthropic Claude API 密钥
OPENAI_API_KEYOpenAI API 密钥
CLAWDBOT_GATEWAY_TOKENGateway 认证令牌
CLAWDBOT_CONFIG_DIR配置目录(默认 ~/.clawdbot)
CLAWDBOT_WORKSPACE_DIR工作区目录(默认 ~/clawd)

Docker 部署(可选)

bash

./docker-setup.sh

详细配置请参考官方文档。


五、核心功能详解

1. 长期记忆系统

  • 基于 Markdown 文件(~/clawd/MEMORY.md 等)
  • 混合检索(向量 70% + BM25 30%),精准回忆历史对话
  • 自动记忆刷新,无需手动干预

2. 技能系统(Skills)

  • 通过 SKILL.md 定义技能,支持脚本调用
  • 三层加载机制:Workspace Skills > User Skills > Bundled Skills
  • 官方技能市场 ClawHubhttps://clawdhub.com

3. 主动提醒(Cron 任务)

  • 支持一次性或周期性提醒
  • 可设置条件触发(如“当新闻更新时”)
  • 示例:每天早上 8 点提醒我看晨报

4. 语音支持(ElevenLabs)

  • 语音对话能力,需配置 ElevenLabs API Key
  • 支持 macOS 原生应用及 iOS/Android 节点

5. 浏览器控制

  • 基于 Chrome DevTools Protocol
  • 支持截图、点击、输入、滚动等操作
  • 可执行复杂网页任务(如自动比价、信息提取)

六、免费大模型集成(智谱 AI)

openClaw 支持多种 LLM 提供商,其中智谱 AI 的 flash 系列模型完全免费,非常适合入门体验。

配置步骤

  1. 注册智谱 AI 开放平台:点击注册
  2. 创建 API Key
  3. 在 openClaw 配置中使用 zai/GLM-4.7-flash 作为模型

示例配置:

json

{ "agent": { "model": "zai/GLM-4.7-flash" } }


七、总结与展望

openClaw 代表了个人 AI 助手领域的一次重要突破:它将 记忆、主动性、执行力 三者深度融合,通过本地优先、自托管的架构,让 LLM 真正走出对话框,融入真实工作流。

  • 优势:简单易用、生态兼容(AgentSkills)、功能强大(定时任务、技能扩展)
  • 不足:中文生态支持尚浅,交互深度有待加强
  • 展望:随着社区贡献和商业化推进,openClaw 有望成为下一代个人计算的核心入口。

对于 AI 开发者而言,openClaw 是一个不容错过的学习样本;对于普通用户,它则是体验未来 AI 助手的绝佳起点。


附录:相关链接

如果你对 AI Agent 还不熟悉,推荐阅读:读懂 AI Agent:基于大模型的智能体框架解析

Read more

人工智能篇---OpenClaw

人工智能篇---OpenClaw

OpenClaw深度解析:AI界的"大龙虾",你的全能数字员工 下面,我将从六个维度为你层层拆解这个现象级项目。 一、OpenClaw是什么?——从"个人助理"到"AI代理层"的革命 OpenClaw(曾用名Clawdbot/Moltbot)是一个开源的"本地优先"AI智能体平台,可以把它理解为能替你干活的"AI数字员工"。它的核心价值在于:用自然语言指令实现全场景任务自动化,无需专业编程基础,即可完成文档处理、网页抓取、代码生成、跨工具协同等各类重复性工作。 创始人故事:这个项目由Peter Steinberger在2024年用1小时敲出原型,如今已成长为17.5万星标的开源生态(GitHub增速最快项目之一)。 AI教父的认可:AI领域顶级专家Andrej Karpathy将其视为叠加在智能体之上"新的一层"

传统任务管理模式渐行渐远,DooTask 该如何玩转 AI 新赛道?

传统任务管理模式渐行渐远,DooTask 该如何玩转 AI 新赛道?

传统任务管理模式渐行渐远,DooTask 该如何玩转 AI 新赛道? 2025年10月9日,Google Cloud 正式推出企业级 AI 平台 Gemini Enterprise,这一里程碑式的举措标志着企业工作流全面进入智能化时代。Gemini Enterprise 平台的诞生,犹如在企业数字化转型的浪潮中投下了一颗重磅炸弹,为企业带来了前所未有的变革机遇。 Google Gemini Enterprise:企业级 AI 的革新引擎 Gemini Enterprise以Gemini 2.5系列模型为核心,具备强大的多模态处理能力,能同时精准理解和处理文本、图像、音频等多种数据类型。例如在分析含复杂图表与专业文字说明的项目报告时,它可精准捕捉图表数据趋势,结合文字进行综合推理判断,为企业决策提供全面、准确且具前瞻性的信息。 其统一多模态交互界面,为用户提供便捷交互方式。用户无论通过语音指令、文字输入还是手势操作,都能在同一个简洁界面与AI流畅交互,消除不同工具和界面切换的繁琐,降低学习成本,提高工作效率。 无代码智能体构建工具是该平台的一大亮点。过去,开发智能体对非专业编程

AI的提示词专栏:Prompt 驱动的结构化抽取,从文本中提取表格

AI的提示词专栏:Prompt 驱动的结构化抽取,从文本中提取表格

AI的提示词专栏:Prompt 驱动的结构化抽取,从文本中提取表格 本文围绕 Prompt 驱动的结构化抽取展开,先阐述其价值 —— 解决传统人工整理效率低、代码开发场景适应性差的痛点,借助大语言模型实现非结构化文本到表格的高效转化。接着解析核心概念,明确结构化抽取三要素及 Prompt 的赋能逻辑,随后提供基础版(适简单文本)、进阶版(适复杂文本)、优化版(适专业文本)三类 Prompt 设计框架,搭配实战案例说明操作要点。还通过内容创作、电商运营、学术研究三个跨场景案例,给出行业适配技巧,并针对字段遗漏、信息错误等六类常见问题提供解决方案。最后总结核心知识点,推荐工具与技术趋势,设计课后练习,助力读者掌握从简单到复杂场景的结构化抽取技巧。 人工智能专栏介绍     人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库,把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。无论你是刚接触 AI 的新手,还是有一定基础想提升的人,