OpenClaw 开源桌面 AI Agent 框架功能与架构解析
最近 AI 圈子里最火的词离不开'龙虾'(OpenClaw)。这个开源的桌面 AI Agent 框架从国外火到国内,Star 数迅速增长,成为 GitHub 软件星标历史上的头名。

1. 核心功能
OpenClaw 是一个能全天候待命的开源私人助手和自主代理。它的核心在于不再像传统 AI 只能'动嘴皮子'提建议,而是能实打实地去干活,成为名副其实的'电子打工人'。
主要能力
- 日常琐事自动化:清理邮箱、发邮件、排日程、定机票、填报销单或预约医生。
- 多平台交互:支持在 WhatsApp、Telegram、Discord 甚至 iMessage 里发指令,无需学习新软件。
- 设备与服务控制:
- 本地设备:读写文件、运行命令。
- 网页操作:自动翻网页、抓数据、修改 Google Cloud 配置。
- 多模态交互:语音输入输出,调用摄像头和麦克风。
- 开发与运维:管理代码会话、跑测试、通过 Sentry 抓 Bug、GitHub 提 PR 修漏洞、24 小时系统监控。
- 个性化记忆:记住用户习惯、笔记和健康数据,提供深度建议。
- 技能扩展:支持用 Markdown 或 TypeScript 添加技能,或从技能市场获取。支持 YouTube 视频自学开发新本事。
模型兼容性
对模型不挑,Claude 3.5、GPT-4o、Kimi 或本地 Ollama 均可接入,支持切换 API 以平衡性能与隐私。
核心逻辑
将大白话转化为机器指令(如代码),利用大模型翻译,配合缓存机制存储上下文,实现通用 AI Agent 流程。
2. 架构与原理
OpenClaw 采用模块化设计,核心架构为'你说话 - 它琢磨 - 它动手 - 它汇报'的闭环。
五大组成部分
- 大模型推理内核(大脑):负责理解需求、出方案。支持多种模型选择,云端或本地皆可。
- 多渠道聊天网关(入口):适配各种聊天软件,传递指令与结果。
- Lobster Agentic Loop(中枢):核心竞争力,使用 ReAct 提示词框架。将模糊要求拆解为具体步骤(理解 - 拆解 - 找工具 - 干活 - 验货 - 调整),支持重试。
- 可插拔技能生态(手脚):支持 JS、Python 等主流语言编写脚本或调协议。社区已有上千现成技能。
- Memory & State 记忆模块(记性):短期记忆管当前任务,长期记忆管用户习惯。支持断点续传。
工作流
- 接单并翻译:网关接收指令,大脑结合记忆理解意图。
- 拆解任务找工具:中枢拆解目标,从技能库寻找合适工具并确认权限。
- 埋头苦干:技能层调用工具执行,卡住时自动重试,结果打包反馈并更新记忆。
主打'本地运行',数据存储在本地电脑,保障安全省心。
3. 潜在风险
由于权限较高(能删文件、跑代码),存在以下风险:
(一)系统安全隐患
读写文件、运行命令、录屏等高权限若被黑客利用,可能控制整台电脑。第三方技能可能存在病毒风险。


