OpenClaw 101:从入门到实操,解锁“会动手”的AI智能体

OpenClaw 101:从入门到实操,解锁“会动手”的AI智能体

https://openclaw101.dev/

https://my.feishu.cn/wiki/MlyEwRKIwikkBlkGew0ckLfonEu

https://github.com/openclaw/openclaw

https://zhuanlan.zhihu.com/p/2002370444339212951

2026年初,OpenClaw(原Clawd、Moltbot)以72小时狂揽6万+ GitHub Stars的速度爆红,如今星标数已突破18万+,甚至带动Mac Mini全球卖断货、Cloudflare股价上涨20%。不同于ChatGPT等“只说不做”的聊天机器人,OpenClaw是一款开源的个人AI助手平台,核心定位是“真会动手办事”的数字员工——它能接管电脑操作权限,通过自然语言指令主动执行各类任务,真正实现“聊天框里办大事”。

本文作为OpenClaw 101入门指南,将从“是什么→怎么装→怎么用→核心原理→进阶技巧”逐步拆解,逻辑清晰、实操性强,无论是零基础新手还是有一定技术基础的开发者,都能快速上手,解锁这款AI工具的核心价值。

一、基础认知:OpenClaw到底是什么?

1.1 核心定位:不止是聊天,更是“能执行的AI助理”

OpenClaw的核心理念是“本地优先”(Local-first)和“执行优先”(Action-oriented),它被定义为一个“自托管的AI智能体框架”,区别于传统聊天机器人的核心优势的是:拥有“眼睛”和“手”——能操作浏览器、读写文件、执行脚本命令、模拟鼠标键盘,甚至管理邮箱、预订服务、填写表单,真正充当用户的贴身数字员工。

简单来说:ChatGPT能告诉你“如何清理邮箱”,而OpenClaw能直接帮你清理邮箱;ChatGPT能给出“预订餐厅的步骤”,而OpenClaw能直接完成预订并反馈结果,这就是“信息生成者”与“任务执行者”的本质区别。

1.2 核心特性:为什么OpenClaw能快速出圈?

- 本地优先,隐私可控:默认运行在用户本地设备(Windows、macOS、Linux,甚至树莓派),所有数据、对话历史和任务执行记录都保存在本地,不上传云端,彻底保障数据主权,尤其适合对隐私敏感的用户。

- 寄生式交互,零门槛使用:无需安装额外App,可嵌入WhatsApp、Telegram、Discord、飞书、钉钉等20+主流通讯软件,用户在熟悉的聊天界面就能发送指令,后台自动执行并反馈结果,极大降低使用门槛。

- 持续记忆,越用越懂你:采用“文件即状态”的记忆机制,能持久保存用户偏好、历史指令和关键信息(如配偶生日、工作习惯),不同于ChatGPT的上下文重置模式,OpenClaw能实现长期记忆,主动给出提醒和个性化建议,真正“越用越懂你”。

- 高度可扩展,技能自由:支持通过“技能(Skills)”扩展能力,既能安装社区开发的3000+插件,也能自定义编写脚本,甚至能自动生成新技能来满足用户的个性化需求,实现“自我进化”。

- 多模型兼容,灵活切换:可对接Anthropic Claude、OpenAI GPT、Gemini等云端模型,也支持Ollama等本地私有模型,用户可根据需求自由切换,兼顾性能与隐私。

1.3 适用人群:谁该学习OpenClaw?

无论是零基础的普通用户,还是有技术基础的开发者,都能从OpenClaw中获益:

- 普通用户:用它自动化处理重复任务(清理邮箱、管理日程、预订服务),提升日常效率;

- 开发者:基于其框架二次开发,自定义技能插件,或搭建专属AI助手;

- 企业用户:部署在私有服务器,实现内部流程自动化,保障数据安全。

二、实操入门:从零部署OpenClaw(新手友好)

部署OpenClaw有两种主流方式:本地部署(适合新手体验)和云端部署(适合长期稳定使用),本文重点讲解本地部署(Windows/WSL2、macOS通用),并补充阿里云云端部署的核心步骤,全程附可直接复制的命令,零基础也能轻松完成。

2.1 前置条件(必看)

- 系统要求:macOS 10.15+、Linux(推荐Ubuntu)、Windows(需安装WSL2,原生Windows未经充分测试,不推荐);

- 软件依赖:Node.js ≥ 22(核心依赖)、pnpm(可选,从源代码构建时推荐);

- 其他准备:AI模型API Key(Claude/OpenAI/KIMI均可,推荐Claude Sonnet 4.5,性价比高)、聊天渠道账号(Telegram/WhatsApp/飞书任选,Telegram功能最完善);

- 可选准备:Brave Search API密钥(用于网页搜索功能,提升AI的实时信息获取能力)。

2.2 本地部署步骤(3步搞定)

步骤1:安装OpenClaw CLI(命令行工具)

CLI是操作OpenClaw的核心工具,不同系统的安装命令如下,复制粘贴到终端/命令行即可:

- macOS/Linux:

curl -fsSL https://openclaw.ai/install.sh | bash

- Windows(WSL2内):

iwr -useb https://openclaw.ai/install.ps1 | iex

替代方案(全局安装):

npm install -g openclaw@latest
# 或用pnpm
pnpm add -g openclaw@latest

安装完成后,输入 openclaw --version,若显示版本号,说明安装成功。

步骤2:运行新手引导向导(自动配置核心参数)

OpenClaw提供了新手引导向导,能自动配置模型认证、网关设置、聊天渠道等,无需手动修改配置文件,新手优先选择此方式:

openclaw onboard --install-daemon

运行后,按照提示完成以下配置(全程中文引导,耐心操作即可):

1. 选择部署方式:本地Gateway(新手选这个)或远程Gateway;

2. 认证配置:输入AI模型API Key(如Claude),或选择OAuth认证;

3. 聊天渠道配置:选择你常用的渠道(如Telegram/WhatsApp),按提示完成登录(如WhatsApp扫描QR码、Telegram输入机器人令牌);

4. 守护进程安装:选择安装后台服务(launchd/systemd),让OpenClaw持续在后台运行,无需每次手动启动。

步骤3:启动Gateway并验证部署

如果在引导向导中安装了后台服务,Gateway会自动启动,可通过以下命令查看状态:

openclaw gateway status

若显示“Up”,说明Gateway运行正常;若未自动启动,手动启动命令:

openclaw gateway --port 18789 --verbose

启动后,可通过Web控制台验证:浏览器输入 http://127.0.0.1:18789/,粘贴引导向导生成的Token登录,能正常加载控制台即部署成功。

最后,在你配置的聊天渠道(如Telegram)发送指令“你好,帮我查看当前目录的文件”,若AI返回文件列表,说明整个部署流程无误,可正常使用。

2.3 云端部署简化版(阿里云,长期稳定)

如果想让OpenClaw 24小时不间断运行,推荐阿里云轻量应用服务器部署(成本低、操作简单),核心步骤如下:

1. 购买阿里云轻量应用服务器,选择“应用镜像→OpenClaw 2026新手版”(预置所有依赖),最低配置2vCPU+2GiB内存即可;

2. 放通18789端口,在阿里云控制台配置API Key(粘贴你的Claude/OpenAI Key);

3. 远程连接服务器,执行 docker ps | grep openclaw,查看容器运行状态;

4. 对接聊天渠道,执行 openclaw channels login,按提示配置Telegram/飞书等,完成测试。

三、核心操作:OpenClaw常用指令与场景实操

部署完成后,核心使用方式是“在聊天渠道发送自然语言指令”,OpenClaw会自动拆解任务、执行操作并反馈结果。以下是新手必学的常用指令和典型场景,直接复制发送即可体验。

3.1 基础指令(快速上手)

- 查看系统状态:帮我查看OpenClaw的运行状态,以及当前连接的模型;

- 文件操作:帮我创建一个名为openclaw_test的文件夹,然后在里面新建一个txt文件,写入“Hello OpenClaw”;

- 网页操作:帮我打开百度,搜索“OpenClaw最新技能”,并把搜索结果总结给我;

- 日程管理:帮我添加一个明天下午3点的会议,主题是“OpenClaw学习”,提醒我提前10分钟;

- 技能管理:帮我安装tavily-search技能(用于联网搜索)。

3.2 典型场景实操(解锁核心价值)

场景1:自动化清理邮箱

指令:帮我清理收件箱,删除所有来自广告邮箱的邮件,把标题包含“工作”的邮件标记为已读,并整理一份未读邮件清单发给我。

原理:OpenClaw调用邮箱技能,读取邮箱内容,根据关键词筛选邮件,执行删除、标记操作,最后生成清单反馈,全程无需手动操作。

场景2:远程控制电脑操作

指令:帮我远程打开电脑上的微信,发送一条消息给“张三”,内容是“明天的会议推迟到下午4点”。

原理:通过Gateway的实时通信能力,远程调用电脑的鼠标键盘模拟功能,打开应用、发送消息,适合不在电脑前但需要紧急操作的场景。

场景3:主动提醒服务

指令:记住我配偶的生日是10月1日,到9月30日的时候主动提醒我准备礼物。

原理:利用OpenClaw的长期记忆机制,将关键信息存储为本地文件,通过调度层的定时任务,到指定时间主动推送提醒,体现“贴身助理”的价值。

3.3 技能管理(扩展OpenClaw能力)

技能是OpenClaw的核心扩展方式,新手必装3个基础技能,装上后能解决80%的使用场景:

1. tavily-search:联网搜索技能,打破AI的知识局限,获取实时资讯和数据,安装命令:clawhub install tavily-search;

2. agent-browser:浏览器自动化技能,控制浏览器打开网页、填写表单、点击操作,默认已安装;

3. shell-skills:系统命令执行技能,允许OpenClaw执行Shell命令,实现更灵活的本地操作,安装命令:clawhub install shell-skills。

查看已安装技能:openclaw skills list;卸载技能:clawhub uninstall 技能名称。

四、深度解析:OpenClaw核心架构与工作原理

掌握了基础部署和操作后,我们深入拆解OpenClaw的核心架构——它之所以能实现“思考-执行-反馈”的闭环,得益于模块化的分层设计和独特的智能体循环机制。

4.1 六大核心子系统架构(从下到上)

OpenClaw采用模块化设计,分为六大核心子系统,各司其职、解耦独立,修改某一层不会影响其他层,便于扩展和维护,具体分工如下:

1. Gateway(网关层):系统的“神经中枢”,是一个常驻后台的Node.js进程,负责监听聊天渠道的消息、标准化处理指令、会话路由和安全认证,通过WebSocket实现实时双向通信,是用户远程控制的核心。

2. Router(路由层):负责“分发任务”,根据路由规则(如Peer ID、群组ID),将用户指令分配给对应的Agent实例,支持一个设备运行多个Agent,服务于不同场景。

3. Agent Loop(智能体循环):OpenClaw的“心脏”,遵循Lobster智能体循环模式,实现“思考-执行-观察-反馈”的闭环,也是它能完成复杂任务的核心:
        

  - 思考(Think):加载Agent的身份(Soul)、记忆(Memory)和技能(Skills),将用户指令拆解为可执行的子任务;

  - 执行(Act):调用底层工具或技能,执行具体操作(如打开浏览器、运行Shell命令);

  - 观察(Observe):获取执行结果(成功/失败信息);

  - 反馈(Reflect):将结果反馈给大模型,更新上下文,决定下一步行动或结束任务。

4. Brain(推理层):负责与大语言模型交互,支持多模型热切换,负责Prompt构建、模型调用和输出解析,是OpenClaw“理解指令”的核心。

5. Memory(记忆层):采用“文件即状态”的设计,将所有记忆存储为本地Markdown/YAML文件,而非复杂数据库,分为4类:
        

  - Soul(灵魂):存储Agent的身份、价值观和个性,定义“我是谁”;

  - Memory(记忆):存储用户长期偏好和关键信息,即长时记忆;

  - Session(会话):存储当前任务的上下文和短期记忆;

  - State(状态):用于多Agent协作,记录项目进度,实现协同工作。

6. Scheduler(调度层):实现主动式服务,支持心跳模式和定时模式,Agent可定期唤醒自己,主动执行任务(如每日早报、待办提醒),无需用户指令触发。

4.2 核心工作流程(以“预订餐厅”为例)

结合架构,我们拆解一个完整的任务执行流程,理解OpenClaw的工作逻辑:

1. 用户在Telegram发送指令:“帮我预订今晚7点附近的餐厅,偏好中餐,人均100元以内”;

2. Gateway接收消息,标准化处理后,通过Router分配给主Agent;

3. Agent Loop(思考阶段):拆解任务为“1. 搜索附近中餐餐厅;2. 筛选人均100元以内的选项;3. 打开订餐网站预订;4. 反馈预订结果”;

4. Agent Loop(执行阶段):调用tavily-search技能搜索餐厅,调用agent-browser技能打开订餐网站,填写预订信息;

5. Agent Loop(观察阶段):获取预订结果(成功/失败),若失败(如无空位),调整策略(更换餐厅)重新尝试;

6. Agent Loop(反馈阶段):将预订成功的信息(餐厅名称、地址、预订时间)反馈给Gateway,再由Gateway推送至用户Telegram;

7. Memory层更新:将用户的餐饮偏好(中餐、人均100元)保存为长期记忆,后续预订时自动匹配。

五、进阶技巧:自定义技能与安全优化

对于有一定开发基础的用户,可通过自定义技能和优化配置,让OpenClaw更贴合自身需求;同时,由于OpenClaw能控制本地设备,安全设置也至关重要。

5.1 自定义技能(简单脚本示例)

OpenClaw的技能本质是脚本文件,支持JavaScript/Python等语言,以下是一个简单的“每日天气提醒”技能示例(核心逻辑):

// 技能名称:daily-weather
// 功能:每日早上8点获取本地天气,推送至Telegram
module.exports = {
  name: "daily-weather",
  description: "每日天气提醒",
  schedule: "0 8 * * *", // 每日8点执行
  async run(agent) {
    // 调用天气API获取本地天气
    const weather = await agent.tools.web.search("今日本地天气");
    // 推送至Telegram
    await agent.channels.send("telegram", `今日天气:${weather},记得增减衣物哦~`);
    // 更新记忆,记录用户的天气偏好
    agent.memory.set("weather_preference", "每日8点提醒");
  },
};


将脚本保存至 ~/.openclaw/skills/daily-weather 目录,执行 openclaw skills reload,即可启用该技能。

5.2 安全优化(必做,避免风险)

由于OpenClaw拥有设备操作权限,不当配置可能导致安全风险,推荐以下3个安全设置:

1. 渐进式授权:初次使用时,仅给予AI只读权限,大部分操作(如发送邮件、删除文件)需用户确认,熟悉后再逐步开放权限;

2. 开启操作日志:执行 openclaw security audit --deep,开启操作日志,所有AI执行的任务都可追溯,若出现错误可及时排查;

3. 沙箱隔离:在配置文件中开启沙箱模式,隔离群组/渠道会话,避免恶意指令影响本地设备,配置示例:{
  "routing": {
    "agents": {
      "main": {
        "workspace": "~/.openclaw/workspace",
        "sandbox": { "mode": "non-main" }
      }
    }
  }
}

六、常见问题排查(新手避坑)

部署和使用过程中,新手容易遇到以下问题,整理了对应的解决方案,快速排查无需踩坑:

- 问题1:Gateway启动失败,提示端口18789被占用
解决方案:修改配置文件 ~/.openclaw/openclaw.json,将端口改为18790,重启服务:openclaw gateway restart。

- 问题2:聊天渠道无响应,发送指令没有反馈
解决方案:检查网络连通性,重启渠道服务:openclaw channels restart 渠道名称(如telegram),或重新配对:openclaw pairing approve 渠道名称 配对码。

- 问题3:API Key无效,模型调用失败
解决方案:检查API Key是否完整(无空格/字符遗漏),重新生成并配置,执行 openclaw configure --section brain 重新设置模型参数。

- 问题4:Windows系统部署后无法正常运行
解决方案:卸载原生Windows部署,安装WSL2(推荐Ubuntu),在WSL2内重新部署,避免原生Windows的兼容性问题。

七、总结与后续学习方向

本文从基础认知、部署实操、核心操作、架构解析到进阶技巧,完整覆盖了OpenClaw 101的核心内容,总结下来:OpenClaw的核心价值的是“将AI从聊天工具升级为执行工具”,通过本地优先、持续记忆、高度可扩展的特点,真正成为用户的贴身数字员工。

对于新手,建议先完成本地部署,熟悉基础指令和场景,再逐步尝试安装技能、自定义配置;对于开发者,可深入研究其架构源码,开发专属技能插件,甚至参与OpenClaw的开源贡献(GitHub地址:https://github.com/openclaw/openclaw)。

后续学习方向推荐:

- 深入学习Lobster智能体循环机制,理解AI的任务拆解逻辑;

- 开发复杂自定义技能,实现更个性化的自动化需求;

- 探索多Agent协作,搭建多个AI助理协同工作的场景;

- 研究OpenClaw的商业化与生态构建,了解技能商城、云端代管等模式。

随着AI Agent技术的发展,OpenClaw作为开源领域的标杆项目,未来还会持续迭代升级。希望本文能帮助你快速入门OpenClaw,解锁AI自动化的核心能力,让技术为效率赋能。
 

Read more

Gemini影视剧本创作AI辅助分镜头脚本自动生成方案

1. Gemini在影视创作中的角色与潜力 随着人工智能技术的迅猛发展,AI已逐步渗透至创意产业的核心领域。Google推出的Gemini大模型凭借其多模态理解能力、强大的自然语言生成技术和上下文推理优势,正在重新定义影视剧本创作的工作流程。相较于传统依赖人工构思与反复打磨的模式,Gemini能够基于少量提示快速生成风格一致、结构完整的故事梗概和人物设定,显著缩短前期开发周期。其深层语义解析能力可精准识别剧情高潮、情感弧线与角色动机,并支持跨类型风格迁移——例如将 noir 犯罪片的叙事节奏应用于科幻题材。通过实际案例验证,使用Gemini可在15分钟内输出具备商业可行性的短片创意包,包含核心冲突、角色小传与三幕式大纲,为后续分镜头自动化生成提供高质量输入基础。 2. 分镜头脚本的理论基础与AI适配逻辑 在影视创作中,分镜头脚本(Storyboard Script)是连接文学剧本与实际拍摄的核心桥梁。它不仅是导演视觉构想的具体化表达,更是摄影、灯光、美术、剪辑等多个部门协同工作的“作战地图”。传统上,这一过程依赖于导演或分镜师凭借经验将文字转化为图像与时间序列,但随着人工智能技

By Ne0inhk
2026年AI大模型应用开发保姆级教程:从入门到精通,这一篇开始

2026年AI大模型应用开发保姆级教程:从入门到精通,这一篇开始

🚀 AI大模型应用开发:从入门到精通的体系化学习路线 (2026版) 摘要: 随着ChatGPT、文心一言、通义千问等大模型的爆发,掌握AI大模型应用开发已成为开发者进阶、获取高薪的黄金技能!本文由深耕AI领域的ZEEKLOG专家撰写,为你梳理一条清晰、高效、可落地的学习路线,涵盖必备基础、核心理论、关键技术、工具链、项目实战全流程,助你从“小白”快速成长为能独立开发AI应用的高手!文末附赠精选学习资源清单! 📌 一、 为什么学习AI大模型应用开发? * 时代风口: AI大模型是当前科技革命的核心驱动力,重塑各行各业(办公、教育、医疗、金融、娱乐等),人才缺口巨大,薪资水平水涨船高。 * 降本增效: 利用大模型强大的生成、理解、推理能力,可以自动化大量重复性工作,大幅提升开发效率和产品智能化水平。 * 创新机遇: 大模型为开发者提供了前所未有的能力基石,催生无数创新应用场景(智能助手、个性化推荐、代码生成、内容创作、智能客服等)。 * 开发者必备技能: 未来,

By Ne0inhk

OpenClaw 快速上手: 从0到1 完整教程 (Clawdbot)—— 2026 革命性的开源个人AI智能体(Personal AI Agent)

OpenClaw 快速上手:从 0 到 1 完整技术教程 前言:什么是OpenClaw? OpenClaw是一款革命性的开源个人AI智能体(Personal AI Agent),它代表了人工智能助手领域的一次重大突破。与传统的云端AI助手不同,OpenClaw采用本地优先(Local-first)架构,所有数据和处理都在用户自有设备上完成,确保了绝对的隐私安全。这款工具的核心优势在于其系统级执行能力和全渠道交互特性,用户可以通过Telegram、WhatsApp、iMessage等日常聊天工具下达指令,AI助手则能够自动完成文件整理、代码部署、日程同步等复杂任务。 OpenClaw最初名为Clawdbot,由开发者@steipete创建,自发布以来迅速在技术社区引起轰动。截至2026年1月,该项目在GitHub上的星标数已突破4万,支持Windows、Mac、Linux及云服务器多平台部署。它的设计理念是让AI助手真正成为用户的数字同事,具备24/7全天候工作能力,能够主动处理各种任务,而不仅仅是被动响应指令。 文章目录 * OpenClaw 快速上手:从 0 到 1

By Ne0inhk
央妈推荐!2026年AI提效实战宝典《AI提效手册》深度解读与资源分享

央妈推荐!2026年AI提效实战宝典《AI提效手册》深度解读与资源分享

大家好,最近在人工智能工具应用领域,一本由人民邮电出版社出版的新书《AI提效手册》受到了广泛关注,并获得了权威媒体的推荐。 作为一名常年关注效率工具的技术爱好者,我第一时间对其内容进行了研读。这本书旨在为普通用户提供一站式的AI工具实战指南,特别聚焦于目前市面上主流的五款应用。 本文将为大家梳理该手册的核心内容与实用价值。手册核心内容概览这本《AI提效手册》是一本面向大众的实操性指南,它系统性地整合了以下五款热门AI工具的教学: * 豆包:侧重于智能对话与各类文本内容的创作。 * 即梦:专注于图像生成与平面设计方面的辅助。 * 剪映:讲解其在视频剪辑流程中集成的AI赋能功能。 * 飞书:探讨如何利用其智能特性提升办公与团队协作效率。 * 扣子:服务于编程开发场景的效率提升工具。 内容亮点与特色该书之所以值得推荐,在于其极强的实战性和丰富的学习资源,具体体现在: 1. 案例驱动,场景丰富:书中提供了超过100个实战案例,覆盖了工作汇报、学习笔记与生活规划等多个核心场景,便于读者即学即用。 2. 提示词(Prompt)模板库:附有1000余条开箱即用的提示词模板,能

By Ne0inhk