AI agent:介绍 PicoClaw 安装,使用说明

PicoClaw 是一个超轻量级的个人 AI 助手,可以用在从嵌入式开发板到普通电脑的各类设备上。它最吸引人的特点就是极低的资源占用飞快的启动速度。下面我来为你详细介绍它的安装和使用方法。

📖 PicoClaw 简介

PicoClaw 由矽速科技(Sipeed)开发,使用 Go 语言编写。它的核心优势在于,通过将计算密集的大模型推理任务交给云端 API,本地只负责轻量的协调工作,从而实现了惊人的轻量化。

特性OpenClawNanoBotPicoClaw
编程语言TypeScriptPythonGo
内存占用>1GB>100MB< 10MB
启动时间 (0.8GHz核心)>500秒>30秒<1秒
硬件成本参考Mac Mini (约$599)多数Linux开发板 (~$50)任意Linux板 (最低$10)

📦 安装指南

你可以根据自己的需求和环境,选择以下任意一种方式安装。

  • 💾 方式一:预编译二进制(最简单)
    直接从项目的 Releases 页面 下载对应你操作系统和架构(如 linux-arm64, windows-amd64)的文件,重命名为 picoclaw(或 picoclaw.exe),并放到系统 PATH 路径下即可。

🐳 方式三:使用 Docker(环境隔离,快速体验)
这是最干净、依赖最少的方法,非常适合快速上手。

# 1. 克隆仓库git clone https://github.com/sipeed/picoclaw.git cd picoclaw # 2. 复制并编辑配置文件(填入你的API Key)cp config/config.example.json config/config.json # 编辑 config.json 文件,填入你的 LLM API Key 等信息vim config/config.json # 3. 使用 Docker Compose 启动网关服务docker compose --profile gateway up -d

🔧 方式二:从源码编译(适合开发者)
如果你想要体验最新特性,或者你的设备架构特殊,可以自行编译:

git clone https://github.com/sipeed/picoclaw.git cd picoclaw make deps make build # 编译makeinstall# 安装到系统

⚙️ 配置 PicoClaw

安装完成后,需要进行初始化和配置。

    • 获取 API Key:可以从 智谱 AIOpenRouter 等平台获取。
    • (可选)配置网络搜索:如果想让它能联网查资料,可以获取一个免费的 Brave Search API Key 并填入配置。

配置文件:编辑 ~/.picoclaw/config.json 文件,这是核心步骤。你需要至少配置一个 LLM 提供商(如智谱、OpenRouter)的 API Key。一个最小化的配置示例如下(以智谱 AI 为例):

{"agents":{"defaults":{"model":"glm-5",// 或其他模型名"max_tokens":8192}},"providers":{"zhipu":{"api_key":"你的智谱API Key","api_base":"https://open.bigmodel.cn/api/paas/v4"}}}

初始化:运行以下命令,它会在你的用户目录下创建 ~/.picoclaw/ 文件夹和默认配置文件。

picoclaw onboard 

🚀 使用场景

配置好之后,你就可以用多种方式和你的 AI 助手交互了。

  • 💬 本地命令行对话
  • 🤖 接入聊天平台(网关模式)
    这是 PicoClaw 最实用的功能之一,可以让你通过 Telegram、Discord 等日常 App 与 AI 助手聊天。
  • ⏰ 高级功能:定时任务与个性化
    • 自定义人格:通过修改 ~/.picoclaw/workspace/ 下的 AGENTS.mdSOUL.md 文件,可以用自然语言定义助手的性格、技能和行为准则,无需编写代码。

定时任务(cron):你可以设置让助手定时执行任务,比如每天早上9点提醒你今天的日程。

picoclaw cronadd--message"提醒我今天的重要会议"--cron"0 9 * * 1-5"

启动网关服务:

picoclaw gateway 

如果是 Docker 安装,网关通常已经后台运行了。之后,你就可以在手机上随时随地和你的 AI 助手对话了。

~/.picoclaw/config.json 文件中,找到 channels 部分,填入你创建的 Telegram Bot Token 和你的用户 ID。

{"channels":{"telegram":{"enabled":true,"token":"你的Telegram Bot Token","allowFrom":["你的Telegram用户ID"]}}}

交互式对话:进入连续的聊天模式。

picoclaw agent 

一次性提问:适合快速查询。

picoclaw agent -m"介绍一下皮皮虾的特点"

希望这份指南能帮你顺利上手 PicoClaw。


AI agent : picoclaw 在 Win 10 上如何编译?

我查阅了相关资料,目前还没有找到关于在 Windows 10 上从源码编译 PicoClaw 的官方指南。

不过,PicoClaw 是一个用 Go 语言编写的项目,它会编译成一个单一的可执行文件 。因此,你可以通过以下两种方式在 Windows 10 上获得它:

🛠️ 方法一:从源码自行编译(通用方法)

如果你的目标确实是自行编译,可以尝试标准的 Go 语言编译流程。由于 PicoClaw 的项目结构包含 go.mod 文件,编译过程应该比较直接。

你可以打开命令提示符或 PowerShell,执行以下步骤:

  1. 安装 Go 环境:确保你的 Windows 10 系统已安装 Go(推荐 1.16 及以上版本)。

编译项目:在项目根目录下执行 go build 命令,Go 会自动下载依赖并生成可执行文件。

go build -o picoclaw.exe 

获取源码

git clone https://github.com/picoclaw/picoclaw.git cd picoclaw 

⚡ 方法二:直接下载预编译版本(推荐)

如果你主要是想使用 PicoClaw 而非参与源码开发,更简单的方法是直接下载官方提供的 Windows 预编译版本。根据相关资料,PicoClaw 提供了 Windows 的二进制文件 。

  1. 下载文件:从 PicoClaw 的 GitHub Releases 页面下载 picoclaw-windows-amd64.exe
  2. 放置与重命名:将下载的文件放到一个方便的目录,例如 C:\picoclaw,并将其重命名为 picoclaw.exe
  3. 初始化工作区:在 picoclaw.exe 所在目录打开命令提示符,运行 picoclaw init 命令生成配置文件和工作区 。
  4. 配置 API 密钥:编辑生成的配置文件(默认路径为 C:\Users\你的用户名\.picoclaw\workspace\config.json),填入你的 LLM API 密钥(如 OpenAI、DeepSeek 或本地 Ollama)。
  5. 运行:最后,执行 picoclaw run 即可开始使用 。

💡 建议

如果你在编译过程中遇到任何问题,或者想了解更详细的配置方法(比如如何接入 Telegram 或配置本地 Ollama),可以查阅我找到的这份完整指南 。另外,建议去 PicoClaw 的官方 GitHub 仓库看看,通常 README.mdCONTRIBUTING.md 文件里会包含最权威的编译说明。

你是想参与开发所以需要编译,还是主要为了使用它?如果是后者,直接下载编译好的版本会省事很多。


我的实践经验

先下载 go1.25.x.windows-amd64.msi , 然后安装。
where go
D:\Go\bin\go.exe
where gmake
D:\Strawberry\c\bin\gmake.exe
D:
cd D:\AI\picoclaw-main
D:\AI\picoclaw-main> gmake deps
all modules verified
D:\AI\picoclaw-main> gmake build
Run generate…
Run generate complete
Building picoclaw for MSYS_NT-10.0/x86_64…

github.com/sipeed/picoclaw/pkg/tools
github.com/sipeed/picoclaw/pkg/heartbeat
github.com/sipeed/picoclaw/pkg/agent
github.com/sipeed/picoclaw/cmd/picoclaw
Build complete: build/picoclaw-MSYS_NT-10.0-x86_64

D:\AI\picoclaw-main> cd build
D:\AI\picoclaw-main\build> dir
2026/02/20 00:11 17,773,056 picoclaw
2026/02/20 00:11 17,773,056 picoclaw-MSYS_NT-10.0-x86_64
rename picoclaw picoclaw.exe

D:\AI\picoclaw-main\build> picoclaw onboard
🦞 picoclaw is ready!

Next steps:

  1. Add your API key to C:\Users\your.picoclaw\config.json
    Get one at: https://openrouter.ai/keys
  2. Chat: picoclaw agent -m “Hello!”

Read more

video-subtitle-remover(VSR)-- 开源AI去字幕方案深度解析

video-subtitle-remover(VSR)-- 开源AI去字幕方案深度解析

一、从“硬字幕”说起:为什么我们需要 VSR? 在视频剪辑、二创和影视加工场景里,“硬字幕”(内嵌到画面里的字幕)一直是特别棘手的问题: * 你无法通过关闭字幕轨道来清除; * 直接裁剪会破坏画面构图; * 简单模糊/马赛克又会在画面上留下明显的“补丁”。 传统做法要么牺牲画质,要么牺牲效率。而开源项目 video-subtitle-remover(VSR),则直接把问题拉到了“AI 视频修复”的维度:用深度学习模型自动检测字幕区域,再通过图像修复算法把文字“擦掉”,并用背景自然填补。 项目核心信息(来自 README): * 功能定位:- 去除视频 / 图片中的硬字幕、文本水印 * 无损分辨率输出 * 支持自定义字幕区域,或全视频自动去除所有文本 * 技术特点:- 完全本地运行,无需调用第三方 API * 支持多种 GPU 加速(CUDA / DirectML

【用AI学Agent】Agent入门前置:大模型基础(开发向)

【用AI学Agent】Agent入门前置:大模型基础(开发向)

首先欢迎大家点进文章,其次 申明:本系列内容是作者通过AI学习Agent得到的内容,如若有错误之处,欢迎批评指正 很多想入门AI Agent开发的朋友,例如我,第一步就被“大模型”的各种概念绕晕——上下文窗口、Token、温度、思维链,这些到底是什么?和Agent有什么关系? 其实不用慌,Agent的核心是“让AI自主做事”,而大模型(LLM)就是Agent的“大脑”——不懂大脑的工作原理,后续学RAG、工具调用、Agent架构都会很吃力。 这篇博客专门为Agent学习者打造,包含开发中能直接用到的大模型基础知识点,从“是什么”到“怎么用”,帮你夯实Agent入门的第一块基石。 一、大模型(LLM)到底是什么? * 很多人对大模型的理解有误区,觉得它“无所不能”,能像人一样思考、理解世界; * 也有人觉得它“只是个问答机器人”,没必要深入学习。 其实这两种想法都不对。 用最通俗的话讲:

零基础学AI大模型之Milvus索引实战

零基础学AI大模型之Milvus索引实战

大家好,我是工藤学编程 🦉一个正在努力学习的小博主,期待你的关注实战代码系列最新文章😉C++实现图书管理系统(Qt C++ GUI界面版)SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK)AI大模型零基础学AI大模型之Milvus实战:Attu可视化安装+Python整合全案例 前情摘要 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础学AI大模型之La

A2UI 技术原理深度解析:AI Agent 如何安全生成富交互 UI

本文深入解析 Google 开源的 A2UI 协议,探讨其核心架构、数据流设计以及为何它是 LLM 生成 UI 的最佳实践。 一、A2UI 是什么? A2UI (Agent-to-User Interface) 是 Google 于 2025 年开源的声明式 UI 协议。它解决了一个核心问题: 如何让 AI Agent 安全地跨信任边界发送富交互 UI? 传统的 Agent 交互往往是纯文本对话,效率低下。而直接让 LLM 生成 HTML/JS 代码又存在严重的安全风险。A2UI 提供了一个中间方案:Agent 发送声明式 JSON 描述 UI 意图,客户端使用自己的原生组件渲染。 安全性: