ClawdBot 开源镜像:300MB 轻量级 Docker 容器,含 Whisper tiny+PaddleOCR
1. 为什么 ClawdBot 值得你花 5 分钟部署
1.1 它不是'又一个聊天机器人'
ClawdBot 的设计哲学很朴素:AI 应该像电一样即插即用,而不是需要建电站才能点亮一盏灯。
- 它不强制你注册云服务、不绑定手机号、不上传对话记录;
- 它不依赖 GPU 服务器——树莓派 4B 实测支持 15 人并发,普通笔记本开个终端就能跑;
- 它不只做文字聊天——语音、图片、群聊指令、快捷查询,全部离线完成;
- 它不让你改配置文件到怀疑人生——docker-compose.yml 里填好 Token,
docker compose up -d,完事。
换句话说,ClawdBot 解决的是'最后一公里'问题:大模型能力已经有了,但怎么让普通人真正用起来?它的答案是:把所有复杂性封进镜像,把所有控制权交还给你。
1.2 轻量,但不简陋:300MB 里装了什么
别被'300MB'骗了——这可不是阉割版。这个镜像完整包含:
- vLLM 推理后端:专为高吞吐低延迟优化,支持 Qwen3-4B 等主流开源模型,响应快于传统 FastChat;
- Whisper tiny 本地转写:语音→文字全程离线,0.5 秒内完成 10 秒语音转录,准确率对日常对话足够友好;
- PaddleOCR v2.7 轻量版:支持中英文混合识别,单张图 OCR 平均耗时<800ms(CPU 模式),识别结果直接喂给翻译引擎;
- 多协议网关层:同时暴露 OpenAI 兼容 API、WebSocket 流式接口、HTTP RESTful 路由,前端、Telegram Bot、自研 App 都能接;
- 内置 CLI 工具链:
clawdbot devices approve、clawdbot models list、clawdbot dashboard——所有操作都在终端里完成,无需打开浏览器点来点去。
它没装的东西更关键:没有 TensorRT、没有 DeepSpeed、没有 CUDA 12.4 以上强依赖——这意味着你在 Ubuntu 22.04、Debian 12、甚至 WSL2 里都能原生运行。
1.3 和 MoltBot 的关系:一个网关,两种形态
你可能注意到文档里反复出现 MoltBot——它不是 ClawdBot 的竞品,而是它的首个落地应用形态。
- ClawdBot 是底层 AI 网关:提供模型调度、多模态输入处理、协议转换、权限管理等基础设施;
- MoltBot 是运行在其上的 Telegram 机器人应用:调用 ClawdBot 的 OCR 接口解析图片、调用 Whisper 转写语音、调用 vLLM 翻译文本,再把结果发回 Telegram。
你可以把 ClawdBot 理解成

