ClawdBot 开源镜像：300MB 轻量级 Docker 容器，集成 Whisper tiny 与 PaddleOCR

ClawdBot 的设计哲学很朴素：AI 应该像电一样即插即用，而不是需要建电站才能点亮一盏灯。

换句话说，ClawdBot 解决的是'最后一公里'问题：大模型能力已经有了，但怎么让普通人真正用起来？它的答案是：把所有复杂性封进镜像，把所有控制权交还给你。

别被'300MB'骗了——这可不是阉割版。这个镜像完整包含：

vLLM 推理后端：专为高吞吐低延迟优化，支持 Qwen3-4B 等主流开源模型，响应快于传统 FastChat；
Whisper tiny 本地转写：语音→文字全程离线，0.5 秒内完成 10 秒语音转录，准确率对日常对话足够友好；
PaddleOCR v2.7 轻量版：支持中英文混合识别，单张图 OCR 平均耗时<800ms（CPU 模式），识别结果直接喂给翻译引擎；
多协议网关层：同时暴露 OpenAI 兼容 API、WebSocket 流式接口、HTTP RESTful 路由，前端、Telegram Bot、自研 App 都能接；
内置 CLI 工具链：clawdbot devices approve、clawdbot models list、clawdbot dashboard——所有操作都在终端里完成，无需打开浏览器点来点去。

它没装的东西更关键：没有 TensorRT、没有 DeepSpeed、没有 CUDA 12.4 以上强依赖——这意味着你在 Ubuntu 22.04、Debian 12、甚至 WSL2 里都能原生运行。

你可能注意到文档里反复出现 MoltBot——它不是 ClawdBot 的竞品，而是它的首个落地应用形态。

ClawdBot 是底层 AI 网关：提供模型调度、多模态输入处理、协议转换、权限管理等基础设施；
MoltBot 是运行在其上的 Telegram 机器人应用：调用 ClawdBot 的 OCR 接口解析图片、调用 Whisper 转写语音、调用 vLLM 翻译文本，再把结果发回 Telegram。

你可以把 ClawdBot 理解成

更多推荐文章