树莓派 4 部署 ClawdBot 与 MoltBot:本地 OCR/Whisper/vLLM 高并发实践
1. 什么是 ClawdBot?一个真正属于你的本地 AI 助手
ClawdBot 不是另一个云端 API 包装器,也不是需要注册账号、绑定手机号的 SaaS 服务。它是一个你完全掌控的个人 AI 助手——所有计算发生在你自己的设备上,消息不上传、模型不调用第三方服务、对话历史默认不留存。你可以把它装在树莓派 4 里放在书桌角落,也可以部署在老旧笔记本上作为家庭 AI 中枢,甚至塞进一台闲置的 NUC 里变成办公室智能前台。
它的核心设计哲学很朴素:AI 能力应该像电和水一样,成为你设备的底层能力,而不是需要反复登录的远程服务。当你在终端输入 clawdbot devices list,看到的是真实连接到你本地机器的设备列表;当你执行 clawdbot models list,列出的是正在你内存中运行的 vLLM 实例;当你在 Telegram 里发一条语音,转写、翻译、响应全过程都在你家里的树莓派上完成——没有数据离开你的局域网。
这种'本地即服务'的模式,带来三个实实在在的好处:一是隐私可控,聊天内容、图片、语音全部留在自己设备;二是响应确定,不依赖网络抖动或服务商限流;三是可定制性强,从模型选择到工作流编排,全由你定义。而 ClawdBot 的核心优势在于:它把原本需要三台服务器分别承载的能力,压缩进了单块树莓派 4B(4GB 内存版)里,并稳定支撑 15 人并发使用——这背后是工程优化的真实结果。
2. MoltBot:Telegram 上的全能翻译官,5 分钟上线
2.1 一句话看懂它能做什么
Star 2k、MIT 协议、5 分钟搭好 Telegram 全能翻译官——语音转文字、图片识字、100+ 语言互译、查天气、换汇率、搜维基,一条 Docker 命令全搞定。
MoltBot 是开源的轻量级多模态 Telegram 机器人,定位非常清晰:不做大而全的 AI 平台,只做一件事——让你的群聊和私聊瞬间获得跨语言沟通能力。它不追求参数量最大、不堆砌前沿技术名词,而是把 Whisper tiny、PaddleOCR 轻量版、LibreTranslate 本地引擎打包进一个 300MB 的 Docker 镜像,在树莓派 4 上实测 15 用户并发无卡顿、无排队、无超时。
2.2 它到底有多'零配置'?
所谓'零配置',不是跳过所有设置,而是把 90% 的通用配置固化在镜像里,只留最关键的几个开关给你:
- 语音翻译:用户发送语音 → 本地 Whisper tiny 实时转写 → 自动识别语种 → 调用双引擎翻译(LibreTranslate 为主,Google Translate 为 fallback)→ 返回译文
- 图片 OCR 翻译:用户发送截图/商品图/菜单照 → PaddleOCR 轻量模型识别文字 → 自动检测源语言 → 翻译 → 返回带原文标注的译文图
- 快捷查询:
/weather 上海返回实时天气;/fx 100 USD to CNY返回汇率;/wiki 量子计算返回维基摘要
所有这些能力,不需要你下载模型、不用配 CUDA、不改一行 Python 代码。只需一条命令:
docker run -d \
--name moltbot \
-e TELEGRAM_BOT_TOKEN="your_bot_token_here" \
-e TZ=Asia/Shanghai \
-p 8000:8000 \
-v /path/to/config:/app/config \
--restart=always \
moltbot/moltbot:latest
启动后,你的 Telegram 机器人就活了。群聊中@它发语音,0.8 秒内收到文字译文;私聊发一张餐厅菜单照片,几秒后返回中英双语标注图——整个过程,你的数据没离开过本地网络。
2.3 为什么树莓派 4 能扛住 15 人并发?
很多人第一反应是:'树莓派 4 才 4GB 内存,跑 OCR+Whisper+vLLM?开什么玩笑。'但 MoltBot 的工程取舍非常务实:
- Whisper 用的是
tiny版本(仅 15MB),推理延迟<300ms,CPU 占用峰值<60% - PaddleOCR 用的是
PP-OCRv4轻量版,单图识别<1.2 秒,支持中文优先识别 - 翻译引擎 LibreTranslate 本地部署,不依赖网络请求,纯 CPU 运算

