本地化部署 ClawdBot 构建粤语英语双向翻译机器人

为什么需要一个'懂粤语'的翻译机器人？

在北美、澳洲、英国等地的华人社区，尤其是老一辈移民和本地出生的华裔青少年之间，语言断层正变得越来越明显。微信群里长辈发来大段粤语语音，年轻人听不懂；孩子用英语写的作业，爷爷奶奶想帮忙却卡在第一句；社区公告用粤语发布，新移民只能靠猜……这不是技术问题，而是日常生活的切实障碍。

市面上的通用翻译工具——比如手机自带的翻译 App 或网页版服务——往往对粤语支持极弱：语音识别错误率高、文字翻译生硬、无法理解'埋单''执笠''甩辘'这类地道表达，更别说在群聊中实时响应、自动识别语种、处理图片菜单或语音点菜录音了。

ClawdBot + MoltBot 的组合，正是为解决这个'最后一公里'而生：它不追求覆盖全球 200 种语言，而是专注把粤语和英语之间的沟壑填平，且所有能力都运行在你自己的设备上——没有云端上传、没有语音外泄、没有 OCR 图片流到第三方服务器。它不是'又一个翻译 API'，而是一个真正属于社区的、可信任的语言伙伴。

技术底座：ClawdBot 是什么？它和 MoltBot 怎么配合？

ClawdBot：你的本地 AI 网关中枢

ClawdBot 不是一个模型，也不是一个聊天界面。它更像一台'AI 交通调度中心'——负责统一接入、路由、编排和管控所有后端 AI 能力。你可以把它理解成一个轻量级的本地 API 网关 + 控制面板 + 模型调度器。

它本身不生成文字，但决定'谁来生成'：当一条粤语消息进来，ClawdBot 会根据配置，把请求转发给本地部署的 vLLM 实例；当一张餐厅菜单图片发来，它会调用 PaddleOCR 提取文字，再交给翻译模块；当用户输入 /weather Toronto，它直接调用内置服务，不经过任何大模型。

关键特性很实在：

完全离线运行：所有模型、OCR、语音转写都在本机完成，树莓派 4、NUC 迷你主机、甚至一台旧笔记本都能跑起来；
零依赖前端：Web 控制台（Dashboard）纯静态页面，通过 WebSocket 与后端通信，无需 Node.js 或 Python Web 框架；
模型即插即用：支持 OpenAI 兼容接口（如 vLLM、Ollama、LMStudio），也支持自定义 HTTP 模型服务；
权限可控：每个设备连接需手动批准（clawdbot devices approve），杜绝未授权访问。

一句话记住它：ClawdBot 是让本地 AI 能力'活起来'的操作系统——看不见它，但离开它，所有模型都只是孤岛。

MoltBot：专为 Telegram 社区打造的多模态翻译引擎

MoltBot 是 2025 年开源的 Telegram 原生翻译机器人，核心定位非常清晰：不做通用助手，只做最懂群聊的翻译官。

它不是从头训练模型，而是聪明地整合成熟开源能力：

翻译引擎双保险：主用 LibreTranslate（本地化部署，支持粤语→英语/英语→粤语），失败时自动 fallback 到 Google Translate（需网络）；
语音转写：集成 Whisper tiny 模型，30 秒语音本地转文字仅耗时 1.2 秒，准确率对粤语口音友好；
图片 OCR：PaddleOCR 轻量版，识别菜单、路牌、药品说明书上的中英粤混排文字稳定可靠；
快捷服务：/weather 查本地天气（自动定位城市）、/fx 100 USD 查实时汇率、/wiki dim sum 直接返回维基摘要——这些都不是调用大模型'编'的，而是结构化数据直查。

最打动社区运营者的一点：一条命令上线，五分钟后就能在群里用。

docker run -d \
 --name moltbot \
 -e TELEGRAM_BOT_TOKEN="your:token" \
 -e LIBRETRANSLATE_URL="http://localhost:5000" \
 -p 5000:5000 \
 -v $(pwd)/models:/app/models \
 moltbot/moltbot:latest

功能	ClawdBot 承担角色	MoltBot 承担角色
接收用户输入	提供 Web 控制台、API 接入点	接收 Telegram 消息、语音、图片
语言识别	可配置规则（如'含'咗'字则判粤语'）	自动检测群聊中任意消息语种
翻译执行	路由至 vLLM / LibreTranslate	调用 LibreTranslate API 或本地服务
多模态处理	启动 OCR / Whisper 子进程	封装调用逻辑，返回结构化结果
用户交互	仅管理员可见的 Dashboard	面向所有群成员的 Telegram Bot

现象	可能原因	解决方法
Dashboard 打不开	设备未批准	`clawdbot devices list` → `approve`
Telegram 无响应	MoltBot 未连上 LibreTranslate	`curl http://localhost:5000/health` 检查服务状态
语音翻译慢	Whisper 模型未加载	检查 `moltbot` 容器日志，确认 `whisper-tiny` 是否启动成功
图片 OCR 失败	PaddleOCR 模型路径错误	进入容器 `ls /app/models/paddleocr/`，确认 `ch_ppocr_mobile_v2.0_det_infer/` 等目录存在
翻译结果不地道	缺少粤语语境提示	检查 `/app/workspace/prompt_yue_en.txt` 是否被正确读取

本地化部署 ClawdBot 构建粤语英语双向翻译机器人