全屋智能家居的'主动思考':Miloco 部署指南
目前的智能家居大多处于'被动执行'阶段。智能灯靠感应或语音控制,空调需远程开启,摄像头只能看画面却无法理解场景。它们更像是听话的执行者,缺乏一个能主动理解生活习惯、进行场景判断的'大脑'。
小米近期推出的 Miloco(Xiaomi Local Copilot)正是为了解决这一问题。它通过大模型技术,将米家摄像头的视觉信息转化为理解能力,打通全屋 IoT 设备,实现从'执行命令'到'理解场景'的跨越。
关于 Miloco

🔺Miloco 是小米探索的智能家居未来方案之一。其核心在于利用端侧大模型与视觉数据流,解析家庭场景事件并自主决策。
主要特性:
- 交互新范式:基于自然语言交互完成规则设置与复杂指令控制。
- 端侧大模型:任务拆分规划与视觉理解双阶段处理,支持小米自研端侧模型,保障隐私安全。
- 视觉数据应用:以摄像头数据流为感知源,解析家庭场景事件回复用户查询。
- 米家生态打通:支持获取与执行米家设备及场景,支持自定义通知发送。
简单来说,Miloco 能让摄像头变成有思维的管家。例如识别你坐在书桌前自动开灯调光,躺在床上切换睡眠模式,离家后自动关灯关空调,甚至识别宠物异常行为并推送提醒。
部署方案选择
Miloco 服务分为主服务和 AI 引擎两部分,均支持 Docker 本地部署。根据 AI 推理方式不同,主要有两种方案:
- 云端 AI 大模型:仅部署主服务。所有 AI 推理交给云端,资源占用极低,适合大多数 NAS 用户,无需独显。
- 本地 AI 大模型:同时部署主服务和 AI 引擎。需要下载大模型至本地,由 NAS 算力完成视觉理解。对硬件要求较高,需 NVIDIA 30 系及以上显卡(显存 8G+),驱动及 CUDA 版本也有特定要求。
考虑到通用性,本文采用云端 AI 大模型方案,即只部署主服务,无独显门槛,几乎任何极空间 NAS 均可运行。
部署准备
- 米家摄像头:需要一个正常联网且运行中的米家摄像头作为视觉输入源。
- API Key:由于调用云端大模型,需准备具备视觉推理能力的多模态模型 API。推荐使用硅基流动等提供统一 API 调用的平台。
开始部署
在极空间 NAS 的文件管理器中,于 Docker 目录下新建 miloco 文件夹,并在其下创建 data 和 log 两个子目录。
随后进入 Docker 应用,点击【Compose】>【新增项目】。在配置页面输入以下 docker-compose.yml 内容:
services:
backend:
container_name: miloco-backend
image: ghcr.io/xiaomi/miloco-backend:latest
network_mode: host
environment:
- BACKEND_HOST=0.0.0.0


