跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
Shell / BashAI算法

小米智能家居 Miloco 分离式部署指南

综述由AI生成在 Windows、macOS 或 Linux 环境下,通过 Docker 部署小米智能家居 Miloco 后端及视觉大模型的方法。内容包括环境准备、Docker Compose 配置、LM Studio 本地模型部署以及与 Miloco 后端的对接流程。同时提供了规划模型的云端接入方案及模型选择建议,帮助用户实现分离式部署。

SecGuard发布于 2026/4/6更新于 2026/5/2345 浏览

一、安装环境

  • Windows 用户:安装 WSL2 以及 Docker
  • macOS/Linux 用户:安装 Docker 具体步骤可参考官方文档。Windows 用户需将 WSL2 的网络模式设置为 Mirrored。

二、使用 Docker 部署 Miloco 后端

以下均为 bash 命令。请 Windows 用户进入 WSL2 / Linux、macOS 用户进入终端操作:

mkdir miloco
cd miloco
vi docker-compose.yml

以下是 compose 的内容:

services:
  backend:
    container_name: miloco-backend
    image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest
    network_mode: host
    expose:
      - ${BACKEND_PORT:-8000}
    environment:
      - BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}
      - BACKEND_PORT=${BACKEND_PORT:-8000}
      - AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}
      - AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}
      - BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}
      - TZ=${TZ:-Asia/Shanghai}
    volumes:
      - ./data:/app/miloco_server/.temp
      - ./log/backend:/app/miloco_server/.temp/log
    restart: unless-stopped
    healthcheck:
      disable: true

再创建 .env 文件:

vi .
env

以下是 .env 的内容:

TZ=Asia/Shanghai
BACKEND_HOST=0.0.0.0
BACKEND_PORT=8000
BACKEND_LOG_LEVEL=info
AI_ENGINE_HOST=0.0.0.0
AI_ENGINE_PORT=8001
AI_ENGINE_LOG_LEVEL=info

继续执行命令:

mkdir -p data
mkdir -p log/backend
docker compose up -d

等待镜像下载及服务启动。

三、部署视觉大模型

建议使用 LM Studio 或 Ollama 来部署 GGUF 版的 VL 模型。若拥有高性能 NVIDIA 显卡(显存>=24G),可使用 vLLM 或 SGLang 进行生产级服务部署。此处以 LM Studio 为例。

下载并安装 LM Studio

访问 https://lmstudio.ai/ 下载安装。

设置及下载模型
  1. 点击界面右下角设置图标。
  2. App Settings-General-Language-简体中文。
  3. App Settings-Developer-启用本地 LLM 服务。
检查环境安装情况

在设置页-Runtime 查看支持的运行时:

  • NVIDIA 用户:Vulkan llama.cpp, CUDA llama.cpp, CPU llama.cpp 等。
  • AMD 用户:Vulkan llama.cpp, ROCm llama.cpp, CPU llama.cpp 等。
  • 苹果用户:Vulkan llama.cpp, Metal llama.cpp, MLX llama.cpp, CPU llama.cpp 等。
下载模型

Model Search-搜索框中输入:xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF 点击右下角 Download 即可。

运行模型并提供 API 服务
  1. 下载完成后点击页面左侧'开发者'(绿色终端图标)。
  2. 点击页面顶部加载模型。
  3. 确认状态为 READY。
  4. 将开关从 Stopped 切换至 Running。
  5. 点击 Server Settings,打开'在网络中提供服务'。
  6. 复制右侧 Reachable at 中的局域网地址,如:http://192.168.50.210:1234。

四、与 Miloco 对接

假设 Docker 宿主机 IP 为 192.168.50.123,访问 https://192.168.50.123:8000/。首次登录需填写 callback 地址为 192.168.50.123:8000。

对接 VL 模型

点击模型管理 - 云端模型 - 添加模型:

  • Base URL 输入 http://192.168.50.210:1234/v1
  • API Key 随意填写
  • 模型 ID 填 xiaomi-mimo-vl-miloco-7b,点击添加。
  • 完成后在上方'视觉理解大模型'中选择 云端:xiaomi-mimo-vl-miloco-7b。
对接规划模型

若本地资源不足,可使用云端大模型。

  1. 访问 https://cloud.siliconflow.cn/,注册并登录。
  2. 生成 API 密钥(sk 开头)。
  3. 添加云端模型:
    • Base URL 输入 https://api.siliconflow.cn/v1
    • API Key 填入生成的密钥
    • 模型 ID 选 Qwen/Qwen3-8B
  4. 完成后在上方'规划大模型'中选择 云端:Qwen/Qwen3-8B。

五、注意事项

  • 规划模型可选择调用工具更稳定的版本,如 Kimi K2、Minimax M2 等。Qwen3-8B 作为入门选项可能无法稳定调用工具。
  • VL 模型若有条件可尝试部署全精度版本,使用 vLLM 提供服务以获得更佳体验。
  • 官方文档推荐的安装方式集成了 AI Engine,本质上是对 llama.cpp 的封装。分离式部署大模型服务更灵活。

目录

  1. 一、安装环境
  2. 二、使用 Docker 部署 Miloco 后端
  3. 三、部署视觉大模型
  4. 下载并安装 LM Studio
  5. 设置及下载模型
  6. 检查环境安装情况
  7. 下载模型
  8. 运行模型并提供 API 服务
  9. 四、与 Miloco 对接
  10. 对接 VL 模型
  11. 对接规划模型
  12. 五、注意事项
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Web 安全实战:PHP 弱类型与正则替换漏洞分析
  • 2022 CSP-S 提高组策略游戏真题及题解
  • ICCV 2023 CleanCLIP:消除多模态对比学习中的数据中毒攻击
  • Python 异步编程与协程实战指南
  • R语言在AIGC时代的数据科学应用与优势
  • Android项目框架搭建与模块化设计
  • 黄民烈:AI 赋能精神心理健康服务与数字疗法实践
  • 【Spring Boot开发实战手册】掌握Springboot开发技巧和窍门(十三)前端匹配界面、后端匹配WebSocket
  • Java 21 虚拟线程压测全记录与性能分析
  • Ubuntu 22.04 安装 ROS2 Humble 环境配置指南
  • 2024 年中国 AI 大模型场景探索及产业应用调研报告
  • C/C++ 局部、静态局部及全局变量区别与使用场景
  • Flutter 与 React Native 跨平台移动应用开发技术对比指南
  • openclaw新手入门指南:一文看懂环境搭建、模型配置与 WebUI 远程访问
  • VSCode Copilot 代码补全准确率优化实战指南
  • YOLO26 实时目标检测关键架构改进与性能基准测试
  • Python 使用 SMTP 网关发送 MMS 多媒体消息教程
  • 前端开发者 AI 编码工具共享插件:Claude Code、Codex 与 OpenClaw
  • OpenClaw 开源助手变现案例:10 个真实模式与部署指南
  • 开源全球情报监控平台 World Monitor 技术架构解析

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online