跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
Shell / BashAI算法

小米智能家居 Miloco 分离式部署指南

综述由AI生成小米智能家居 Miloco 系统支持分离式部署架构,允许用户独立配置后端服务与视觉/规划大模型。本方案演示了基于 Docker 的环境搭建流程,结合 LM Studio 或 vLLM 提供本地推理能力,并对接云端 API 完成规划任务。该方式提升了部署灵活性,适用于希望优化资源占用或定制模型体验的开发者场景。

追风少年发布于 2026/3/24更新于 2026/5/74 浏览

一、安装环境

  • Windows 用户:安装 WSL2 以及 Docker
  • macOS/Linux 用户:安装 Docker

具体安装步骤网上教程较多,此处不再赘述。特别地,对于 Windows 用户,建议将 WSL2 的网络模式设置为 Mirrored。

二、使用 Docker 部署 Miloco 后端

以下命令请在 WSL2 / Linux 终端或 macOS 终端中执行:

mkdir miloco
cd miloco
vi docker-compose.yml

编辑 docker-compose.yml 文件,内容如下(不熟悉 vi 的用户可先按 i 进入插入模式,粘贴后按 Esc,输入 :wq 保存退出):

services:
  backend:
    container_name: miloco-backend
    image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest
    network_mode: host
    expose:
      - ${BACKEND_PORT:-8000}
    environment:
      - BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}
      - BACKEND_PORT=${BACKEND_PORT:-8000}
      - AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}
      - AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}
      - BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}
      - TZ=${TZ:-Asia/Shanghai}
    volumes:
      - ./data:/app/miloco_server/.temp
      - ./log/backend:/app/miloco_server/.temp/log
    restart: unless-stopped
    healthcheck:
      disable: true

接着创建 .env 配置文件:

vi .env

内容如下:

TZ=Asia/Shanghai
BACKEND_HOST=0.0.0.0
BACKEND_PORT=8000
BACKEND_LOG_LEVEL=info
AI_ENGINE_HOST=0.0.0.0
AI_ENGINE_PORT=8001
AI_ENGINE_LOG_LEVEL=info

最后执行启动命令:

mkdir -p data
mkdir -p log/backend
docker compose up -d

等待镜像下载完成并运行即可。

三、部署视觉大模型

对于普通用户,推荐使用 LM Studio 部署 GGUF 格式的 VL 模型。若拥有高性能 NVIDIA 显卡(显存 >= 24G),建议使用 vLLM 或 SGLang 进行生产级服务部署。

下载与安装 LM Studio

访问官网下载安装程序。

设置及模型下载
  1. 点击右下角设置图标。
  2. App Settings-General-Language 选择简体中文。
  3. App Settings-Developer 启用本地 LLM 服务。
  4. 在设置页 Runtime 检查环境支持情况(NVIDIA/AMD/Apple 用户均有对应选项)。
  5. Model Search 搜索 xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF 并下载。
运行模型并提供 API 服务
  1. 下载完成后点击左侧开发者图标(绿色终端)。
  2. 点击顶部加载模型,状态显示 READY 后开启 Server。
  3. 点击 Server Settings,打开'在网络中提供服务'。
  4. 复制右侧 Reachable at 中的地址,例如 http://192.168.50.210:1234。

四、与 Miloco 对接

假设 Docker 宿主机 IP 为 192.168.50.123,访问 https://192.168.50.123:8000/。首次登录需填写 Callback 地址为 192.168.50.123:8000。

对接 VL 模型

点击模型管理 - 云端模型 - 添加模型:

  • Base URL 输入 http://192.168.50.210:1234/v1
  • API Key 随意填写
  • 模型 ID 填 xiaomi-mimo-vl-miloco-7b
  • 完成后在上方'视觉理解大模型'中选择该云端模型。
对接规划模型

若本地资源受限,可使用云端 API 服务。

  1. 访问硅基流动官网注册并生成 API Key。
  2. 添加云端模型:
    • Base URL 输入 https://api.siliconflow.cn/v1
    • API Key 填入刚才生成的密钥
    • 模型 ID 选 Qwen/Qwen3-8B
  3. 在上方'规划大模型'中选择该云端模型。

回到 AI 中心即可开始使用。

五、优化建议

  • 规划模型:Qwen3-8B 适合入门,若追求工具调用稳定性,可尝试 Kimi K2、Minimax M2 等更强模型。
  • VL 模型:有条件可尝试部署全精度版本并使用 vLLM 服务,体验更佳。
  • 架构说明:官方文档推荐方式集成了 AI Engine,本质是对 llama.cpp 的封装。分离式部署大模型服务灵活性更高。
  • 注意事项:部分代码可能存在硬编码依赖,遇到平台适配问题需自行排查。

目录

  1. 一、安装环境
  2. 二、使用 Docker 部署 Miloco 后端
  3. 三、部署视觉大模型
  4. 下载与安装 LM Studio
  5. 设置及模型下载
  6. 运行模型并提供 API 服务
  7. 四、与 Miloco 对接
  8. 对接 VL 模型
  9. 对接规划模型
  10. 五、优化建议
  • 💰 8折买阿里云服务器限时8折了解详情
  • GPT-5.5 超高智商模型1元抵1刀ChatGPT中转购买
  • 代充Chatgpt Plus/pro 帐号了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • OpenClaw Discord 机器人部署与配置指南
  • C++ 左值引用与右值引用详解
  • C/C++ 运行时库概念详解
  • OpenClaw:意外爆红的 AI 助手如何改写开源规则
  • JavaAI 插件关联上下文实战:智能引导与工具箱案例评测
  • 具身智能:从概念定义到行业标准解析
  • 基于 ClaudeCode 与 Figma-MCP 的 UI 设计前端还原方案
  • 前端WebSocket实战:别再只会用HTTP了
  • AI Coding 深度解析:定义、核心能力与行业价值
  • 从零开始用 Python 复现 LLaMA 4 MoE 架构
  • GitHub 与 Google 第三方登录 OAuth 配置指南
  • 大模型突破对话边界:天工 3.0 与 SkyMusic 评测
  • MySQL 数据类型详解:数值、字符串与时间类型实战
  • Python 调用同花顺问财 API 获取金融数据实战指南
  • Linux 环境下 Bash Shell 模拟实现
  • AI 驱动下的内存市场变革:供需、能耗与安全趋势分析
  • 2025 无人机四大顶会 16 篇精选论文解读
  • AI 写作辅助平台评测:炼字工坊与蛙蛙写作
  • GitHub Copilot 提示词工程实战指南:从基础到精通
  • Vue入门到精通:从零开始学Vue

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online