大模型+智能家居解决方案--小米MiLoco部署

大模型+智能家居解决方案--小米MiLoco部署

一、Miloco简介

小米推出了首个“大模型+智能家居”解决方案Xiaomi Miloco,全称为 Xiaomi Local Copilot(小米本地协同智能助手)。

https://gitee.com/xiaomi-miloco/xiaomi-miloco

1、GitHub地址

https://github.com/XiaoMi/xiaomi-miloco

Miloco以米家摄像头为视觉信息源,以自研大语言模型MiMo-VL-Miloco-7B为核心,连接家中所有物联网(IoT)设备,框架面向所有人开源。MiMo-VL-Miloco-7B模型基于小米4月发布的MiMo模型调优而来,“天才少女”罗福莉最近加入的正是MiMo模型团队。

这很可能是智能家居的“ChatGPT时刻”,小米AIoT平台截至今年6月已连接的IoT设备数(不含智能手机、平板及笔记本计算机)达9.89亿台,数以亿计的米家摄像头、小爱音箱、台灯等设备都有望用上大模型。

从小米公布的Miloco页面来看,页面主视觉是一个类似于ChatGPT的聊天框,聊天框的左侧具有智能家居设备的导航栏,包括AI中心、模型管理、MCP服务、设备管理等选项;“相机设备”独立成一栏,陈列了一些智能摄像头记录的视频。

2、关键特性

  1. 交互新范式:基于大模型的开发范式,通过自然语言交互就可以完成规则设置、设备的复杂指令控制。
  2. 视觉数据新用途:以摄像头数据流作为感知信息源,使用大模型将视觉数据包含的各种家庭场景事件解析出来,用于回复用户 Query。
  3. 端侧大模型:将家庭场景任务拆分规划+视觉理解两个阶段,提供小米自研端侧模型,实现端侧视频理解,保障家庭隐私安全。
  4. 米家生态:打通米家生态,支持米家设备、米家场景的获取与执行,支持自定义内容发送米家通知。

Miloco还通过标准化的MCP协议封装,实现米家生态与全球最大开源智能家居社区Home Assistant生态的打通,同时开放支持第三方IoT平台接入

从项目公布的软硬件要求来看,部署Miloco硬件要求不高,仅需要硬件搭载x64架构,图形处理器在英伟达30系列及以上,存储要在16GB及以上即可。

▲Miloco部署的软硬件需求

据悉,Miloco的全屋智能差异化体验,依托于Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型“硬件-能力-应用-用户”四层完整架构的支撑。

3、Miloco的四层架构

二、快速开始

1、系统要求

  • 硬件要求
CPU: x64 架构 显卡: NVIDIA 30系及以上显卡,显存 8GB 及以上(最低),建议 12GB 及以上 存储: 建议 20GB 及以上可用空间(用于本地模型存储)
  • 软件要求
操作系统: - Linux: x64 架构,建议 Ubuntu 22.04 及以上 LTS 版本 - Windows: x64 架构,建议 Windows 10 及以上版本,要求支持 WSL2 - macOS: 暂不支持 Docker: 20.10 及以上版本,需要支持 docker compose NVIDIA 驱动: 支持 CUDA 的 NVIDIA 驱动 NVIDIA Container Toolkit: 用于Docker GPU支持

2、安装依赖环境

注意: 请确保您的系统满足上述硬件和软件要求。windows 系统需要进入 wsl 环境。

(1)WSL安装与配置

https://gitee.com/xiaomi-miloco/xiaomi-miloco/blob/main/docs/environment-setup-windows_zh-Hans.md

系统要求: Windows11 22H2 及以上版本 + WSL2

在系统中搜索然后打开控制面板,点击程序>启动或关闭 Windows 功能,然后勾选 Hyper-V 和适用于 Linux 的 Windows 子系统,点击确定,等待系统安装更新后重启

安装 WSL

在系统中搜素终端然后打开,输入wsl --install,等待 WSL 安装完成;如果已经安装,可以使用wsl --update更新到最新版本

下载 WSL2 Linux 发行版

打开 Windows 自带的应用商店,搜索 Ubuntu ,然后下载 Ubuntu24.04.1 LTS

在 Windows 终端可使用wsl --list --online查看在线的发行版,然后输入wsl --install -d Ubuntu-24.04安装

使用 WSL2

在应用商店下载完成后,可以点击打开按钮,然后按照提示输入用户名和密码,完成初始化

在终端输入wsl -d Ubuntu-24.04,然后按照提示输入用户名和密码,完成初始化

(2)WSL常用操作
# 启动默认发行版

wsl

# 退出当前发行版

exit # 或 logout

# 列出所有发行版(含状态)

wsl --list --verbose # 简写 wsl -l -v#

查看详细信息


wsl --status

# 设置默认启动发行版

wsl --set-default Ubuntu-22.04

# 卸载指定发行版(数据丢失)

wsl --unregister Ubuntu-20.04

# 查看WSL2的IP地址

ip addr show eth0 | grep 'inet\b' | awk '{print $2}' | cut -d/ -f1

# 关闭所有WSL实例

wsl --shutdown

# 运行特定发行版命令 wsl -d Ubuntu-22.04 -e bash -c "echo Hello"

#重启版本

wsl --terminate <DistributionName>

wsl --distribution <DistributionName>


网络模式配置

在系统中搜索 WSL Setting ,点击网络,然后将网络模式修改为 Mirrored ,修改完成后,需要使用wsl --shutdown停止子系统,然后重新运行wsl -d Ubuntu-24.04进入子系统,输入ip a查看子系统网络配置是否和宿主机器一致。

设置为 Mirrored 模式后,需要配置 Hyper-V 防火墙,允许入站连接。

在 PowerShell 窗口中以管理员权限运行以下命令,以配置 Hyper-V 防火墙设置,使其允许入站连接:

Set-NetFirewallHyperVVMSetting -Name '{40E0AC32-46A5-438A-A0B2-2B479E8F2E90}' -DefaultInboundAction Allow # 使用下述命令获取WSL防火墙策略 Get-NetFirewallHyperVVMSetting -PolicyStore ActiveStore -Name '{40E0AC32-46A5-438A-A0B2-2B479E8F2E90}' # DefaultInboundAction和DefaultOutboundAction为Allow即可: # Name : {40E0AC32-46A5-438A-A0B2-2B479E8F2E90} # Enabled : True # DefaultInboundAction : Allow # DefaultOutboundAction : Allow # LoopbackEnabled : True # AllowHostPolicyMerge : True
(3)Docker环境

使用官方脚本安装( WSL2 中官方推荐 Docker Desktop 安装,可以忽略提示,采用下述命令直接安装)

curl -fsSL https://get.docker.com | bash -s docker # 中国国内用户可以指定Aliyun源安装 curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

可将当前用户加入 docker 组,从而可以直接使用 docker 命令:

sudo usermod -aG docker $USER

添加完成后,需要重新登录,以使用户组更改生效。 使用命令docker --version验证是否安装成功。

(4)显卡驱动及开发工具(任选一个)
# 25-11-1更新 # 安装CUDA Toolkit(推荐安装) wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb sudo dpkg -i cuda-keyring_1.1-1_all.deb sudo apt-get update sudo apt install nvidia-cuda-toolkit # 安装NVIDIA Driver sudo apt-get -y install cuda-drivers

# 25-11-1更新 # 配置下载源 sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2 curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1 sudo apt-get install -y \ nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

3、环境验证

(1)验证 Docker

使用hello-world镜像验证 Docker 是否安装成功,如果显示Hello from Docker!则表示安装成功。

docker run hello-world # 验证完成后,可移除镜像 docker rmi hello-world
(2)验证 NVIDIA 显卡驱动

使用命令nvidia-smi验证 NVIDIA Driver 是否安装成功,如果显示显卡驱动和 CUDA 工具包信息,则表示安装成功。

使用命令nvcc --version验证 NVIDIA CUDA Toolkit 是否安装成功,如果安装成功,会显示版本信息。

(3)验证 NVIDIA Container Toolkit

使用下述命令验证 NVIDIA Container Toolkit 是否安装成功,如果显示显卡驱动和 CUDA 工具包信息,则表示安装成功。

docker run --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi # 验证完成后,可移除镜像 docker rmi nvidia/cuda:12.4.0-base-ubuntu22.04

4、miloco安装与启动

下载源码后,执行一键安装脚本

git clone https://github.com/XiaoMi/xiaomi-miloco.git bash scripts/install.sh

miloco安装运行界面:

选择 “1. Quick Install”

选择下载路径:国内推荐 Xiaomi FDS

安装完成提示:

启动服务:

运行服务后的系统运行时状态:

5、前端访问服务

通过https://<your ip>:8000访问服务,如果是本机访问, IP 为127.0.0.1

📄NOTICE:

  • 请使用 https 访问,而不是 http
  • Windows 下,在 Windows 中可以尝试直接访问 WSL 的 IP 地址,如 https://<wsl ip>:8000
  • macOS 环境下,如果网络模式配置为桥接模式,访问时请使用 Docker 所在虚拟机的 IP。

6、miloco使用

miloco前端管理界面:

设置后端使用的模型:

设置规则:

主界面里可以自动生成,也可以在规则管理里手动添加。这里使用的是手动添加。

注意:

添加规则前,需要在米家APP里测试相关控制设备的有效性。

添加规则时,一定要在设置控制选项点击“测试”按钮,生成有效的米家控制指令,有时AI模型调用生成指令有问题,多测试几遍。

如果设置的规则执行有问题,可以在日志管理查看相关执行日志。

Read more

前端大文件分片上传实现与断点续传方案(含完整代码讲解)

在上传大文件(如视频、安装包、模型文件)时,直接上传容易出现以下问题: * 文件过大 → 浏览器/服务器容易超时 * 上传过程中断 → 重新上传浪费时间 * 网络波动 → 上传失败率高 因此,大文件分片上传 + 断点续传 + 秒传校验 是目前最通用、最稳定的解决方案。 本文将通过一段完整可运行的示例代码,详细讲解如何在前端实现分片上传、断点续传、服务端校验等关键功能。 ✨ 实现效果 * ✔ 自动切片(默认 5MB/片,可配置) * ✔ 查询已上传分片(断点续传) * ✔ 自动跳过已上传的片段 * ✔ 每片上传成功后重新校验 * ✔ 所有片段上传完成后自动触发合并 * ✔ 错误处理完善 📌 核心代码(uploadLargeFile) 以下代码就是本文的核心逻辑,也是你提供的代码版本,经过梳理解释后会更易理解: export async function uploadLargeFile({ file, fileId, id, chunkSize = 5 * 1024

重磅官宣!Token 官方中文名定了——「词元」,AI 术语终于有了统一标准

今天(3月24日)科技圈迎来一个里程碑式的消息:国家数据局在国新办新闻发布会上正式官宣,AI 领域核心术语 Token 的中文标准译名,确定为「词元」✅ 从此,困扰业内多年的 Token 译名乱象,终于有了官方定论。 作为每天和大模型、AI 交互的从业者/爱好者,相信大家都有过这样的困扰:同样是 Token,在区块链里叫「代币」,在网络安全领域叫「令牌」,在大模型场景里,有人叫「标记」,有人干脆不翻译直接用英文,甚至还有「模元」「智元」等多种民间译法,跨场景沟通时经常出现理解偏差。 而这次官方定调「词元」,绝非简单的翻译统一,背后藏着对 AI 核心逻辑的精准解读,也预示着我国 AI 产业的规范化再进一步。 一、官方定名核心要点,必看! * 发布主体:国家数据局局长刘烈宏在国新办发布会、中国发展高层论坛上正式使用「

【AI大模型前沿】通义万相Wan2.2:阿里270亿参数巨兽开源,消费级显卡就能跑,免费平替Sora上线

【AI大模型前沿】通义万相Wan2.2:阿里270亿参数巨兽开源,消费级显卡就能跑,免费平替Sora上线

系列篇章💥 No.文章1【AI大模型前沿】深度剖析瑞智病理大模型 RuiPath:如何革新癌症病理诊断技术2【AI大模型前沿】清华大学 CLAMP-3:多模态技术引领音乐检索新潮流3【AI大模型前沿】浙大携手阿里推出HealthGPT:医学视觉语言大模型助力智能医疗新突破4【AI大模型前沿】阿里 QwQ-32B:320 亿参数推理大模型,性能比肩 DeepSeek-R1,免费开源5【AI大模型前沿】TRELLIS:微软、清华、中科大联合推出的高质量3D生成模型6【AI大模型前沿】Migician:清华、北大、华科联手打造的多图像定位大模型,一键解决安防监控与自动驾驶难题7【AI大模型前沿】DeepSeek-V3-0324:AI 模型的全面升级与技术突破8【AI大模型前沿】BioMedGPT-R1:清华联合水木分子打造的多模态生物医药大模型,开启智能研发新纪元9【AI大模型前沿】DiffRhythm:西北工业大学打造的10秒铸就完整歌曲的AI歌曲生成模型10【AI大模型前沿】R1-Omni:阿里开源全模态情感识别与强化学习的创新结合11【AI大模型前沿】Qwen2.5-Omni:

【愚公系列】《人人都是AI程序员》023-项目实战2: 构建商业级AI 图像生成平台(十分钟实战:使用Resend 构建邮件营销系统)

【愚公系列】《人人都是AI程序员》023-项目实战2: 构建商业级AI 图像生成平台(十分钟实战:使用Resend 构建邮件营销系统)

💎【行业认证·权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:ZEEKLOG博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者 🏆【荣誉殿堂】 🎖 连续三年蝉联"华为云十佳博主"(2022-2024) 🎖 双冠加冕ZEEKLOG"年度博客之星TOP2"(2022&2023) 🎖 十余个技术社区年度杰出贡献奖得主 📚【知识宝库】 覆盖全栈技术矩阵: ◾ 编程语言:.NET/Java/Python/Go/Node… ◾ 移动生态:HarmonyOS/iOS/Android/小程序 ◾ 前沿领域: