让“小爱音箱PRO”智能起来：接入豆包AI

优质文章学习记录

10 Apr 2026 — 8 min read

下面提供从 0 到 1 的完整流程，包含豆包 API 申请、MiGPT 部署、配置与使用，确保你能顺利让小爱音箱 Pro 用上豆包的强大能力。

一、准备工作（必做）

二、申请豆包 API 密钥（关键步骤）

豆包 API 需通过火山引擎方舟平台申请，以下是详细步骤：

1. 注册与实名认证

访问火山引擎官网：https://www.volcengine.com/
注册账号并完成实名认证（个人 / 企业均可）
登录后进入方舟大模型平台

2. 创建 API 密钥与推理接入点

进入控制台 → API 密钥管理 → 点击 "创建密钥"，保存Access Key ID和Secret Access Key
进入在线推理 → 创建推理接入点：
- 名称：自定义（如 "小爱音箱豆包"）
- 模型选择：豆包系列（推荐 Doubao-seed-1.6-flash，响应快）
- 地域：选择cn-beijing（国内延迟低）
等待状态变为 "运行中"，记录接入点 ID（格式：ep-xxxxxxxxxxxxxx）

三、部署 MiGPT（推荐 Docker 方式，零门槛）

1. 安装 Docker

Windows/macOS：下载Docker Desktop并安装
Linux：执行sudo apt-get install docker.io（Ubuntu）

1.1、安装前必做：检查前置条件（避免安装失败）

Docker Desktop 在 Windows 上依赖WSL2（适用于 Linux 的 Windows 子系统），必须先满足以下条件：

检查项	要求	验证方法
系统版本	Win10 64 位（Build 19044+）/ Win11	按下`Win+R`输入`winver`，查看版本号
硬件虚拟化	已开启（CPU 支持 VT-x/AMD-V）	一般默认开启，若报错需进 BIOS 开启（品牌机按 F2/Del 进入）

步骤 1：开启 WSL2（核心依赖，必做）

按下Win+X，选择「Windows 终端（管理员）」（注意必须是管理员权限）；
命令执行后会提示「需要重启电脑」，点击「重启」（重启后会自动下载 Ubuntu 子系统，无需手动操作）；
重启后等待 Ubuntu 子系统安装完成（首次开机可能会弹窗设置 Ubuntu 用户名 / 密码，随便设置即可，不影响 Docker 使用）；

验证 WSL2 是否安装成功：重新打开终端，执行：

wsl --list --verbose

✅ 正常输出：能看到「Ubuntu」且「VERSION」列显示「2」（不是 1）。

执行以下命令，一键开启 WSL2 和虚拟机平台：

wsl --install

1.2、下载并安装 Docker Desktop

步骤 1：下载安装包

访问 Docker 官方下载页：https://www.docker.com/products/docker-desktop/
点击「Download for Windows」，下载安装包（约 500MB，耐心等待）；
- 若官网下载慢，可改用国内镜像：https://mirrors.aliyun.com/docker-toolbox/windows/docker-desktop/

步骤 2：安装 Docker（关键选项别错）

双击下载的Docker Desktop Installer.exe，开始安装；
安装界面勾选以下选项（重中之重）：
- ✅ Use WSL 2 instead of Hyper-V（优先用 WSL2，避免 Hyper-V 冲突）；
- ✅ Add shortcut to desktop（桌面创建快捷方式，方便后续打开）；
点击「OK」开始安装，等待 2-5 分钟（安装过程会自动配置环境变量）；
安装完成后，勾选「Start Docker Desktop」，点击「Finish」。

步骤 3：首次启动 Docker

启动后会弹出「Service Agreement」（服务协议），点击「Accept」；
等待 Docker 初始化（桌面右下角会出现「鲸鱼图标」，图标无红色叉号即正常）；
- 首次启动可能会提示「WSL2 is not installed」，说明之前 WSL2 没装成功，回到第一步重新执行wsl --install。

1.3、验证 Docker 是否安装并正常运行（三步必查）

安装完成后，按以下步骤验证，全部通过即说明安装 OK：

步骤 1：检查 Docker 版本

打开「Windows 终端」（普通权限即可），执行：

docker --version

✅ 正常输出示例（版本号可能不同）：

Docker version 25.0.3, build 4debf41

❌ 异常：提示「'docker' 不是内部或外部命令」→ 重启电脑（让环境变量生效），或重新安装 Docker。

步骤 2：检查 Docker 服务状态

看桌面右下角的「鲸鱼图标」：
- 右键图标 → 选择「Settings」能正常打开 → 服务运行中；
- 若图标有红色叉号 → 右键选择「Restart Docker」重启。

步骤 3：运行测试容器（最终验证）

执行 Docker 官方的「hello-world」测试容器，这是最权威的验证方式：

docker run hello-world

✅ 正常输出（关键看最后一行）：

Hello from Docker! This message shows that your installation appears to be working correctly.

❌ 异常：提示「pull access denied」→ 网络问题，后续配置国内镜像源即可

2. 创建配置文件

在电脑上新建migpt文件夹，创建以下两个文件：

（1）.migpt.js（小爱音箱配置）

module.exports = { speaker: { userId: "你的小米账号", // 必须修改 password: "你的小米密码", // 必须修改 did: "小爱音箱Pro", // 必须与米家App设备名称一致 ttsCommand: [5, 1], // 小爱音箱Pro专用参数，不可改 wakeUpCommand: [5, 3], // 小爱音箱Pro专用参数，不可改 monitorCommand: [3, 1, 1], // 小爱音箱Pro专用参数，不可改 callAIKeywords: ["豆包", "请", "你"] // 触发豆包AI的关键词 } }

（2）.env（豆包 API 配置）

# 豆包配置 DOUBAO_API_KEY=你的Access Key ID:Secret Access Key # 格式如AK:SK DOUBAO_MODEL=接入点ID # 如ep-xxxxxxxxxxxxxx DOUBAO_BASE_URL=https://ark.cn-beijing.volces.com/api/v3 # 固定值 DOUBAO_REGION=cn-beijing # 与接入点地域一致 # 其他设置（可选） BOT_NAME=豆包 # 回答时的称呼 TTS_TYPE=xiaomi # 使用小爱原生TTS，也可改为doubao使用豆包音色

3. 启动 MiGPT 服务

打开终端 / 命令提示符，执行以下命令（替换本地路径）：

docker run -d \ -v /本地migpt文件夹路径:/app/config \ -p 3000:3000 \ --name mi-gpt \ idootop/mi-gpt:latest

具体如下：

查看所有容器：

4. 验证部署

访问http://localhost:3000，看到 MiGPT 界面即部署成功
检查日志：docker logs mi-gpt，无报错即可使用

四、使用豆包 AI 功能（超简单）

1. 基础使用

对小爱音箱说：" 小爱同学，豆包，什么是人工智能？"（关键词触发）
或：" 小爱同学，请帮我写一首关于春天的诗 "
MiGPT 会自动拦截问题，调用豆包生成回答，通过音箱播报

2. 高级玩法

功能	语音指令示例
连续对话	"小爱同学，豆包，开启连续对话"，之后可直接提问
角色设定	"小爱同学，豆包，你现在是小学数学老师，帮我辅导孩子作业"
内容生成	"小爱同学，豆包，写一篇关于超级跑车的作文"（适合孩子兴趣）
知识问答	"小爱同学，豆包，解释一下相对论"

五、常见问题与解决方案（避坑指南）

问题	原因	解决方法
MiGPT 无法连接音箱	小米账号两步验证开启 / 密码错误	关闭两步验证；确认账号密码正确；设备名称与米家 App 一致
豆包回答延迟高	网络差 / 模型选择不当	切换国内模型（如 Doubao-seed-1.6-flash）；优化网络
语音播报异常	TTS 参数错误	确认 ttsCommand 为 [5,1]（小爱音箱 Pro 专用）
API 调用失败	密钥错误 / 接入点未运行	检查 API 密钥与接入点 ID；确认接入点状态为 "运行中"
部分问题不触发豆包	关键词未匹配	修改.callAIKeywords，添加常用触发词（如 "帮我"、"解释"）

六、两种接入方式对比（官方 vs 豆包）

对比项	官方内置大模型	豆包 AI（MiGPT）
功能	基础问答、内容生成	全功能豆包，支持连续对话、角色设定、多轮记忆
响应速度	快（本地模型）	中（网络调用，国内模型约 1-3 秒）
定制化	有限	高度自定义（角色、回答风格、关键词）
适合场景	普通用户、便捷使用	技术爱好者、有孩子家庭（可定制教育角色）

如何用faster-whisper实现极速语音转文字：高性能语音识别工具全攻略

如何用faster-whisper实现极速语音转文字：高性能语音识别工具全攻略【免费下载链接】faster-whisper 项目地址: https://gitcode.com/gh_mirrors/fas/faster-whisper faster-whisper作为OpenAI Whisper的优化版本，通过CTranslate2推理引擎实现了4倍速提升与更低内存占用，是一款专为高效语音识别设计的工具。无论是CPU还是GPU环境，都能通过量化技术进一步优化性能，为有一定技术基础的用户提供专业级语音转文字解决方案。核心技术解析与性能优势性能数据对比（Large-v2模型）配置方案处理时间显存占用标准Whisper4分30秒11.3GBfaster-whisper54秒4.8GBfaster-whisper（8位量化）59秒3.1GB 该工具在保持识别准确率的同时，通过模型优化和量化技术，显著降低了计算资源需求，尤其适合大规模语音处理场景。从零开始的部署步骤基础安装命令 pip install faster-whisper 无需额外配置FFm

抛弃Copilot？手把手教你用Python+Claude 3.5 Sonnet打造“全栈代码审计”Agent

在AI辅助编程领域，GitHub Copilot虽然方便，但往往只能针对当前文件进行补全，缺乏对“整个项目结构”的宏观理解。随着 Claude 3.5 Sonnet 在Coding Benchmarks（编程基准测试）中全面霸榜，以及 Gemini 1.5 Pro 开放百万级上下文窗口，我们完全有能力自己动手，构建一个比Copilot更懂业务逻辑的私人编程助手。本文将从AST（抽象语法树）解析开始，深入讲解如何利用Python构建一个RAG（检索增强生成）架构，并通过API聚合网关接入Claude 3.5，实现对遗留代码（Legacy Code）的自动化重构与审计。文末附带独家免费测试额度及完整源码。一、痛点：为什么我们需要“第二代”AI编程助手？作为一名每天要写几百行代码的开发者，你是否遇到过以下场景： 1. 接手“屎山”代码：前人留下的代码逻辑错综复杂，

告别字幕制作烦恼：N46Whisper让日语视频字幕轻松搞定

告别字幕制作烦恼：N46Whisper让日语视频字幕轻松搞定【免费下载链接】N46WhisperWhisper based Japanese subtitle generator 项目地址: https://gitcode.com/gh_mirrors/n4/N46Whisper 你是否也曾遇到这样的情况：喜欢的日语视频没有字幕，听不懂又看不明？或者想制作双语字幕分享给朋友，却被复杂的软件和漫长的处理过程劝退？现在，有了N46Whisper，这些问题都将成为过去！这款基于AI技术的字幕生成工具，就像你的私人字幕助理，让你轻松拥有专业级字幕效果。为什么选择N46Whisper？三大核心优势告诉你无需安装，打开就能用传统字幕软件往往需要复杂的安装和配置过程，而N46Whisper采用云端处理方式，就像使用在线文档一样简单。你只需要一个浏览器，就能随时随地开始制作字幕，省去了安装软件的麻烦，特别适合电脑小白和追求效率的用户。 AI助力，识别精准又快速 N46Whisper背后有强大的AI引擎作为支撑，它就像一个经验丰富的日语听力专家，能够准确捕捉视频中的语音内容。无论

开源AI编程工具选型对比：opencode、GitHub Copilot谁更优？

开源AI编程工具选型对比：OpenCode、GitHub Copilot谁更优？ 1. 引言随着大模型技术的成熟，AI 编程助手已成为开发者日常开发中不可或缺的工具。从代码补全到项目规划，AI 正在重塑软件开发的工作流。在众多解决方案中，GitHub Copilot 作为最早进入市场的商业产品之一，凭借其与 VS Code 的深度集成广受欢迎；而 OpenCode 作为一个2024年开源的终端优先 AI 编程框架，迅速吸引了关注，尤其在隐私安全和本地化部署方面表现突出。本文将围绕这两个代表性工具展开全面对比，重点分析它们的技术架构、功能特性、模型支持、隐私策略及适用场景，并结合实际使用体验，帮助开发者在不同需求下做出合理选型决策。特别地，我们还将探讨如何通过 vLLM + OpenCode 构建高性能的本地 AI Coding 应用，内置 Qwen3-4B-Instruct-2507 模型，实现高效、低延迟的代码生成能力。 2. OpenCode 核心特性解析