不再呆板!MiGPT GUI 让小爱音箱变身个性化 AI 助手,内网穿透更实用

不再呆板!MiGPT GUI 让小爱音箱变身个性化 AI 助手,内网穿透更实用
在这里插入图片描述

MiGPT GUI 是一款专为小爱音箱打造的图形化工具,核心功能是将小爱音箱接入 DeepSeek V3.2 等大模型,支持自定义人设、切换豆包 TTS 音色,同时兼容 Windows、Mac、Linux 多系统,零基础也能通过 Docker 一键部署,适配小爱音箱 Pro、mini 等多款设备,尤其适合想提升小爱音箱交互体验的普通用户,优点在于可视化操作、解决小米异地登录问题,还能低成本利用免费 tokens 体验 AI 功能。

使用 MiGPT GUI 时发现,虽然操作门槛低,但配置小米账号时要准确填写设备 ID(需和米家 APP 一致),AI 大模型 API 密钥和 TTS 参数填写错误会导致功能失效,且首次部署后建议先测试语音配置,避免后续使用中出现音色异常的情况,整体使用下来,只要参数填对,就能稳定实现智能对话。

在这里插入图片描述

不过 MiGPT GUI 默认部署在本地局域网内,这带来了明显局限:在家外想调整小爱音箱的人设、切换音色,只能等回到家操作;家人想临时修改早教人设,也必须在同一局域网内的电脑上调整,无法远程操作,大大降低了使用灵活性。

而 cpolar 内网穿透恰好解决了这一问题,它能将本地的 MiGPT GUI 服务映射到公网,无需折腾路由器端口映射,在外用手机、电脑就能访问控制面板,比如出差时可远程把小爱音箱的 “社牛” 人设改成 “温柔幼师”,满足孩子早教需求,既保留了 MiGPT GUI 的核心优势,又突破了局域网的限制,让使用场景更灵活。

在这里插入图片描述

现在动手试试,让你家的小爱音箱,从 “凑活用” 变成 “离不开”~

下面👇下面👇下面👇教程在下面!

接下来,我会手把手教你 花 10 分钟完成部署,让你也能亲身体验这份乐趣。

1 什么是MiGPT GUI?

image-20251214205825767

MiGPT GUI 是一个图形化工具,旨在让用户 轻松将小爱音箱接入人工智能大模型。它通过可视化界面简化了配置和部署流程,即使没有深厚的编程基础,也能快速完成以下操作:

  • 接入 MiGPT 大模型,让小爱音箱获得更智能的对话能力;
  • 自定义人设和对话风格,让音箱的回答更符合个人需求;
  • 支持 TTS(文本转语音),实现自然语音输出;
  • 安全快速部署,可在本地或 Docker 环境运行;
  • 设备兼容性一目了然:
支持类型设备1设备2设备3设备4设备5设备6
✅ 支持连续对话小爱音箱 Pro小爱音箱 mini小爱音箱 Play(2019)万能遥控版小米 AI 音箱(1&2代)小爱智能家庭屏 10
⚠️ 不支持连续对话小爱音箱小爱音箱 PlayPlay 增强版智能家庭屏 6Redmi 触屏音箱 Pro 8小爱音箱 Art
❌ 无法运行小米小爱音箱 HD小爱蓝牙音箱随身版----

简单来说,MiGPT GUI 就是小爱音箱接入大模型的“可视化桥梁”,把复杂的配置和接口调用都封装在图形界面里,让家庭自建 AI 助手变得轻松可行。

2 Docker一键部署 migpt-server

本教程将以Windows系统上的Docker部署migpt-server作为演示,如果还没有安装Docker的小伙伴可以查看这篇教程安装一下哦:https://www.cpolar.com/blog/docker-installation-linux-windows-macos

首先,电脑摁Win+R键,输入cmd回车,打开命令提示符窗口。然后输入如下命令一键部署migpt-server服务:

docker run -d--name migpt-server -p36592:36592 lmk123/migpt-server 
image-20251214211257246

执行完成后,可以使用如下命令查看Docker容器状态:

dockerps
image-20251214211509481

可以看到**status(状态)**显示为UP,端口为36592,代表正常运行的,接着,浏览器访问如下地址:

http://localhost:36592 

可以看到如下页面:

image-20251214211643227

这样,你就成功的部署好了migpt-server啦,是不是很简单!

3 配置migpt-server

前面我们已经成功部署好了 migpt-server 并确认服务正常运行,接下来就可以进行配置,让小爱音箱顺利接入 MiGPT。

3.1 配置小米账号及小爱设备

回到MiGPT 控制面板页面,下拉找到音箱部分,选择你的音箱型号

image-20251214213105421

我这里是小爱音箱 Pro,所以我就选择的它。接着小米账号ID部分,访问如下地址登录你的小米账号:

https://account.xiaomi.com/fe/service/account/profile 
image-20251214213305212

小米ID复制下来,填写到MiGPT 控制面板中的小米账号 ID列中,以及填写好你的小米账号密码:

image-20251214213440824

接着,设备ID这儿,可以访问你的米家APP中显示的名称,注意空格也要正确填写,比如我的显示为Xiaomi 智能音箱 Pro

image-20251214213650090

就将该名字填写至设备ID这一列中:

image-20251214213801855

3.2 配置接入AI大模型

阿里云百炼官网:https://bailian.console.aliyun.com/#/home

这里以阿里云百炼的API作为演示,阿里云百炼的新用户登录即有每个模型100万免费tokens:

image-20251214214146963

登录好以后,进入到密钥管理页面:

https://bailian.console.aliyun.com/?spm=a2c4g.11186623.0.0.60907980OAftBf&tab=model#/api-key

点击页面上的创建API-KEY按钮,选择你的归属账号,然后点击确认

image-20251214214528440

确认后即可创建成功,点击页面上的API-Key列的复制按钮即可复制你的Api-Key密钥:

image-20251214214621430

复制好以后回到MiGPT 控制面板页面,在接口地址中填写如下链接:

https://dashscope.aliyuncs.com/compatible-mode/v1 

密钥部分填写刚才复制下来的Api-Key密钥,模型部分这里以DeepSeek最新的V3.2为例,填写:

deepseek-v3.2 

参考如下图:

image-20251214215106493

这样就配置好,接入好AI了!

3.3 配置语音TTS服务

前面已经配置好了AI服务,接下来我们来配置一下语音服务,让你的小爱同学能够使用其他的音色来回答你的问题!

滚动到下方的语音服务项:

image-20251216151439419

可以看到TTS引擎显示为默认,默认为小爱同学音色,点击可以切换引擎,这里以豆包为例:

image-20251216152023289

切换后,会有4个参数,首先是对外地址,对外地址需要填写局域网地址或者部署在公网填写公网地址(比如我的电脑局域网IP为):

http://192.168.50.149:36592 
image-20251216152719848

接下来是APP IDAccess Token,首先需要登录火山引擎控制台

https://console.volcengine.com/home 
image-20251216155108591

登录上以后,点击左上角3条杠,然后搜索语音合成,点击豆包语音进入:

image-20251216155245031

进入以后,点击创建应用

image-20251216155330054

然后勾选上语音合成,点击确定即可:

image-20251216155409483

接着在侧边栏的语音合成里面,就能看到你的APP IDAccess Token 了:

image-20251216155616528

将其粘贴至MiGPT控制面板中即可,然后点击测试语音配置,就可以试听一下是否配置成功了,默认是使用的灿灿音色:

image-20251216160135647

如果想要换其他音色,可以参考火山引擎TTS音色列表,如下为我在gitee中开源的一个小页面,可以自行部署填写APP IDAccess Token即可:

https://gitee.com/jun-wan/volcano-engine-tts-sound-list 
image-20251216160635015

4 登录问题修复及效果演示

4.1 登录问题修复

配置完成后,点击页面上的启动按钮,即可启动:

image-20251216161005460

然后可以回到cmd终端,输入如下命令查看migpt-server运行日志(用户查看对话):

docker logs -f migpt-server 
image-20251216161112387

可以看到控制台提示了小米异地登录安全验证机制,这个问题即使访问链接登录了也不好使,如下为我整理出来的解决方法步骤如下:

1. 进入容器内部,进入 migptgui 容器的交互式 shell 2. 创建配置文件目录,创建 .migptgui/default 目录 3. 登录小米账号,在浏览器中访问小米账户获取授权或信息 4. 创建并写入 .mi.json 文件,在容器内创建文件并写入 Mina 和 Miiot 的 passToken 5. 验证文件是否创建成功,查看 .mi.json 是否存在并显示内容 6. 退出容器内部 

我们按照步骤执行,首先需要进入到migpt-server的容器内部,执行命令(记得用ctrl +c 停止之前查看日志的占用):

dockerexec-it migpt-server /bin/sh 
image-20251216162138360

接着,在容器内创建配置文件目录,执行如下命令:

mkdir-p /root/.migptgui/default 
image-20251216162940750

然后登录小米账号官网,获取到你的passToken:

https://account.xiaomi.com 

操作步骤如下:

image-20251216163445137

获取到passToken后,在docker容器内部执行如下命令(注意替换上你的passToken):

cat> /root/.migptgui/default/.mi.json <<'EOF' { "mina": { "pass": { "passToken": "你的小米账号Token" } }, "miiot": { "pass": { "passToken": "你的小米账号Token" } } } EOF
image-20251216163743758

然后验证是否成功创建**.mi.json**文件:

ls-la /root/.migptgui/default/ 
image-20251216163950482

成功,执行如下命令退出容器即可:

exit

4.2 效果演示

修复登录问题后,输入如下命令启动容器(由于前面账号登录问题,容器其实停止了):

docker start migpt-server 
image-20251216165010920

再次点击页面上的启动按钮,即可启动:

image-20251216161005460

然后可以回到cmd终端,输入如下命令再次查看migpt-server运行日志(用户对话查看):

docker logs -f migpt-server 
image-20251216165045369

可以看到,现在服务成功启动了,在前面可以看到单次对话调用AI的关键词配置的为请、你、傻妞

image-20251216170127411

这里询问一下,如:

小爱同学,你是谁? 
image-20251216173706332

可以看到成功回答了,而且使用的我们配置的音色进行回答的!个别音箱还支持连续对话,可以通过关键词召唤:

image-20251216173802204

这里使用如下指令唤醒连续对话:

召唤 为什么地球是方的? 那为什么地球是圆的? 
image-20251216174212092

可以看到成功的都调用AI进行回复啦。这样你的小爱音箱就已经支持AI啦!

5 设置人设

前面我们已经完美的配置好了小爱音箱接入大模型DeepSeekV3.2,并且配置上了豆包的音色,本期将带你更换默认人设傻妞

首先,滚动到最顶部,可以看到如下:

image-20251216183932801

我们点击自定义按钮,然后点击写入默认模板:

image-20251216184015055

可以看到已经插入了默认的模板,我们需要修改成自己喜欢的角色人物,比如这里以猫娘为例(为了省事,直接用AI生成了一个人设):

image-20251216184451295

人设覆盖之前的模板,然后重新点击启动按钮即可:

image-20251217151034959

让我们询问一下小爱同学看看:

小爱同学,你是谁? 
image-20251217185551631

可以看到,我们设置的人设已经生效了!现在你的小爱音箱已经变身为一个具备个性化人设的AI智能助手,快去和它聊聊天吧!

6 下载安装cpolar

到这里,MiGPT GUI 已经在本地跑起来了,但问题也随之而来——每次想换个人设调整TTS音色、或者切换大模型API,都得守在电脑前操作。万一人在外面,家里的小爱音箱突然"抽风"或者想临时改个设定,那就只能干着急。

有了 cpolar 内网穿透,这些烦恼就迎刃而解了。只需简单配置,就能随时随地通过公网访问 MiGPT GUI 管理面板,远程调参、切换模型、更新人设,统统不在话下。

6.1 什么是cpolar?

image-20250910114418412
  • cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。
  • 广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台,并提供一键安装脚本方便部署。

6.2 下载cpolar

打开cpolar官网的下载页面:
点击立即下载 64-bit按钮,下载cpoalr的安装包:

image-20250815171202537

下来下来是一个压缩包,解压后执行目录种的应用程序,一路默认安装即可,安装完成后,打开cmd窗口输入如下命令确认安装:

cpolar version 
image-20250815171446129

出现如上版本即代表安装成功!

6.3 注册及登录cpolar web ui管理界面

cpolar官网

访问cpolar官网,点击免费注册按钮,进行账号注册

image-20250804085039567

进入到如下的注册页面进行账号注册:

image-20250804085208319

注册完成后,在浏览器中输入如下地址访问 web ui管理界面:

http://127.0.0.1:9200 
image-20250815171734046

输入刚才注册好的cpolar账号登录即可进入后台页面:

image-20250815171846757

7 穿透MiGPT GUI实现公网访问

7.1 随机域名方式(免费方案)

随机域名方式适合预算有限的用户。使用此方式时,系统会每隔 24 小时 左右自动更换一次域名地址。对于长期访问的不太友好,但是该方案是免费的,如果您有一定的预算,可以查看大纲7.2固定域名方式,且访问更稳定

点击左侧菜单栏的隧道管理,展开进入隧道列表页面,页面下默认会有 2 个隧道:

  • remoteDesktop隧道,指向3389端口,tcp协议
  • website隧道,指向8080端口,http协议(http协议默认会生成2个公网地址,一个是http,另一个https,免去配置ssl证书的繁琐步骤)
image-20250914174356363

点击编辑website的隧道,修改成我们MiGPT GUI需要的信息:

image-20251217200005873

接着,点击左侧菜单的状态菜单,接着点击在线隧道列表菜单按钮,可以看到有2个migpt的隧道,一个为http协议,另一个为https协议:

image-20251217200048168

注意:每个用户创建的隧道显示的公网地址都不一样!

接下来在浏览器中访问migpt隧道生成的公网地址(http和https皆可),这里以https为例:

image-20251217200146697

可以看到成功访问啦!

7.2 固定域名方式

通过前面的配置,我们已经成功实现了MiGPT GUI的远程访问,但免费随机域名方案的局限性也逐渐显现:每24小时左右自动更换域名地址,意味着你需要频繁更新书签、重新分享链接,甚至可能因为忘记更新而无法访问。固定域名方案正是为了解决这些痛点而生,能够让你拥有一个永久不变的专属地址

好啦,接下来开始固定保留二级子域名教程!

首先,进入官网的预留页面:

https://dashboard.cpolar.com/reserved 

选择预留菜单,即可看到保留二级子域名项,填写其中的地区名称描述(可不填)项,然后点击保留按钮,操作步骤图如下:

image-20251217201503465

列表中显示了一条已保留的二级子域名记录:

  • 地区:显示为China Top
  • 二级域名:显示为migpt

注:二级域名是唯一的,每个账号都不相同,请以自己设置的二级域名保留的为主

接着,进入侧边菜单栏的隧道管理下的隧道列表,可以看到名为migpt的隧道,点击编辑按钮进入编辑页面:

image-20251217201537239

修改域名类型为二级子域名,然后填写前面配置好的子域名,点击更新按钮:

image-20251217201702338

接着,来到状态菜单下的在线隧道列表可以看到隧道名称为migpt的公网地址已经变更为二级子域名+固定域名主体及后缀的形式了:

image-20251217201747249

这里以https协议做访问测试:

image-20251217201843497

访问成功!这样一来,你就拥有了一个永久不变的专属域名,再也不用担心24小时域名更换的问题啦!

总结

MiGPT GUI 丰富了小爱音箱的交互体验,搭配 cpolar 内网穿透后,彻底摆脱局域网束缚,远程管理更便捷。简单配置就能让小爱音箱拥有智能对话和个性化人设,日常使用省心又实用。

Read more

Hunyuan-MT-7B-WEBUI vs 通用翻译工具,谁更强?

Hunyuan-MT-7B-WEBUI vs 通用翻译工具,谁更强? 你有没有过这样的经历: 复制一段英文技术文档到某翻译网站,点下“翻译”,结果出来的是“该模型正在思考人生”——或者更糟:语序混乱、术语错译、逻辑断裂。再试一次,换种说法,又翻出完全不同的意思。最后只好硬着头皮啃原文,边查词典边猜。 这不是你的问题,是大多数通用翻译工具在面对专业、严谨、结构复杂的文本时的真实表现。 而当你打开 Hunyuan-MT-7B-WEBUI 的网页界面,输入同样一段话,几秒后返回的译文——句式自然、术语统一、逻辑完整,甚至保留了原文的学术语气。更关键的是:它不联网、不上传、不记录,所有操作都在你自己的服务器上完成。 这不是理想化的宣传,而是我们实测中反复验证的结果。今天我们就抛开参数和榜单,用真实场景、真实文本、真实体验,来一场Hunyuan-MT-7B-WEBUI 与主流通用翻译工具的硬碰硬对比。 1. 翻译能力不是“能翻就行”,而是“翻得准、

open-webui 高速下载&Docker本地部署集成远程Ollama

open-webui 高速下载&Docker本地部署集成远程Ollama

open-webui 镜像快速高速下载 docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.6.9 https://docker.aityp.com/r/ghcr.io/open-webui/open-webuihttps://docker.aityp.com/r/ghcr.io/open-webui/open-webui 部署教程官网即可 https://docs.openwebui.com/https://docs.openwebui.com/ 启动Ollama在另一台机器上,默认启动,对外开放端口11434 打开ip访问限制,以便于其他机器访问 在open-webui的机器上面测试一下链接 curl http:

网页抓取(Web Scraping)完整技术指南:从原理到实战

在数据驱动的时代,结构化信息已成为企业决策、AI 训练与市场分析的核心资源。网页抓取(Web Scraping) 作为从非结构化网页中提取结构化数据的关键技术,广泛应用于电商、金融、舆情监测、学术研究等领域。 本文将系统解析网页抓取的工作原理、工具链、反爬对抗策略与法律边界,并提供可落地的工程建议。 一、什么是网页抓取? 网页抓取是指通过程序自动访问网页,解析 HTML/JSON 内容,并将目标数据提取、转换为结构化格式(如 CSV、数据库记录)的过程。 与网络爬虫(Crawler)的区别:爬虫:广度优先遍历全站链接(如搜索引擎);抓取:深度聚焦特定页面的数据字段(如商品价格、评论)。 典型应用场景包括: * 电商比价(Amazon、Shopee 商品监控) * 招聘数据聚合(职位趋势分析) * 社交媒体舆情监测(公开评论情感分析) * 学术数据采集(论文元数据批量下载)

Android WebView 版本升级方案详解

Android WebView 版本升级方案详解 目录 1. 问题背景 2. WebViewUpgrade 项目介绍 3. 升级方法详解 4. 替代方案对比 5. 接入与使用步骤 6. 注意事项与限制 7. 总结与建议 问题背景 WebView 版本差异带来的问题 Android 5.0 以后,WebView 升级需要去 Google Play 安装 APK,但即使安装了也不一定能正常工作。像华为、Amazon 等特殊机型的 WebView 的 Chromium 版本一般比较低,只能使用它自己的 WebView,无法使用 Google 的 WebView。 典型问题场景 H.265 视频播放问题: