开源AI桌宠AIRI完整部署指南

优质文章学习记录

08 Apr 2026 — 5 min read

本文手把手记录了 AIRI 的快速部署全流程：从设置中文界面、接入阿里百炼 API，到配置本地 TTS 服务，适合想低成本体验多模态 AI 桌宠的普通用户。

序言

最近在用一个叫 AIRI 的开源 AI 项目，部署简单、还能生成一个可调形象的桌面桌宠。我花了一整天_time_实测了从模型接入、TTS 语音、到跨平台联动的全过程——没有花哨概念，只有真实可用的细节。如果你也想拥有一个能聊天、会说话、还能接入 Discord 或游戏的“数字伙伴”，这篇就是你想要的落地指南。

演示

该项目支持ios、windwos、linux下载，看清型号配置点击下载即可安装，下载链接放在文章最后了。

打开软件，桌面上就会出现一个桌宠，这里的形象、大小都是可以调整的，感兴趣的可以尝试自定义，可以先连接上大模型再优化这个形象。

在设置>外观>通用>选择语言，切换成中文，然后重启应用即可生效，启动安全连接WebSocket是开启AIRI的实时加密通信，可以把Web版安装成手机APP

在模型提供商里可以选择很多服务商，如果电脑配置够的话可以选择ollama跑一个开源的qwen3.5 27B是最佳选择，如果配置不够可以调用api。

这里我使用的是阿里百炼的API，新出的套餐每月18000次调用，新用户才7块钱一个月，用处还是挺大的，使用下面链接还能领到10元优惠券：https://www.aliyun.com/benefit/ai/aistar?userCode=d5a2juv7&clubBiz=subTask…12391167…10263…

在设置中提供商里找到chat模型，这里面没有百炼或者千问的，但是这里可以选择minimax，软件虽然带了OpenAI Compatible兼容openai的选项，我测试了暂时不支持百炼的api。

接入模型后，这里就可以测试了，让她介绍一下自己，还是很可爱的。

在卡片编辑里可以设置角色的身份，描述它的是什么样子的以及它的行为等。

安装语音工具

我没有选择调用语音模型，如果为了方便省事可以去调用TTS模型的API，也可以在huggingface上下载Kokoro-82M这个模型，在这里使用的是一个开源的工具openai-edge-tts，这是一个免费的 OpenAI TTS 仿真器，下面是安装过程，下载连接放在文章最后了 。

下面这张图是安装环境，然后启动/app/server.py文件，这里出现Server running on http://localhost:5050 ，这个就可以了

回到AIRI，选择设置，在语音设置中填入http://localhost:5050/v1，注意这里不需要后面/audio/speech，API密钥随便填就可以了，因为上面的配置已经把API_KEY的验证给关闭了。

然后回到对话里就可以听到她的声音了，因为是免费的TTS，声音比较一般，对声音有要求的可以试试调用minimax或者百炼的TTS模型。

在设置里选择机体模块，这里可以配置连接Discord、X、我的世界、异星工厂，我这里虽然配置了Discord，里面只要填入一个Bot-token，比openclaw配置还要简单。剩下的我没有配置，有感兴趣的朋友可以自己试试。

总结

这个开源项目发布到现在时间还很短，但是官方的更新维护频率特别高，而且开源社区也很活跃，相信不久之后这个项目一定能更好，如果你也在找一个蹲在你桌面上、和你聊天的AI桌宠、虚拟伴侣，可以考虑这个开源项目。

项目开源链接：
https://github.com/moeru-ai/airi/releases/tag/v0.9.0-alpha.1
https://github.com/travisvn/openai-edge-tts

OpenClaw多智能体路由实战：飞书多机器人配置指南

文章目录 * 飞书重新安装问题 * 批量增加机器人 * 缺点 * 多个飞书机器人名称包含大小写的问题 * 多个Agent名称包含大小写的问题目前我已经完成了OpenClaw的基本安装，但是在对话框只有一个，机器人也只绑定到主会话，一次只能处理一个消息。很多时候我在聊天窗口，说A任务，然后做了一半，又发了关于B任务的指令。一是每次发完消息，如果OpenClaw还在处理，剩下的消息要么进入队列、要么看不到（实际还在队列）。两个任务切来切去，感觉体验很不好。要彻底解决这个问题，实现网上演示的那种对各Agent、每个对话机器人对应一个Agent，就需要用到多智能体路由技术。实现的步骤如下： * 在飞书创建一个新的机器人 * 通过控制台创建新的智能体 * 按照指引将飞书配置上去 * 根据需要创建多个Agent和机器人，并对应配置上去（略）飞书重新安装问题明明我已经安装好了飞书，系统还是会提示我安装，否则就跳过了添加飞书这步。应该是系统Bug。这次安装的飞书位置在~/.openclaw/extensions/feishu，其实和~/.npm-globa

GitHub Copilot代码建议安全检测：Qwen3Guard-Gen-8B联动方案

GitHub Copilot代码建议安全检测：Qwen3Guard-Gen-8B联动方案在现代软件开发中，AI编程助手的普及正以前所未有的速度改变着编码方式。GitHub Copilot 已成为众多开发者日常工具链的一部分，它能根据上下文自动生成函数体、补全逻辑甚至实现完整模块。然而，这种“智能推荐”并非没有代价——当模型建议了一段看似合理实则存在SQL注入漏洞的代码时，问题就不再是效率提升，而是安全隐患的悄然埋入。更复杂的是，这类风险往往隐藏在语义层面：一段代码语法正确、功能可用，却因使用了不安全的API或错误的数据处理方式而构成威胁。传统的基于规则的安全扫描工具对此类问题束手无策——它们擅长匹配已知模式（如rm -rf /），但难以理解“为什么拼接SQL字符串是危险的”。这正是生成式安全模型的价值所在。阿里云推出的 Qwen3Guard-Gen-8B 并非另一个通用大模型，而是一个专为内容安全审核设计的“判官型”AI。它的核心任务不是创作，而是审视；不是输出代码，而是判断哪段代码不该被输出。通过将安全决策转化为自然语言生成任务，它实现了从“是否违规”到“为何违规”的跃迁

4步创作革命！WAN2.2极速视频AI重新定义AIGC视频生产流程

4步创作革命！WAN2.2极速视频AI重新定义AIGC视频生产流程【免费下载链接】WAN2.2-14B-Rapid-AllInOne 项目地址: https://ai.gitcode.com/hf_mirrors/Phr00t/WAN2.2-14B-Rapid-AllInOne 价值定位：打破专业壁垒的视频创作新范式在AIGC视频生成领域，创作者长期面临"三高困境"：技术门槛高、硬件要求高、时间成本高。传统工作流往往需要串联文本理解、图像生成、视频插值等多个模型，仅模型加载就需消耗数分钟，且80%以上的失败案例源于模型组合不当。WAN2.2-14B-Rapid-AllInOne（简称WAN2.2极速视频AI）以"一体化模型架构"直击行业痛点，将原本需要10+步骤的创作流程压缩至4个核心环节，在8GB显存设备上实现每分钟视频内容的高效生成。这款由Phr00t团队开发的开源模型，通过"MEGA Merge"

终极指南：如何用WhisperX实现70倍速AI语音转文字？

终极指南：如何用WhisperX实现70倍速AI语音转文字？【免费下载链接】whisperXWhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization) 项目地址: https://gitcode.com/gh_mirrors/wh/whisperX WhisperX是一款革命性的语音识别工具，它结合了先进的AI技术，能够以惊人的70倍速将语音转换为文字，同时提供精确的词级时间戳和说话人区分功能。无论是处理会议录音、播客内容还是视频字幕制作，WhisperX都能为你节省大量时间和精力。 🚀 WhisperX的核心优势 WhisperX不仅仅是一个普通的语音转文字工具，它融合了多项先进技术，使其在速度和准确性上都表现出色： * 70倍速处理：相比传统方法，WhisperX能够以惊人的速度完成语音转文字任务 * 词级时间戳：精确到每个词语的开始和结束时间，方便后续编辑和分析 * 说话人区分：自动识别不同说话人，使对话内容更清晰 * 高准确率：采用先进的语音识别模型，

序言

演示

安装语音工具

总结

Read more

OpenClaw多智能体路由实战：飞书多机器人配置指南

GitHub Copilot代码建议安全检测：Qwen3Guard-Gen-8B联动方案

4步创作革命！WAN2.2极速视频AI重新定义AIGC视频生产流程

终极指南：如何用WhisperX实现70倍速AI语音转文字？