Project AIRI 是一个开源的 AI 虚拟伴侣系统,旨在让每个人都能拥有自己的数字伙伴。它不仅仅是一个聊天机器人,而是一个具备感知、思考、表达和行动能力的虚拟存在。
一、项目深度解析
1. 项目背景与愿景
AIRI(アイリ)全称 Project AIRI,定位为"AI 虚拟伴侣/数字角色的灵魂容器",灵感来源于知名 AI VTuber Neuro-sama。项目由 Moeru AI 团队开发,采用 MIT 开源协议,目标是解决闭源 AI 虚拟主播"下播即失联"的痛点,让用户能够完全掌控自己的数字生命。
2. 核心功能特性
AIRI 采用生物感知系统架构,分为四个核心模块:
| 模块 | 功能 | 技术实现 |
|---|---|---|
| 大脑(Brain) | 逻辑处理、游戏策略、记忆管理 | 支持 OpenAI、Claude、DeepSeek、Ollama 等 30+ 主流 LLM;内置 DuckDB/PGlite 浏览器数据库;支持 Minecraft、Factorio 游戏互动 |
| 耳朵(Ears) | 音频输入处理 | 浏览器麦克风/Discord 音频流输入;客户端语音识别(ASR);实时说话检测(VAD) |
| 嘴巴(Mouth) | 语音合成输出 | ElevenLabs TTS 集成;支持多种语音服务商 |
| 身体(Body) | 视觉呈现 | Live2D/VRM 模型支持;自动眨眼、眼神追踪、空闲动作;WebGL/WebGPU 渲染 |
3. 技术架构亮点
- 跨平台支持:网页版(Stage Web)、桌面版(Stage Tamagotchi)、移动版(Stage Pocket)
- 技术栈:Vue 3 + TypeScript + Pinia(前端);Three.js(3D 渲染);WebAudio API + Web Workers(音频);ONNX Runtime + Transformers.js(模型推理);Hono API + Drizzle ORM(后端)
- 性能优化:桌面版支持 NVIDIA CUDA 和 Apple Metal 加速;WebGPU 支持图形性能优化
二、部署安装详细步骤
环境准备
最低配置要求:
- 显卡:NVIDIA 16G 显存以上(推荐 3090/4070 及以上)
- CPU:8 核 16 线程以上
- 内存:32G 以上
- 硬盘:50G 以上空闲空间
- 系统:Windows 10/11 或 Ubuntu 22.04 LTS
必备软件:
- Git 最新版
- Node.js 18.x 或更高版本
- Python 3.10.x
- pnpm 包管理器
- CUDA 11.8 及以上(如需 GPU 加速)
部署方式一:本地开发环境(推荐开发者)
- 克隆项目代码
git clone https://github.com/moeru-ai/airi.git
cd airi
- 安装依赖
# 安装 pnpm(如未安装)
npm install -g pnpm
# 安装项目依赖
pnpm install
- 启动不同版本
# 启动网页版(浏览器访问)
pnpm dev
# 启动桌面版(Tamagotchi)
pnpm dev:tamagotchi
# 启动移动版(PWA)
pnpm dev:pocket
部署方式二:Windows 一键安装(小白友好)
从 GitHub Releases 下载 AIRI_0.7.1_windows_amd64-setup.exe,安装后任务栏会出现 AIRI 图标,右键可调整位置,设置中绑定 API 后即可对话。
部署方式三:Docker 容器化
# 构建 Docker 镜像
docker build -t airi-app -f apps/stage-web/Dockerfile .
# 运行容器
docker run -d -p 3000:80 --name airi-container airi-app
部署方式四:NAS 部署
支持 Synology 或树莓派,通过 Node.js 环境运行。注意 WebGPU 加速在 NAS 上可能受限。
三、配置与使用指南
1. LLM 模型配置
首次启动后需要配置 LLM API:
- 在设置页面选择"OpenAI 兼容 API"作为服务来源
- 填入 API 信息:
- API Base URL:如使用兼容 OpenAI 格式的 API 服务
- API Key:你的 API 密钥
- Model:如
deepseek-v3-2-exp
支持的 LLM 提供商:
- OpenAI 系列(GPT-4o、GPT-4 等)
- Claude 系列
- 国产模型:DeepSeek、通义千问、智谱、月之暗面、SiliconFlow 等
- 本地模型:Ollama(支持 Llama、Mistral 等)
2. 语音功能配置
TTS(语音合成)配置:
- 付费方案:配置 ElevenLabs、Azure Speech、Minimax 等 TTS 服务
免费方案:使用 openai-edge-tts(开源 OpenAI TTS 仿真器)
# 安装 openai-edge-tts
pip install openai-edge-tts
# 启动服务
python -m openai_edge_tts.server
在 AIRI 语音设置中填入 http://localhost:5050/v1,API 密钥可随意填写。
ASR(语音识别)配置:
- 浏览器端:使用 Web Speech API
- 客户端:可配置 Whisper large-v3 等本地模型
3. 角色卡定制
在设置中配置角色卡(System Prompt),定义 AI 的个性、背景和行为:
你是一个温柔体贴的女生,名叫小艾,喜欢二次元和编程,说话带点撒娇的语气,会主动关心对方的状态...
4. 游戏功能配置
Minecraft 集成:
- 安装 Minecraft Java 版
- 配置 Minecraft 服务器地址
- AIRI 可通过自然语言指令控制游戏角色,如"帮我建个木屋"或"收集 10 个钻石"
Factorio 集成:
- 安装 Factorio 游戏
- 加载 autorio 模组
- AI 可协助自动化生产链,如"优化电力供应"或"扩展铁矿运输带"
5. 多平台扩展
- Discord 集成:填入 Bot Token 即可让 AIRI 在 Discord 频道中互动
- Telegram 集成:配置 Telegram Bot API
- 浏览器扩展:支持 PWA 安装到手机桌面
四、常见问题与优化
性能优化建议
- 显存不足:换用更小模型(如 Qwen-4B-Chat)或开启量化模式
- 响应速度慢:接入第三方 LLM API(如 DeepSeek)或优化本地模型推理
- 内存占用高:调整模型参数或禁用非必要模块
隐私与安全
- 所有数据本地存储,使用 DuckDB-WASM 嵌入式数据库
- API 密钥存储在本地配置文件中,避免上传到公共仓库
- 支持本地加密保存敏感数据
五、进阶玩法与扩展
1. 自定义功能开发
AIRI 采用模块化设计,支持通过插件系统扩展功能:
- 游戏插件:为其他游戏开发集成模块
- 技能扩展:通过 Skill API 添加新功能(控制智能家居、查询天气等)
- 模型集成:支持自定义 ASR/TTS 模型
2. 生产环境部署
对于需要 7x24 小时运行的用户,建议:
- 使用 Docker Compose 或 Kubernetes 部署
- 配置健康检查和监控
- 实现蓝绿部署确保零停机更新


