RVC-WebUI(Retrieval-based Voice Conversion WebUI)是一个基于深度学习的语音转换系统,它能够进行声音模拟、音乐转换处理,并提供快速高效的实时体验及多种参数调整功能。
快速开始:5 分钟完成部署
第一步:获取项目代码
git clone https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
cd rvc-webui
第二步:安装依赖环境
Windows 用户:双击运行 webui-user.bat 文件,自动完成环境配置。
Linux/macOS 用户:
chmod +x webui.sh
./webui.sh
提示:首次启动可能需要下载基础模型文件(约 2GB),请确保网络连接稳定。
第三步:启动应用
启动成功后,在浏览器中打开 http://127.0.0.1:7860 即可看到直观的操作界面。
项目结构解析
了解项目目录结构有助于更好地使用和管理工具:
rvc-webui/
├── lib/rvc/ # 核心语音转换算法
├── modules/ # WebUI 界面模块
├── models/ # 模型存储目录
│ ├── checkpoints/ # 训练好的模型权重
│ ├── pretrained/ # 预训练基础模型
│ └── training/ # 训练过程文件
├── configs/ # 采样率配置文件
└── outputs/ # 转换结果输出
核心功能详解
语音转换功能
这是 RVC-WebUI 最核心的功能,操作简单直观:
- 选择模型:从下拉菜单中选择预训练的声音模型
- 上传音频:支持 WAV 格式的音频文件
- 调整参数:
- 音高偏移:-12 到 +12 半音范围调节
- F0 提取算法:dio(快速)、harvest(抗噪)、crepe(高精度)
- 检索比例:0.0 到 1.0,控制声音相似度
模型训练功能
想要创建自己的专属声音模型?训练功能让你轻松实现:
训练数据准备:
- 收集 10-30 分钟的清晰语音
- 将音频文件放入
models/training/0_gt_wavs/目录 - 推荐使用 16kHz 采样率的单声道 WAV 文件
训练参数配置:

