Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南 | 极客日志

PythonAI算法

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

Fish-Speech 1.5 是一款基于双自回归 Transformer 架构的高效语音合成模型。如何通过现成镜像在 5 分钟内部署其 WebUI 和 API 服务。内容包括环境准备、WebUI 界面操作（文本输入、声音克隆、参数调整）、API 接口调用示例（Python 及 cURL）以及服务管理与故障排查。该方案支持中文界面，提供稳定的 Supervisor 管理服务，适合集成到自动化播报系统或进行 AI 语音创作。

松间照月发布于 2026/4/5更新于 2026/7/1955 浏览

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

Fish-Speech 1.5 是一款基于双自回归 Transformer 架构的高效语音合成模型。它采用创新架构，计算效率高，生成的声音质量较好。通过现成的镜像可以直接部署，省去了复杂的安装配置过程。

1. 准备工作：理解功能

在开始之前，了解项目的使用方式：

WebUI（网页界面）：最推荐的方式。打开浏览器输入文字，点击按钮即可生成声音。界面支持中文，操作直观。

API 接口：适合集成到程序中，如自动播报系统。通过发送 HTTP 请求获取语音文件。

服务启动后占用两个端口：

7860 端口：WebUI 访问入口
8080 端口：API 访问入口

所有服务由 Supervisor 管理，支持开机自动启动和崩溃自动重启。

2. 快速启动：5 分钟搞定

2.1 第一步：获取并启动镜像

在支持镜像部署的环境（如云平台或本地容器）中，找到'fish-speech - 1.5 开源文本转语音（TTS）模型 Webui'镜像并部署。

镜像启动后会自动完成以下配置：

安装 Python 环境和依赖包
下载 Fish-Speech 1.5 模型文件
配置中文界面
启动 WebUI 和 API 服务

2.2 第二步：访问 WebUI 界面

服务启动通常需要 1-2 分钟。确认启动成功后，在浏览器地址栏输入：

http://你的服务器 IP:7860

如果是本地运行，可使用 http://localhost:7860 或 http://127.0.0.1:7860。

成功访问后应看到类似下图的界面：

Fish-Speech WebUI 界面示意图

界面左侧为输入区域，右侧为控制区域，中间显示生成结果。

2.3 第三步：第一次语音合成体验

输入文本：在'输入文本'框中输入要合成的文字。
等待同步：输入后务必等待实时规范化文本同步完成，提示'同步完成'后再点击生成。
生成音频：点击'🎧 生成'按钮。
等待结果：根据文本长度，通常几秒到十几秒完成。
播放和下载：生成完成后点击播放试听，满意可下载保存。

建议首次使用短文本测试（10-20 字），以便快速查看效果。

3. 核心功能详解

3.1 声音克隆

上传一段参考音频（如自己的声音），让 AI 模仿该音色朗读其他文字。

操作步骤：

准备参考音频：选择 5-10 秒清晰人声录音，背景噪音小，格式支持 wav、mp3 等。
上传参考音频：在 WebUI 中找到'参考音频'区域上传文件。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

http://你的服务器 IP:8080

import requests

url = "http://你的服务器 IP:8080/v1/tts"
payload = {
    "text": "你好，这是一个 API 测试示例。",
    "format": "wav"
}

response = requests.post(url, json=payload)

if response.status_code == 200:
    with open("output.wav", "wb") as f:
        f.write(response.content)
    print("语音生成成功，已保存为 output.wav")
else:
    print(f"请求失败，状态码：{response.status_code}")
    print(f"错误信息：{response.text}")

import requests
import base64

url = "http://你的服务器 IP:8080/v1/tts"

with open("reference.wav", "rb") as audio_file:
    audio_base64 = base64.b64encode(audio_file.read()).decode('utf-8')

payload = {
    "text": "用参考音频的音色说这句话。",
    "references": [
        {
            "audio": audio_base64,
            "text": "这是参考音频的原文内容"
        }
    ],
    "temperature": 0.7,
    "top_p": 0.7,
    "repetition_penalty": 1.2,
    "format": "mp3"
}

response = requests.post(url, json=payload)

if response.status_code == 200:
    with open("output_with_reference.mp3", "wb") as f:
        f.write(response.content)
    print("带参考音频的语音生成成功")
else:
    print(f"错误：{response.status_code}, {response.text}")

curl -X POST "http://你的服务器 IP:8080/v1/tts" \
-H "Content-Type: application/json" \
-d '{ "text": "这是通过命令行生成的语音。", "temperature": 0.7, "format": "wav" }' \
--output speech.wav

supervisorctl status

fish-speech-webui RUNNING pid 12345, uptime 1:23:45
fish-speech RUNNING pid 12346, uptime 1:23:45

# 重启 WebUI 服务
supervisorctl restart fish-speech-webui
# 重启 API 服务
supervisorctl restart fish-speech
# 停止服务
supervisorctl stop fish-speech-webui
supervisorctl stop fish-speech
# 启动服务
supervisorctl start fish-speech-webui
supervisorctl start fish-speech

# 查看 WebUI 输出日志（最近 100 行）
tail -100 /var/log/fish-speech-webui.out.log
# 查看 WebUI 错误日志
tail -100 /var/log/fish-speech-webui.err.log
# 查看 API 输出日志
tail -100 /var/log/fish-speech.out.log
# 查看 API 错误日志
tail -100 /var/log/fish-speech.err.log
# 实时查看日志更新
tail -f /var/log/fish-speech-webui.out.log

# 编辑语言配置文件
echo "en_US" > /root/fish-speech-1.5/.locale
# 重启 WebUI 服务使更改生效
supervisorctl restart fish-speech-webui

添加反向代理：如 Nginx。

server {
    listen 80;
    server_name your-domain.com;
    location / {
        proxy_pass http://localhost:7860;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }
}

配置 HTTPS：使用 Let's Encrypt 等工具配置 SSL 证书。
添加访问控制：设置 API Key 认证、限制 IP 范围、配置频率限制。
监控与告警：监控 GPU 使用率、健康检查、日志轮转。

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

1. 准备工作：理解功能

2. 快速启动：5 分钟搞定

2.1 第一步：获取并启动镜像

2.2 第二步：访问 WebUI 界面

2.3 第三步：第一次语音合成体验

3. 核心功能详解

3.1 声音克隆

更多推荐文章

相关免费在线工具

3.2 参数调整

3.3 批量处理与长文本

4. 通过 API 编程调用

4.1 查看 API 文档

4.2 Python 调用示例

4.3 带参考音频的 Python 示例

4.4 cURL 命令行调用

5. 服务管理与故障排查

5.1 服务状态检查

5.2 服务控制命令

5.3 查看日志

5.4 常见问题解决

6. 高级配置与优化

6.1 修改界面语言

6.2 生产环境部署建议

6.3 性能优化建议

7. 总结

更多推荐文章

相关免费在线工具

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

Fish-Speech 1.5 语音合成 WebUI 搭建与使用指南

1. 准备工作：理解功能

2. 快速启动：5 分钟搞定

2.1 第一步：获取并启动镜像

2.2 第二步：访问 WebUI 界面

2.3 第三步：第一次语音合成体验

3. 核心功能详解

3.1 声音克隆

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 参数调整

3.3 批量处理与长文本

4. 通过 API 编程调用

4.1 查看 API 文档

4.2 Python 调用示例

4.3 带参考音频的 Python 示例

4.4 cURL 命令行调用

5. 服务管理与故障排查

5.1 服务状态检查

5.2 服务控制命令

5.3 查看日志

5.4 常见问题解决

6. 高级配置与优化

6.1 修改界面语言

6.2 生产环境部署建议

6.3 性能优化建议

7. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具