Faster Whisper v1.7 本地语音转录与字幕生成教程
项目简介
- 基于 SYSTRAN/faster-whisper
- 集成 VAD 语音活动检测
- 支持 GPU / CPU / 云端推理
- 提供日文 → 中文优化模型
版本区别说明
本次发行主要版本:
优化版(含模型依赖)
- 约 4.4GB
- 包含 GPU 依赖
- 包含 VAD 模型
- 包含「5000 小时」优化模型
适合:
- 开箱即用
- 日文转中文场景
- 不想单独下载模型
如何选择正确的 CUDA 版本(NVIDIA)
方法一:使用 nvidia-smi
打开命令行:
nvidia-smi
查看:
CUDA Version: 12.8
这是驱动支持的最高 CUDA 版本。
驱动兼容性参考
| CUDA 版本 | Windows 最低驱动 |
|---|---|
| 11.8 | ≥452.39 |
| 12.2 | ≥525.60 |
| 12.8 | ≥570.65 |
显卡推荐对应关系
| 显卡 | 推荐 CUDA |
|---|---|
| GTX 10 / 16 系列 | 11.8 |
| RTX 20 系列 | 11.8 / 12.2 |
| RTX 30 系列 | 12.2 |
| RTX 40 系列 | 12.2 / 12.8 |
| RTX 50 系列 | 必须 12.8 |
⚠️ RTX 50 系列必须使用 CUDA 12.8。
AMD 显卡用户(v1.7 新增支持)
v1.7 最大更新点:
新增 AMD ROCm/HIP 支持
支持架构:
- RDNA1 → gfx101x
- RDNA2 → gfx103x
- RDNA3 → gfx110x
- RDNA4 → gfx120x
示例对应关系:
| 显卡 | 下载后缀 |
|---|---|
| RX 5700 | gfx101x_dgpu |
| RX 6600 |


