Whisper 语音识别库编译与 CUDA 加速配置指南
官方发布地址:https://github.com/ggml-org/whisper.cpp/releases
Whisper 默认编译是否支持 CUDA?
直接回答
不支持!默认编译只支持 CPU!
需要在编译时显式启用 CUDA 支持才行。
whisper.cpp 的编译选项对比
默认编译(纯 CPU)
# 默认编译命令(Linux/Mac)
make
# 或者 CMake
cmake ..
cmake --build . --config Release
生成的可执行文件:
whisper-server.exe← 只支持 CPUwhisper.exe← 只支持 CPUmain.exe← 只支持 CPU
特点:
- ✅ 编译简单,无依赖
- ✅ 任何机器都能运行
- ❌ 只能用 CPU,速度慢
启用 CUDA 编译(GPU 加速)
# Windows (CMake)
cmake .. -DWHISPER_CUBLAS=ON
cmake --build . --config Release
# Linux/Mac
make WHISPER_CUBLAS=1
生成的可执行文件:
whisper-server.exe← 支持 GPU + CPUwhisper.exe← 支持 GPU + CPUmain.exe← 支持 GPU + CPU
特点:
- ⚠️ 编译复杂,需要 CUDA Toolkit
- ⚠️ 只能在有 NVIDIA 显卡的机器运行
- ✅ 可以用 GPU,速度快 100 倍
- ✅ 也可以用 CPU(
--no-gpu参数)
如何判断你的 whisper-server.exe 支持不支持 CUDA?
方法 1:查看启动日志(最准确)
whisper-server.exe -m models/ggml-small.bin --use-gpu
✅ 如果支持 CUDA,会看到:
whisper_init_state: kv self size =

