Whisper.cpp 编译指南：如何启用 CUDA 实现 GPU 加速 | 极客日志

C++AI算法

Whisper.cpp 编译指南：如何启用 CUDA 实现 GPU 加速

综述由AI生成whisper.cpp 默认编译仅支持 CPU 推理，无法直接使用 NVIDIA 显卡加速。若需 GPU 性能，需在编译时添加 -DWHISPER_CUBLAS=ON 参数，或直接下载官方提供的 cublas 预编译版本。验证方法包括检查启动日志中的 ggml_cuda_init 信息或观察可执行文件大小。实测数据显示，启用 CUDA 后 5 秒音频识别时间可从 30 秒降至 0.4 秒左右，效率提升显著。本文详细对比了不同版本的编译选项、依赖环境及性能差异，并提供了具体的排查步骤和配置建议。

魔尊发布于 2026/4/7更新于 2026/5/2313 浏览

Whisper.cpp 默认不支持 CUDA，如何开启 GPU 加速？

很多开发者在初次接触 whisper.cpp 时都会遇到一个问题：为什么明明有 NVIDIA 显卡，推理速度却和 CPU 差不多？

核心结论很明确：默认编译版本仅支持 CPU。若需利用 GPU 进行加速，必须在编译时显式启用 CUDA 支持，或直接下载官方提供的预编译版本。

编译选项对比

1. 默认编译（纯 CPU）

这是最基础的构建方式，无需额外依赖，但性能受限。

# Linux/Mac
make

# Windows (CMake)
cmake ..
cmake --build . --config Release

生成的可执行文件如 whisper-server.exe、main.exe 等仅能调用 CPU 资源。虽然兼容性最好，但在处理长音频或高并发场景时，延迟会明显增加。

2. 启用 CUDA 编译（GPU 加速）

通过添加特定参数，可以链接 CUDA 库，从而利用 NVIDIA 显卡的算力。

# Windows (CMake)
cmake .. -DWHISPER_CUBLAS=ON
cmake --build . --config Release

# Linux/Mac
make WHISPER_CUBLAS=1

注意：

需要安装完整的 CUDA Toolkit。
生成的二进制文件体积会显著增大（约 15-25 MB），且依赖 cublas64_12.dll 等动态库。
支持混合模式，可通过 --no-gpu 参数强制回退到 CPU。

如何验证是否成功启用 CUDA？

方法一：查看启动日志（推荐）

运行程序并尝试加载模型，观察控制台输出。

✅ 成功标志：

ggml_cuda_init: found 1 CUDA devices: Device 0: NVIDIA GeForce RTX 4060
whisper_model_load: CUDA0 total size = 487.01 MB

❌ 失败标志：

whisper_backend_init_gpu: no GPU found
whisper_model_load: CPU total

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

whisper-server.exe -m models/ggml-small.bin --use-gpu

REM 进入项目目录
cd D:\U3DProject\whisper.cpp-master

REM 创建构建目录
mkdir build
cd build

REM 配置 CMake（关键步骤：开启 CUBLAS）
cmake .. -DWHISPER_CUBLAS=ON -DCMAKE_BUILD_TYPE=Release

REM 如果提示找不到 CUDA，可手动指定路径
cmake .. -DWHISPER_CUBLAS=ON ^
         -DCUDA_TOOLKIT_ROOT_DIR="C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2"

REM 开始编译
cmake --build . --config Release

版本	编译选项	识别时间	RTF	依赖
CPU 版本	默认编译	30 秒	6.0	无
CUDA 版本	`-DWHISPER_CUBLAS=ON`	0.4 秒	0.08	CUDA Toolkit
OpenCL 版本	`-DWHISPER_CLBLAST=ON`	2 秒	0.4	OpenCL
Vulkan 版本	`-DWHISPER_VULKAN=ON`	1.5 秒	0.3	Vulkan SDK

Whisper.cpp 编译指南：如何启用 CUDA 实现 GPU 加速

Whisper.cpp 默认不支持 CUDA，如何开启 GPU 加速？

编译选项对比

1. 默认编译（纯 CPU）

2. 启用 CUDA 编译（GPU 加速）

如何验证是否成功启用 CUDA？

方法一：查看启动日志（推荐）

更多推荐文章

相关免费在线工具

方法二：检查文件大小

方法三：命令行测试

获取支持 CUDA 的版本

方案 A：下载预编译版本（推荐）

方案 B：自行编译

性能实测对比

常见问题排查

总结

更多推荐文章

相关免费在线工具

Whisper.cpp 编译指南：如何启用 CUDA 实现 GPU 加速

Whisper.cpp 默认不支持 CUDA，如何开启 GPU 加速？

编译选项对比

1. 默认编译（纯 CPU）

2. 启用 CUDA 编译（GPU 加速）

如何验证是否成功启用 CUDA？

方法一：查看启动日志（推荐）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

方法二：检查文件大小

方法三：命令行测试

获取支持 CUDA 的版本

方案 A：下载预编译版本（推荐）

方案 B：自行编译

性能实测对比

常见问题排查

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具