引言
Whisper 作为当前主流的开源语音识别模型,其部署的便捷性直接影响开发效率。本文将聚焦于环境搭建环节,详细拆解从 Python 基础环境到 Whisper 核心库的完整安装流程,并针对常见报错提供排查思路。
系统前置要求
在开始之前,请确认您的机器满足以下基础条件:
- 操作系统:Windows、macOS 或 Linux 均可
- Python 版本:建议 3.8 至 3.11 之间
- PyTorch:支持最新稳定版
- 硬件资源:
- CPU:x86_64 架构处理器
- GPU(可选):NVIDIA 显卡且支持 CUDA(用于加速推理)
- 内存:最低 4GB RAM,推荐 8GB 以上
环境搭建步骤
1. 配置 Python 环境
若已安装 Python 3.8+ 可跳过此步。否则需先获取解释器。
下载与安装
访问 Python 官网 下载对应系统的安装包。推荐使用 3.10 或 3.11 版本以获得最佳兼容性。
- Windows:运行安装程序时务必勾选
Add Python to PATH。 - macOS:直接运行
.pkg文件按向导完成。 - Linux:通过包管理器安装,例如 Ubuntu/Debian:
sudo apt update && sudo apt install python3 python3-pip
CentOS/RHEL 用户可使用:
sudo yum install python3 python3-pip
验证安装
命令行执行以下命令确认版本信息:
python --version
pip --version
2. 安装 PyTorch
Whisper 依赖 PyTorch 框架。根据是否使用 GPU 加速选择不同指令。
CPU 版本
无显卡或仅需基础功能时:
pip3 install torch torchvision torchaudio
GPU 版本
拥有 NVIDIA 显卡可显著提升速度。CUDA 12.1 示例:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
CUDA 11.8 示例:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
验证状态
进入 Python 交互模式检查:
import torch
print(torch.__version__)
(torch.cuda.is_available())

