Whisper 语音识别库的安装与配置指南 | 极客日志

PythonAI算法

Whisper 语音识别库的安装与配置指南

Whisper 语音识别库的安装与配置流程。主要步骤包括：配置 Python 环境（3.8-3.11）、安装 PyTorch 框架（支持 CPU/GPU）、安装 openai-whisper 库以及配置 FFmpeg 音频处理工具。文中提供了 Windows、macOS 和 Linux 下的具体命令，包含虚拟环境创建、模型选择建议及常见问题解决方案，帮助用户快速完成本地部署并验证安装状态。

观心发布于 2026/4/6更新于 2026/7/1853 浏览

引言

在之前的介绍中，我们了解了 Whisper 的基本概念、发展背景和主要特点。本文将详细介绍 Whisper 的安装与配置方法，帮助您快速上手使用。

Whisper 的安装相对简单，主要包括 Python 环境配置、Whisper 库安装和 FFmpeg 配置三个步骤。我们将详细说明每个步骤的具体操作方法，并提供常见问题的解决方案。

系统要求

在安装 Whisper 之前，请确保您的系统满足以下要求：

操作系统：Windows、macOS 或 Linux
Python 版本：3.8-3.11
PyTorch 版本：支持最新版本的 PyTorch
硬件要求：
- CPU：支持 x86_64 架构的处理器
- GPU（可选）：支持 CUDA 的 NVIDIA GPU（用于加速模型推理）
- 内存：至少 4GB RAM，推荐 8GB 以上

安装步骤

1. 配置 Python 环境

首先，您需要安装 Python 环境。如果您已经安装了 Python 3.8-3.11，可以跳过这一步。

1.1 下载 Python

访问 Python 官方网站，下载适合您操作系统的 Python 安装包。推荐下载 Python 3.10 或 3.11 版本，因为它们与 Whisper 的兼容性较好。

1.2 安装 Python

Windows：运行下载的安装程序，勾选"Add Python to PATH"选项，然后点击"Install Now"。
macOS：运行下载的.pkg 安装包，按照提示完成安装。
Linux：使用系统包管理器安装 Python，例如：

# Ubuntu/Debian
sudo apt update && sudo apt install python3 python3-pip
# CentOS/RHEL
sudo yum install python3 python3-pip

1.3 验证 Python 安装

安装完成后，打开命令行工具，输入以下命令验证 Python 是否安装成功：

python --version
pip --version

如果输出 Python 和 pip 的版本信息，则说明安装成功。

2. 安装 PyTorch

Whisper 依赖于 PyTorch 框架，因此您需要安装 PyTorch。访问 PyTorch 官方网站，根据您的操作系统和硬件配置选择合适的安装命令。

2.1 安装 CPU 版本的 PyTorch

如果您没有 GPU，或者不想使用 GPU 加速，可以安装 CPU 版本的 PyTorch：

pip3 install torch torchvision torchaudio

2.2 安装 GPU 版本的 PyTorch

如果您有支持 CUDA 的 NVIDIA GPU，可以安装 GPU 版本的 PyTorch 以获得更好的性能：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# CUDA 12.1
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# CUDA 11.8
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

import torch
print(torch.__version__)
# 检查是否支持 CUDA
print(torch.cuda.is_available())

pip install -U openai-whisper

pip install git+https://github.com/openai/whisper.git

pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git

# Ubuntu/Debian
sudo apt update && sudo apt install ffmpeg
# CentOS/RHEL
sudo yum install ffmpeg
# Arch Linux
sudo pacman -S ffmpeg

brew install ffmpeg

ffmpeg -version

# Linux/macOS
export PATH="$HOME/.cargo/bin:$PATH"

pip install setuptools-rust

whisper --help

import whisper

# 加载 tiny 模型
try:
    model = whisper.load_model("tiny")
    print("模型加载成功！")
    # 查看可用模型
    print("可用模型：", whisper.available_models())
    print("Whisper 安装成功！")
except Exception as e:
    print(f"安装失败：{e}")

python test_whisper.py

pip install -U openai-whisper --user

# 创建虚拟环境
python -m venv whisper-env
# 激活虚拟环境
# Windows
whisper-env\Scripts\activate
# Linux/macOS
source whisper-env/bin/activate
# 在虚拟环境中安装 Whisper
pip install -U openai-whisper

pip install -U openai-whisper

Whisper 语音识别库的安装与配置指南

引言

系统要求

安装步骤

1. 配置 Python 环境

1.1 下载 Python

1.2 安装 Python

1.3 验证 Python 安装

2. 安装 PyTorch

2.1 安装 CPU 版本的 PyTorch

2.2 安装 GPU 版本的 PyTorch

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3 验证 PyTorch 安装

3. 安装 Whisper

3.1 使用 pip 安装（推荐）

3.2 从 GitHub 仓库安装

3.3 更新 Whisper

4. 配置 FFmpeg

4.1 下载 FFmpeg

4.2 安装 FFmpeg

4.3 验证 FFmpeg 安装

5. 安装其他依赖（可选）

5.1 Rust（可选）

5.2 setuptools_rust（可选）

验证安装

1. 使用命令行工具

2. 使用 Python API

常见问题解决方案

1. 安装 Whisper 时遇到权限问题

2. 模型下载失败

3. FFmpeg 未找到

4. CUDA 相关错误

5. Python 版本不兼容

最佳实践

1. 使用虚拟环境

2. 选择合适的模型

3. 定期更新 Whisper

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具