在本地搭建 Whisper 语音转写环境其实并不复杂,只要按部就班配置好依赖即可。整个过程适用于 Windows、macOS 和 Linux 系统,其中 Windows 亲测可用。
一、基础环境准备
- 安装 Python 确保安装 Python 3.8+ 版本:
- 下载地址:python.org/downloads
- 安装时务必勾选 "Add Python to PATH"(关键步骤)
- 验证 Python 安装
打开命令行(CMD/PowerShell/终端),输入
python --version或python3 --version(macOS/Linux),显示版本号即表示安装成功。
二、安装 Whisper
国内用户建议配置镜像加速以提升下载速度:
pip install openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
- 安装核心库 命令行输入以下命令(基础安装默认包含轻量模型支持):
pip install openai-whisper
- 安装音频处理依赖
Whisper 需要额外工具处理音频格式转换:Windows 需下载并安装 FFmpeg,将
ffmpeg.exe所在目录添加到系统环境变量PATH。
三、下载 Whisper 模型
Whisper 会自动下载所需模型,但推荐提前手动指定大型模型 large-v3 以获得最佳效果:
pip install "openai-whisper[large-v3]"
模型会保存在以下路径(可手动替换或管理):
- Windows:
C:\Users\你的用户名\.cache\whisper\ - macOS/Linux:
~/.cache/whisper/
四、基本使用方法
1. 命令行直接转写
# 转写音频文件(支持 WAV/MP3/MP4 等格式)
whisper 你的音频文件路径.wav --model large-v3 --language Chinese
# 示例(替换为你的文件路径)
whisper D:\Net_Program\test\whisper-test.wav --model large-v3 --language Chinese
2. 关键参数说明
--model:指定模型(tiny/base/small/medium/large-v3,越大精度越高,需求资源越多)--language Chinese:指定语言为中文(避免自动检测错误)--output_dir 输出目录:指定结果保存路径

