一、基础环境准备
-
安装 Python 确保安装 Python 3.8+:
- 下载地址:python.org/downloads
- 安装时勾选 "Add Python to PATH"(关键步骤)
-
验证 Python 安装 打开命令行(CMD/PowerShell/终端),输入:
python --version或python3 --version(macOS/Linux),显示版本号即表示安装成功。
二、安装 Whisper
# 国内镜像加速(可选)
pip install openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
-
安装核心库 命令行输入以下命令(国内用户可加镜像加速):
pip install openai-whisper -
安装音频处理依赖 Whisper 需要额外工具处理音频格式:Windows:下载并安装 FFmpeg,将
ffmpeg.exe所在目录添加到系统环境变量PATH。
三、下载 Whisper 模型(可选)
Whisper 会自动下载所需模型,也可提前手动下载(推荐大型模型 large-v3 以获得最佳效果):
# 安装时指定模型(自动下载)
pip install "openai-whisper[large-v3]"
模型会保存在以下路径(可手动替换或管理):
- Windows:
C:\Users\你的用户名\.cache\whisper\ - macOS/Linux:
~/.cache/whisper/
四、基本使用方法
1. 命令行直接转写
# 转写音频文件(支持 WAV/MP3/MP4 等格式)
whisper 你的音频文件路径.wav --model large-v3 --language Chinese
# 示例(替换为你的文件路径)
whisper D:\Net_Program\test\whisper-test.wav --model large-v3 --language Chinese
2. 关键参数说明
--model:指定模型(tiny/base/small/medium/large-v3,越大精度越高,需求资源越多)--language Chinese:指定语言为中文(避免自动检测错误)--output_dir 输出目录:指定结果保存路径

