Whisper 音频转录工具使用指南

OpenAI Whisper 是一款开源语音识别模型，支持将音频文件转换为文本。使用前需安装 Python 3.7 及以上版本并预留足够磁盘空间。通过 pip 安装 openai-whisper 包后，即可在命令行中处理 mp3、wav 等多种格式的音频文件，实现批量转录与进度显示。

板砖工程师发布于 2026/4/11更新于 2026/7/2037 浏览

Whisper 音频转录

OpenAI 推出的 Whisper 是一款强大的开源语音识别模型，可将音频文件转换为文本。支持多种格式，适用于播客、讲座及录音整理等场景。

开始之前，请确保满足以下条件：

打开命令行，输入以下命令安装：

pip install openai-whisper

安装完成后，可通过命令行调用 Whisper 进行转录。该工具支持 mp3、wav、m4a、flac 等常见音频格式。通常会在执行时自动创建结果文件夹存放转录文本，并实时显示处理进度。遇到错误时会输出提示信息，便于排查问题。