OpenAI 的 Whisper 工具可将音频文件转换为文本,适用于播客、讲座或录音等场景。
准备工作
在开始之前,你需要准备好:
- Python 3.7 或更高版本
- 磁盘空间(模型大小从几十 MB 到几 GB 不等)
- 网络连接(首次使用需要下载模型)
安装 Whisper
安装命令如下:
pip install openai-whisper
使用转录脚本
已提供脚本 transcribe_audio.py 用于批量处理音频文件。
脚本功能
- 支持多种音频格式:mp3、wav、m4a、flac
- 自动创建
transcripts文件夹存放结果 - 可选不同大小的模型
- 实时显示进度
- 错误提示
使用方法
在命令行进入音频文件所在目录,然后输入:
python transcribe_audio.py <audio_file_path>

