跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

OpenAI Whisper 音频转录实战指南

OpenAI Whisper 音频转录实战指南介绍如何使用 Whisper 模型将音频文件转换为文本。涵盖 Python 环境配置、库安装及自定义脚本编写方法,支持 mp3、wav 等多种格式批量处理,适用于播客、讲座等场景的语音转写任务。

乱七八糟发布于 2026/3/24更新于 2026/6/1517 浏览

OpenAI Whisper 音频转录实战指南

Whisper 是 OpenAI 推出的开源自动语音识别(ASR)模型,在多种语言环境下表现优异。无论是播客、会议记录还是个人录音,它都能高效地将其转换为文本。

环境准备

开始之前,确保你的开发环境满足以下要求:

  • Python 3.7 或更高版本
  • 足够的磁盘空间(模型权重从几十 MB 到几 GB 不等,取决于选择的精度)
  • 稳定的网络连接(首次运行需下载模型文件)

安装依赖

通过 pip 安装官方库即可:

pip install openai-whisper

等待安装完成,无需额外配置复杂的环境变量。

脚本使用示例

为了简化批量处理流程,我们可以编写一个封装脚本。下面是一个基础实现,支持常见音频格式并自动保存结果。

核心代码

创建一个 transcribe_audio.py 文件,内容如下:

import whisper
import os

def transcribe_audio(file_path, model_size="medium"):
    # 加载模型,首次运行会自动下载
    model = whisper.load_model(model_size)
    
    # 执行转录
    result = model.transcribe(file_path)
    
    # 创建输出目录
    output_dir = "transcripts"
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    # 保存文本
    output_file = os.path.join(output_dir, f"{os.path.basename(file_path)}.txt")
    with open(output_file, "w", encoding="utf-8") as f:
        f.write(result["text"])
    
    print(f"已保存至:{output_file}")

if __name__ == "__main__":
    # 替换为你的音频文件路径
    audio_file = "example.mp3"
    if os.path.exists(audio_file):
        transcribe_audio(audio_file)
    else:
        print("未找到指定音频文件")

运行说明

  1. 将上述代码保存为 transcribe_audio.py。
  2. 确保当前目录下存在待处理的音频文件,或者修改代码中的 audio_file 路径。
  3. 在终端进入脚本所在目录,执行:
python transcribe_audio.py

程序会自动下载对应大小的模型(若本地不存在),并在 transcripts 文件夹中生成对应的 .txt 转录结果。遇到错误时,控制台会直接反馈原因,方便排查。

进阶提示

  • 模型选择:tiny, base, small, medium, large。越大越准确但速度越慢,内存占用越高。
  • 多语言支持:默认自动检测语言,也可通过参数强制指定。
  • 批量处理:结合 glob 模块可轻松遍历文件夹内所有音频文件。

这套方案既保留了灵活性,又避免了重复造轮子,适合大多数日常转写需求。

目录

  1. OpenAI Whisper 音频转录实战指南
  2. 环境准备
  3. 安装依赖
  4. 脚本使用示例
  5. 核心代码
  6. 运行说明
  7. 进阶提示
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 昇腾 NPU 部署 CodeLlama 实战指南
  • 数据结构:基于队列的二叉树深度计算(层次遍历实现)
  • 探索 Ovis 多模态大模型量化实战指南
  • 大模型时代人形机器人感知:视觉 - 语言模型在机器人中的应用
  • 配置 Python 环境及安装 PyCharm 详细指南
  • 在 Windows 上本地运行 DeepSeek 的三步指南
  • Stable Diffusion XL 1.0 灵感画廊免配置部署教程
  • WebGIS 实战:WKT 转 GeoJSON 方法与 Leaflet 集成
  • Windows 11 安装 JDK 25:下载、配置环境变量及验证
  • 大模型 AI 产品经理学习路径:从基础到实战的完整指南
  • 宇树机器人g1二次开发:建图,定位,导航手把手教程(四)导航仿真部分:建完图之后打开仿真导航
  • AI Agent 架构深度解析:从原理到应用
  • 2024 信奥赛 C++ 提高组 CSP-S 复赛真题:超速检测
  • Cursor 中配置和使用 MCP 服务实战指南
  • Python 实现月相计算与可视化系统
  • 大模型本地部署与优化实战指南
  • Win11 安装 Node.js 后 npm install 报错提示禁止运行脚本的解决方法
  • Git 安装流程与基础使用指南
  • Lit 与 Alpine.js:轻量级前端开发的两种路径
  • FAST_LIO 与 FAST_LIO2 算法原理及环境复现

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online