跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
C++AI算法

Whisper.cpp 量化模型清单及 ggml 格式下载指南

Whisper.cpp 作为 OpenAI Whisper 的高效 C++ 实现,通过量化技术降低模型精度以减小尺寸。支持 q4_0 至 q8_0 多种量化级别,适用于不同资源受限设备。ggml 格式模型文件需从官方 GitHub 仓库 Releases 页面获取,命名包含模型规模与语言标识。建议根据场景选择 q5_0 或 q5_1 以平衡性能与精度,使用时需注意版本兼容性及跨平台支持。

神经兮兮发布于 2026/3/25更新于 2026/5/78 浏览

Whisper.cpp 量化模型下载指南

Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现,支持量化技术来减小模型尺寸。量化通过降低模型参数的精度(如从 32 位浮点数到 4 位整数)来减少存储和计算需求,同时保持合理的准确性。ggml 格式是一种轻量级模型格式,专为资源受限设备优化。以下信息基于 Whisper.cpp 官方 GitHub 仓库,介绍获取量化版本清单和下载链接的方法。

量化版本清单

Whisper.cpp 支持多种量化级别,每种对应不同的压缩率和精度权衡。以下是常见量化版本清单(基于最新官方数据):

  • q4_0:4 位量化,极致压缩,模型尺寸最小,适合内存受限设备(如嵌入式系统)。精度损失较高。
  • q4_1:4 位量化,带优化参数,比 q4_0 略大但精度更好。
  • q5_0:5 位量化,平衡压缩和精度,推荐通用场景。
  • q5_1:5 位量化,带优化参数,精度更接近原始模型。
  • q8_0:8 位量化,压缩率较低,但精度损失最小,适合高准确性需求。

这些量化版本适用于不同规模的 Whisper 模型(例如 tiny、base、small、medium、large)。量化过程可表示为:$$ \text{原始模型尺寸} \times \frac{\text{量化位数}}{32} \approx \text{量化后尺寸} $$ 例如,Whisper large 原始模型约 2.9GB,使用 q4_0 量化后约 1.5GB。

ggml 格式模型下载

所有量化模型文件均以 ggml 格式提供,您可以从 Whisper.cpp 的官方 GitHub 仓库下载。以下是步骤指南:

  1. 访问 GitHub 仓库: 打开浏览器,访问 Whisper.cpp GitHub 页面。推荐从官方来源获取,确保模型安全可靠。
  2. 转到 Releases 页面: 在仓库主页,点击顶部导航栏的 "Releases",或直接访问 Releases 页面。这里提供所有预编译模型文件。
  3. 下载量化模型: 在 Releases 页面,查找最新版本(如 v1.5.0)。模型文件命名规则为: ggml-model-whisper-<模型规模>-<语言>.q<量化类型>.bin 例如:点击文件名直接下载(文件大小从 50MB 到 1.5GB 不等)。完整清单包括:
  • ggml-model-whisper-base.en-q4_0.bin:英语基础模型,q4_0 量化。

  • ggml-model-whisper-large.q5_0.bin:多语言大型模型,q5_0 量化。

  • tiny 模型:q4_0, q5_0 等

  • base 模型:q4_0, q5_1, q8_0 等

  • small 模型:q4_1, q5_0 等

  • medium 模型:q5_0, q8_0 等

  • large 模型:q4_0, q5_1 等(建议优先下载 q5_0 或 q5_1 以平衡性能)

使用代码示例: 下载后,您可以使用 Whisper.cpp 命令行工具运行模型。确保先安装依赖(见 GitHub README)。示例命令:

# 运行量化模型(假设模型文件在本地)
./main -m models/ggml-model-whisper-base.en-q4_0.bin -f audio.wav

注意事项

  • 来源安全:只从官方 GitHub 下载,避免第三方源以防恶意软件。
  • 兼容性:量化模型需与 Whisper.cpp 版本匹配;检查 Releases 说明。ggml 格式支持跨平台(Windows、Linux、macOS)。
  • 性能建议:q4_0 适合极致压缩,但精度较低;q5_0 或 q5_1 推荐一般使用。原始模型与量化对比:量化后推理速度提升 2 倍以上,内存占用减少 50%。
  • 版本更新:GitHub 仓库定期更新,如有新量化版本,建议关注 Releases 页面。
  • 通过以上步骤,您可以轻松获取所需的量化模型。

    目录

    1. Whisper.cpp 量化模型下载指南
    2. 量化版本清单
    3. ggml 格式模型下载
    4. 运行量化模型(假设模型文件在本地)
    5. 注意事项
    • 💰 8折买阿里云服务器限时8折了解详情
    • GPT-5.5 超高智商模型1元抵1刀ChatGPT中转购买
    • 代充Chatgpt Plus/pro 帐号了解详情
    • 🤖 一键搭建Deepseek满血版了解详情
    • 一键打造专属AI 智能体了解详情
    极客日志微信公众号二维码

    微信扫一扫,关注极客日志

    微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

    更多推荐文章

    查看全部
    • GitHub Copilot 学生认证指南:合规申请与常见问题解析
    • Git SSH 公钥认证失败解决方案:配置密钥以访问 GitHub 仓库
    • OpenArm 开源协作机器人架构设计与实践
    • Python 2026 发展展望:AI 时代的核心基础设施语言
    • 大语言模型(LLM)原理与应用实战
    • IntelliJ IDEA中GitHub Copilot完整使用教程:从安装到实战技巧
    • 大模型技术基础学习路线与核心能力要求
    • ROS2 TF 系统:机器人坐标系管理详解
    • 卷积神经网络(CNN)深度解析:理论、实现与应用
    • 旧安卓手机变服务器:KSWEB 部署 Typecho 配合 cpolar 穿透
    • C++ 继承机制详解:概念、访问控制与多继承处理
    • CentOS 系统定时执行 Python 邮件发送的五种方案
    • 数据结构:顺序表与链表
    • LoRA 训练入门:AI 绘画模型定制
    • QoderWork:阿里推出的桌面级通用智能体助手
    • DeepSeek-R1 如何用 29 万美元成本改写 AI 推理规则
    • Isaac Lab 机器人强化学习实战:配置架构、添加流程与调参技巧
    • AI 时代产品经理全流程落地管控方法:从需求到上线
    • HarmonyOS 6.0+ 深度解析:游戏性能优化与 PC 生态破局
    • 钢条切割与饼干分发算法设计详解

    相关免费在线工具

    • 加密/解密文本

      使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

    • RSA密钥对生成器

      生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

    • Mermaid 预览与可视化编辑

      基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

    • 随机西班牙地址生成器

      随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

    • Gemini 图片去水印

      基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

    • Base64 字符串编码/解码

      将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online