跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表

目录

  1. Whisper.cpp 量化模型下载指南
  2. 量化版本清单
  3. ggml 格式模型下载
  4. 1. 访问 GitHub 仓库
  5. 2. 转到 Releases 页面
  6. 3. 下载量化模型
  7. 代码示例
  8. 注意事项
  • 💰 8折买阿里云服务器限时8折了解详情
C++AI算法

Whisper.cpp 量化版本清单与 ggml 格式模型下载指南

Whisper.cpp 量化模型通过降低参数精度减小尺寸,支持 q4_0 至 q8_0 等多种级别。用户可从官方 GitHub Releases 页面下载 ggml 格式文件,如 ggml-model-whisper-base.en-q4_0.bin。量化后推理速度提升显著,内存占用减少,适用于嵌入式及通用场景。使用时需匹配版本号并仅从官方源获取以确保安全。

SparkGeek发布于 2026/3/21更新于 2026/4/211 浏览

Whisper.cpp 量化模型下载指南

Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现,支持量化技术来减小模型尺寸。量化通过降低模型参数的精度(如从 32 位浮点数到 4 位整数)来减少存储和计算需求,同时保持合理的准确性。ggml 格式是一种轻量级模型格式,专为资源受限设备优化。

量化版本清单

Whisper.cpp 支持多种量化级别,每种对应不同的压缩率和精度权衡。以下是常见量化版本清单:

  • q4_0:4 位量化,极致压缩,模型尺寸最小,适合内存受限设备(如嵌入式系统)。精度损失较高。
  • q4_1:4 位量化,带优化参数,比 q4_0 略大但精度更好。
  • q5_0:5 位量化,平衡压缩和精度,推荐通用场景。
  • q5_1:5 位量化,带优化参数,精度更接近原始模型。
  • q8_0:8 位量化,压缩率较低,但精度损失最小,适合高准确性需求。

这些量化版本适用于不同规模的 Whisper 模型(例如 tiny、base、small、medium、large)。量化过程可表示为:$$ \text{原始模型尺寸} \times \frac{\text{量化位数}}{32} \approx \text{量化后尺寸} $$ 例如,Whisper large 原始模型约 2.9GB,使用 q4_0 量化后约 1.5GB。

ggml 格式模型下载

所有量化模型文件均以 ggml 格式提供,您可以从 Whisper.cpp 的官方 GitHub 仓库下载。

1. 访问 GitHub 仓库

打开浏览器,访问 Whisper.cpp GitHub 页面。这是唯一推荐来源,确保模型安全可靠。

2. 转到 Releases 页面

在仓库主页,点击顶部导航栏的 "Releases",或直接访问 Releases 页面。这里提供所有预编译模型文件。

3. 下载量化模型

在 Releases 页面,查找最新版本(如 v1.5.0)。模型文件命名规则为:ggml-model-whisper-<模型规模>-<语言>.q<量化类型>.bin。

完整清单包括:

  • ggml-model-whisper-base.en-q4_0.bin:英语基础模型,q4_0 量化。
  • ggml-model-whisper-large.q5_0.bin:多语言大型模型,q5_0 量化。

各规模模型建议:

  • tiny 模型:q4_0, q5_0 等
  • base 模型:q4_0, q5_1, q8_0 等
  • small 模型:q4_1, q5_0 等
  • medium 模型:q5_0, q8_0 等
  • large 模型:q4_0, q5_1 等(建议优先下载 q5_0 或 q5_1 以平衡性能)

代码示例

下载后,您可以使用 Whisper.cpp 命令行工具运行模型。确保先安装依赖(见 GitHub README)。示例命令:

./main -m models/ggml-model-whisper-base.en-q4_0.bin -f audio.wav

注意事项

  • 真实性:只从官方 GitHub 下载,避免第三方源以防恶意软件。
  • 兼容性:量化模型需与 Whisper.cpp 版本匹配;检查 Releases 说明。ggml 格式支持跨平台(Windows、Linux、macOS)。
  • 性能建议:q4_0 适合极致压缩,但精度较低;q5_0 或 q5_1 推荐一般使用。原始模型与量化对比:量化后推理速度提升 2 倍以上,内存占用减少 50%。
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog

更多推荐文章

查看全部
  • 归并排序与数组中的逆序对算法解析
  • SpringBoot + Vue 前后端分离项目:权限、工作流与报表实现
  • C++ 位运算技巧与常见算法题解
  • 易语言子程序高级应用:递归、回调与参数设计实战
  • OpenAI 发布 GPT-5.3 Instant:幻觉率降低及 2026 AI 模型排行
  • 国产数据库新机遇:电科金仓融合技术同步全球竞争
  • SkyWalking - .NET / C++ / Lua 探针现状与社区支持

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online

  • Markdown转HTML

    将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online

  • 更新信息:GitHub 仓库定期更新,如有新量化版本,请关注 Releases 页面。
  • Visual Studio Code 中集成 Cursor AI 的完整指南
  • SpringAI Agent 开发实战:利用 Skills 构建代码评审工具
  • SkyWalking Python 应用分布式追踪与埋点实践
  • Spring Web 模块核心概念与 RESTful API 调用实践
  • Python、NumPy、Pandas 和 Matplotlib 版本对应关系
  • Linux 线程控制核心指南:创建、终止与资源管理
  • Linux TCP 协议详解:报文结构、连接状态与流量控制
  • Python 临床知识问答与检索系统架构设计与实现
  • KES 数据库运维:资源回收与膨胀防治全攻略
  • Linux 进程信号的产生机制
  • 二分查找应用:山峰数组的峰顶索引与寻找峰值
  • Linux 进程等待机制:wait/waitpid 与僵尸进程治理
  • OpenClaw 5 步调优指南:让 AI 助手真正能干活