跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
C++AI算法

Whisper.cpp 量化版本清单与 ggml 格式模型下载

综述由AI生成介绍 Whisper.cpp 量化模型下载指南。Whisper.cpp 是 OpenAI Whisper 的 C++ 实现,支持量化技术减小模型尺寸。常见量化级别包括 q4_0、q5_0、q8_0 等,分别对应不同压缩率与精度权衡。模型以 ggml 格式提供,可从官方 GitHub 仓库 Releases 页面下载。示例展示了命令行运行方式。建议根据设备性能选择合适量化版本,如 q5_0 平衡性能与精度。

念念不忘发布于 2026/4/6更新于 2026/5/2128 浏览

Whisper.cpp 量化模型下载指南

Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现,支持量化技术来减小模型尺寸。量化通过降低模型参数的精度(如从 32 位浮点数到 4 位整数)来减少存储和计算需求,同时保持合理的准确性。ggml 格式是一种轻量级模型格式,专为资源受限设备优化。

1. 量化版本清单

Whisper.cpp 支持多种量化级别,每种对应不同的压缩率和精度权衡。以下是常见量化版本清单:

  • q4_0:4 位量化,极致压缩,模型尺寸最小,适合内存受限设备(如嵌入式系统)。精度损失较高。
  • q4_1:4 位量化,带优化参数,比 q4_0 略大但精度更好。
  • q5_0:5 位量化,平衡压缩和精度,推荐通用场景。
  • q5_1:5 位量化,带优化参数,精度更接近原始模型。
  • q8_0:8 位量化,压缩率较低,但精度损失最小,适合高准确性需求。

这些量化版本适用于不同规模的 Whisper 模型(例如 tiny、base、small、medium、large)。量化过程可表示为:$$ \text{原始模型尺寸} \times \frac{\text{量化位数}}{32} \approx \text{量化后尺寸} $$ 例如,Whisper large 原始模型约 2.9GB,使用 q4_0 量化后约 1.5GB。

2. ggml 格式模型下载

所有量化模型文件均以 ggml 格式提供,您可以从 Whisper.cpp 的官方 GitHub 仓库下载。以下是步骤指南:

  1. 访问 GitHub 仓库: 打开浏览器,访问 Whisper.cpp GitHub 页面。请从官方渠道下载以确保安全。
  2. 转到 Releases 页面: 在仓库主页,点击顶部导航栏的 "Releases",或直接访问 Releases 页面。这里提供所有预编译模型文件。
  3. 下载量化模型: 在 Releases 页面,查找最新版本(如 v1.5.0)。模型文件命名规则为: ggml-model-whisper-<模型规模>-<语言>.q<量化类型>.bin 例如:点击文件名直接下载(文件大小从 50MB 到 1.5GB 不等)。完整清单包括:
    • ggml-model-whisper-base.en-q4_0.bin:英语基础模型,q4_0 量化。
    • ggml-model-whisper-large.q5_0.bin:多语言大型模型,q5_0 量化。

具体模型支持情况:

  • tiny 模型:q4_0, q5_0 等
  • base 模型:q4_0, q5_1, q8_0 等
  • small 模型:q4_1, q5_0 等
  • medium 模型:q5_0, q8_0 等
  • large 模型:q4_0, q5_1 等(建议优先下载 q5_0 或 q5_1 以平衡性能)

使用代码示例: 下载后,您可以使用 Whisper.cpp 命令行工具运行模型。确保先安装依赖(见 GitHub README)。示例命令:

# 运行量化模型(假设模型文件在本地)
./main -m models/ggml-model-whisper-base.en-q4_0.bin -f audio.wav

3. 注意事项

  • 真实性:只从官方 GitHub 下载,避免第三方源以防恶意软件。
  • 兼容性:量化模型需与 Whisper.cpp 版本匹配;检查 Releases 说明。ggml 格式支持跨平台(Windows、Linux、macOS)。
  • 性能建议:q4_0 适合极致压缩,但精度较低;q5_0 或 q5_1 推荐一般使用。原始模型与量化对比:量化后推理速度提升 2 倍以上,内存占用减少 50%。
  • 更新信息:GitHub 仓库定期更新,如有新量化版本,请关注 Releases 页面。

目录

  1. Whisper.cpp 量化模型下载指南
  2. 1. 量化版本清单
  3. 2. ggml 格式模型下载
  4. 运行量化模型(假设模型文件在本地)
  5. 3. 注意事项
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 基于 ELF 2 开发板的多传感信息融合多用途巡检机器人
  • 即梦数字人视频生成 API 集成实战
  • OpenClaw 多机器人团队协作构建指南
  • 动态规划核心原理与经典例题解析
  • 归并排序实战:计算右侧小于当前元素个数与翻转对
  • SpringBoot 整合 Neo4j 图数据库实战
  • Windows 本地部署 OpenClaw:搭建 AI 助理并打通微信飞书
  • Linux 泰山派 RK3566 驱动开发:环境搭建与内核编译
  • 本地大模型运行工具 Ollama 安装与使用指南
  • Visual C++ 运行库安装失败问题排查与修复指南
  • Python 字典与结构化数据核心用法
  • Python 接口、抽象基类与协议详解
  • 微信小程序自定义 tabBar 实现指南
  • Ubuntu 24.04 安装 OpenClaw 教程
  • 数据结构:堆排序、冒泡排序与 Hoare 快排实战
  • C/C++ 命名规范:提升代码可读性的关键
  • Qt 6 官方 C++ 类完整清单索引
  • CFAR 恒虚警率目标检测算法与 MATLAB 实战
  • AI 产品经理面试指南与核心知识点整理
  • Java 项目 Linux 云服务器部署指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online