Windows/Linux/Mac 通用:Whisper 模型跨平台下载与部署指南

Whisper 模型跨平台下载与部署指南

1. 环境准备
  • Python 安装
    • Windows:从官网下载安装包,勾选 Add Python to PATH
  • FFmpeg 安装(音频处理必需):
    • Windows:下载预编译包,解压后添加 bin 目录到系统 PATH

Mac:

brew install ffmpeg 

Linux:

sudo apt install ffmpeg 

Linux/Mac:终端执行:

sudo apt update && sudo apt install python3 pip # Linux brew install python # Mac 
2. 安装 Whisper

所有平台统一命令:

pip install -U openai-whisper 

3. 模型下载
  • 手动下载(解决网络问题):
    1. 从 Hugging Face 仓库下载模型:https://huggingface.co/openai
    2. 将模型文件放入缓存目录:
      • Linux/Mac:~/.cache/whisper
      • Windows:C:\Users\<用户名>\.cache\whisper

自动下载(首次运行时自动获取):

whisper audio.mp3 --model base 
4. 基本使用

Python API

import whisper model = whisper.load_model("base") result = model.transcribe("audio.mp3", fp16=False) # CPU模式 print(result["text"]) 

命令行转录

whisper input.mp3 --language en --model medium 

输出文件:input.mp3.txt(文本)、input.mp3.srt(字幕)

5. 跨平台优化

内存优化(小内存设备):

whisper large.mp3 --model tiny --fp16 False # 关闭半精度计算 

CPU/GPU 配置

# 强制使用 CPU(无 NVIDIA GPU 时) model = whisper.load_model("base", device="cpu") # GPU 加速(需安装 CUDA 版 PyTorch) pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 
6. 常见问题解决
问题解决方案
RuntimeError: No CUDA添加参数 --device cpu
下载模型超时手动下载后放入缓存目录
音频格式不支持用 FFmpeg 转换:ffmpeg -i input.wav output.mp3
中文识别不准指定语言:--language zh
7. 进阶部署

API 服务化(Flask 示例):

from flask import Flask, request import whisper app = Flask(__name__) model = whisper.load_model("base") @app.route('/transcribe', methods=['POST']) def transcribe(): audio = request.files['audio'] result = model.transcribe(audio) return {"text": result["text"]} if __name__ == "__main__": app.run(host='0.0.0.0', port=5000) 

Docker 部署(全平台通用):

FROM python:3.10 RUN apt update && apt install -y ffmpeg RUN pip install openai-whisper CMD ["whisper", "--help"] 
验证安装:终端执行 whisper --version,输出示例:whisper version 2023.xx.x
注意事项
  1. 模型大小选择(按需):
    • tiny (39MB) : 快速转录,精度较低
    • base (74MB) : 平衡选择
    • large (3.1GB): 高精度,需 GPU 支持
  2. 首次运行需下载模型,建议使用稳定网络
  3. 完整文档参考:OpenAI Whisper GitHub

Read more

用 AI 做鸿蒙游戏 NPC,是一种什么体验?

用 AI 做鸿蒙游戏 NPC,是一种什么体验?

子玥酱(掘金 / 知乎 / ZEEKLOG / 简书 同名) 大家好,我是子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚焦于业务型系统的工程化建设与长期维护。 我持续输出和沉淀前端领域的实战经验,日常关注并分享的技术方向包括前端工程化、小程序、React / RN、Flutter、跨端方案, 在复杂业务落地、组件抽象、性能优化以及多端协作方面积累了大量真实项目经验。 技术方向:前端 / 跨端 / 小程序 / 移动端工程化 内容平台:掘金、知乎、ZEEKLOG、简书 创作特点:实战导向、源码拆解、少空谈多落地 文章状态:长期稳定更新,大量原创输出 我的内容主要围绕 前端技术实战、真实业务踩坑总结、框架与方案选型思考、行业趋势解读 展开。文章不会停留在“API 怎么用”,而是更关注为什么这么设计、在什么场景下容易踩坑、

从AIGC到MCP协议:一文掌握大模型核心技术,程序员必收藏的学习指南

从AIGC到MCP协议:一文掌握大模型核心技术,程序员必收藏的学习指南

本文系统介绍了大模型相关技术:AIGC(单/多模态生成内容)、RAG技术(解决实时性问题)、Function Calling(赋予模型工具调用能力)、Agent(智能体,具备规划执行闭环能力)及MCP协议(AI应用的USB-C接口,统一工具接入标准)。文章旨在普及AI知识,帮助读者理解大模型技术生态,适合入门学习收藏。 1、AIGC 1.1 单模态 我们大部分人都是从ChatGPT问世开始接触AI的。刚开始用ChatGPT的时候,我们体验的其实是一种文生文的能力。比如你输入一句话,模型给你生成一段文字回应。 不管是我们平时写代码、还是写文章,都是AI根据你的输入文字(提示词Prompt),生成另一段文字。这种让AI自动生成内容的能力,就叫做AIGC。 啥叫AIGC呢?下面来自百度百科的回答: AIGC(Artificial Intelligence Generated Content)——生成式人工智能,是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。 AIGC技术的核心思想是利用人工智能算法生成具有

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

🔥 个人主页:杨利杰YJlio❄️ 个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更简单,让重复的工作自动化 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 1. 我先说结论:今天这波 AI 热榜,最重要的不是“谁最火”,而是“风向变了” * 2. GoogleCloudPlatform / generative-ai:平台生态正在成为真正的护城河 * 3. MiroFish:群体智能和多智能体,开始从概念走向更具体的产品叙事

AIGC商业变现的5个真实案例:设计师/自媒体人如何用AI接单赚钱?

AIGC商业变现实战:设计师与自媒体人的接单赚钱指南 去年夏天,我的一位设计师朋友在朋友圈晒出了一张令人惊艳的电商海报,配文是“三小时搞定一个月的活”。我私信问他是不是接了外包大单,他神秘兮兮地发来一个链接——那是一个我从未听说过的AI绘画平台。原来,那张海报根本不是他亲手画的,而是用AI生成的。更让我惊讶的是,客户对这张“非人手创作”的作品非常满意,还额外支付了20%的加急费。这件事彻底颠覆了我对创意工作的认知:当工具进化到一定程度,赚钱的逻辑也在悄然改变。 如今,AIGC(人工智能生成内容)已经不再是科技圈的专属话题,它正迅速渗透到商业的毛细血管中。对于自由职业者、设计师、自媒体人以及中小企业主来说,这波浪潮带来的不仅是技术冲击,更是一次重新定义价值创造方式的机遇。但问题也随之而来:如何将这项技术转化为实实在在的收入?如何在众多工具中找到适合自己的那一款?更重要的是,如何在保证质量的同时,规避版权风险,建立可持续的商业模式? 这篇文章不是泛泛而谈的技术科普,而是聚焦于“技术+商业”的交叉点,为你拆解五个真实可操作的变现案例,从电商海报生成到短视频脚本创作,从接单平台选择到报价