如何下载、安装whisper、faster_whisper？

Ne0inhk

24 Mar 2026 — 2 min read

1、模型种类

whisper：有很多模型：tiny、base、small、medium、large等

faster_whisper:模型种类与whisper类似

2、模型安装

特别注意：whisper和faster_whisper中的模型，有两种获得方式。

①在网址：https://github.com/openai/whisper上有提示：pip install -U openai-whisper，下载结果为 .pt文件。在网址：https://github.com/SYSTRAN/faster-whisper上有提示：pip install faster-whisper，下载结果为.pt文件

②在网址：https://huggingface.co/，进行搜索 whisper，根据提示，可以下载 large-v3和large-v3-turbo，下载结果为文件，与①不同（特别注意）

3.模型运行

①按照①方法下载的模型：运行代码参考网址：https://github.com/openai/whisperhttps://github.com/openai/whisper ，示例如下：

import whisper

model = whisper.load_model("turbo")

# load audio and pad/trim it to fit 30 seconds
audio = whisper.load_audio("audio.mp3")
audio = whisper.pad_or_trim(audio)

# make log-Mel spectrogram and move to the same device as the model
mel = whisper.log_mel_spectrogram(audio, n_mels=model.dims.n_mels).to(model.device)

# detect the spoken language
_, probs = model.detect_language(mel)
print(f"Detected language: {max(probs, key=probs.get)}")

# decode the audio
options = whisper.DecodingOptions()
result = whisper.decode(model, mel, options)

# print the recognized text
print(result.text)

以上代码，要求# load audio and pad/trim it to fit 30 seconds，提示：whisper模型要求一句话进行识别，如果音频时间太短，可能识别结果不准确，具体请自行尝试。

②按照①方法下载的模型：运行代码参考网址：https://github.com/SYSTRAN/faster-whisperhttps://github.com/SYSTRAN/faster-whisper ，示例如下：

from faster_whisper import WhisperModel

model_size = "large-v3"

# Run on GPU with FP16
model = WhisperModel(model_size, device="cuda", compute_type="float16")

# or run on GPU with INT8
# model = WhisperModel(model_size, device="cuda", compute_type="int8_float16")
# or run on CPU with INT8
# model = WhisperModel(model_size, device="cpu", compute_type="int8")

segments, info = model.transcribe("audio.mp3", beam_size=5)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

以上代码，model=WhisperModel(...),可以指定cuda编号，以便合理利用资源。

③按照②方法下载的模型，可以参考vllm网址：https://github.com/vllm-project/vllmhttps://github.com/vllm-project/vllm

vllm框架中的whisper模型和faster_whisper模型一定是来自huggingface。

关于vllm安装踩坑问题，以后发布。

Llama-2-7b 昇腾 NPU 测评总结：核心性能数据、场景适配建议与硬件选型参考

Llama-2-7b 昇腾 NPU 测评总结：核心性能数据、场景适配建议与硬件选型参考背景与测评目标本文为适配大模型国产化部署需求，以 Llama-2-7b 为对象，在 GitCode Notebook 昇腾 NPU 环境中完成从依赖安装到模型部署的全流程落地，并通过六大维度测评验证：单请求吞吐量稳定 15.6-17.6 tokens / 秒，batch=4 时总吞吐量达 63.33 tokens / 秒，16GB 显存即可支撑高并发，最终提供可复现的部署方案、性能基准数据及硬件选型建议，助力高效落地国产算力大模型应用。昇腾 NPU ：以华为自研达芬奇架构为核心，高效张量计算适配大模型全场景；搭载 CANN 架构简化开发，支持量化与混合并行技术平衡算力与能耗，深度兼容开源生态适配国产化需求 Llama-2-7B 模型：Meta 开源 70

office里面你所在的区域不支持Copilot的解决方法

最近了一年office 365羊毛,想试用copilot的时候遇到这个问题：梯子开了美国全局tun也没用，之后怀疑是缓存问题，因为一开始没开梯子导致加载了中国区的js文件，所以没法用用微软官方网站上的方法试了下清缓存：删除以下文件夹的内容 %LOCALAPPDATA%\Microsoft\Office\16.0\Wef\ 之后保持美国全局tun重启word即可：如果还是不行，可以尝试office 365的网页版，也能用Copilot 参考：https://ZEEKLOG.fjh1997.top/posts/40329.html

AI 智能编码工具：重塑开发效率的革命，从 GitHub Copilot 到国产新秀的全面解析

目录引言一、主流智能编码工具深度测评：从功能到实战 1. GitHub Copilot：AI 编码的 “开山鼻祖” 核心特性与实战代码优缺点总结 2. Baidu Comate：文心大模型加持的 “国产之光” 核心特性与实战代码优缺点总结 3. 通义灵码：阿里云的 “企业级编码助手” 核心特性与实战代码优缺点总结引言作为一名拥有 8 年开发经验的程序员，我曾无数次在深夜对着屏幕反复调试重复代码，也因记不清框架语法而频繁切换浏览器查询文档。直到 2021 年 GitHub Copilot 问世，我才第一次感受到：AI 不仅能辅助编码，更能彻底改变开发模式。如今，智能编码工具已从 “尝鲜选项” 变为 “必备工具”，它们像经验丰富的结对编程伙伴，能精准补全代码、生成测试用例、

TRAE vs Qoder vs Cursor vs GitHub Copilot：谁才是真正的“AI 工程师”？

引言：工具选择 = 成本 + 效率 + 风险的综合权衡 2026 年，AI 编程工具已从“玩具”走向“生产主力”。但面对 TRAE、Qoder、Cursor、GitHub Copilot 等选项，开发者不仅要问： * 它能写 Rust 吗？支持中文需求吗？ * 更要问：一个月多少钱？团队用得起吗？代码安全有保障吗？本文将从五大核心维度深度剖析四大主流 AI IDE： 1. 核心理念与自主性 2. 多语言与跨生态支持能力 3. 工程化与交付闭环能力 4. 中文本地化与业务适配 5. 收费模式、定价策略与企业成本帮你做出技术可行、经济合理、风险可控的决策。一、核心理念：

Read more

Llama-2-7b 昇腾 NPU 测评总结：核心性能数据、场景适配建议与硬件选型参考

office里面你所在的区域不支持Copilot的解决方法

AI 智能编码工具：重塑开发效率的革命，从 GitHub Copilot 到国产新秀的全面解析

TRAE vs Qoder vs Cursor vs GitHub Copilot：谁才是真正的“AI 工程师”？