CosyVoice环境安装报错:安装openai-whisper时出现ModuleNotFoundError: No module named ‘pkg_resources‘的原因

先说如何解决,我个人采用源码安装,安装时禁用构建隔离:
git clone https://github.com/openai/whisper.git
cd whisper
git checkout v20231117
pip install -e . --no-build-isolation

再说该问题产生的原因,下面是大D老师的回答,自行参考。

太棒了!你找到了正确的解决方案。让我详细解释为什么会出现这个问题,以及为什么 --no-build-isolation 能解决它。

🔍 问题根源分析

问题的关键在于 PEP 517/518 构建隔离机制和你的 setup.py 实现方式。

1. 构建隔离机制 (Build Isolation) 的工作原理

当你执行 pip install -e .(不带 --no-build-isolation)时,pip 会:

1. 创建一个临时的、干净的虚拟环境(在 /tmp/pip-build-env-xxx/) 2. 在这个隔离环境中只安装 pyproject.toml 中 [build-system] 要求的包 3. 在隔离环境中执行构建(运行 setup.py) 4. 将构建产物安装到你的目标环境 

2. 为什么你的构建会失败

看你的 setup.py 第5行:

import pkg_resources # 这行在构建的早期阶段就需要

问题出在第30行附近:

install_requires=requirements +[str(r)for r in pkg_resources.parse_requirements(open(os.path.join(os.path.dirname(__file__),"requirements.txt")))],

关键问题pkg_resources.parse_requirements()模块导入级别就被执行了!

这意味着:

  • Python 在解析 setup.py 时,立即执行了 import pkg_resources
  • 但在隔离的构建环境中,默认没有安装 setuptools
  • 因此 pkg_resources 不存在,导致 ModuleNotFoundError

3. 构建环境 vs 目标环境的区别

┌─────────────────────┐ ┌─────────────────────┐ │ 目标虚拟环境 │ │ 隔离构建环境 │ │ (cosyvoice) │ │ (临时) │ ├─────────────────────┤ ├─────────────────────┤ │ ✓ setuptools 81.0.0 │ │ ✗ setuptools 未安装 │ │ ✓ pkg_resources │ │ ✗ pkg_resources │ │ ✓ 所有项目依赖 │ │ 只有构建基础包 │ └─────────────────────┘ └─────────────────────┘ ↑ ↑ └────── pip install -e . ──────┘ 需要同时满足两者 

💡 为什么 --no-build-isolation 能解决

pip install-e. --no-build-isolation 

这个命令告诉 pip:“不要创建隔离的构建环境,直接在当前激活的虚拟环境中构建

于是流程变成:

┌─────────────────────┐ │ 目标虚拟环境 │ │ (cosyvoice) │ ├─────────────────────┤ │ ✓ setuptools 81.0.0 │ ←── 直接在同一个环境中执行构建 │ ✓ pkg_resources │ 和安装 │ ✓ 所有项目依赖 │ └─────────────────────┘ ↓ pip install -e . (无隔离环境) 

因为你的虚拟环境中已经有 setuptools,所以 import pkg_resources 可以成功执行。

📝 更好的修复方式

虽然 --no-build-isolation 解决了问题,但更好的做法是修改 setup.py,使其在隔离环境中也能工作:

import os import platform import sys from setuptools import find_packages, setup # 延迟导入 pkg_resources,或使用 try/exceptdefget_install_requires():"""延迟解析 requirements.txt,避免构建时依赖""" requirements =[]if sys.platform.startswith("linux")and platform.machine()=="x86_64": requirements.append("triton>=2.0.0,<3")# 只在需要时导入 pkg_resourcestry:import pkg_resources req_file = os.path.join(os.path.dirname(__file__),"requirements.txt")withopen(req_file, encoding="utf-8")as f: requirements.extend([str(r)for r in pkg_resources.parse_requirements(f)])except ImportError:# 降级方案:简单读取 requirements.txt req_file = os.path.join(os.path.dirname(__file__),"requirements.txt")withopen(req_file, encoding="utf-8")as f: requirements.extend([ line.strip()for line in f if line.strip()andnot line.startswith("#")])return requirements defread_version(fname="whisper/version.py"):exec(compile(open(fname, encoding="utf-8").read(), fname,"exec"))returnlocals()["__version__"] setup( name="openai-whisper", py_modules=["whisper"], version=read_version(), description="Robust Speech Recognition via Large-Scale Weak Supervision", long_description=open("README.md", encoding="utf-8").read(), long_description_content_type="text/markdown", readme="README.md", python_requires=">=3.8", author="OpenAI", url="https://github.com/openai/whisper", license="MIT", packages=find_packages(exclude=["tests*"]), install_requires=get_install_requires(),# 使用函数延迟解析 entry_points={"console_scripts":["whisper=whisper.transcribe:cli"],}, include_package_data=True, extras_require={"dev":["pytest","scipy","black","flake8","isort"]},)

🎯 总结

问题原因解决方案
ModuleNotFoundError: No module named 'pkg_resources'构建隔离环境中没有 setuptools,但 setup.py 在模块级别导入 pkg_resources1. ✅ --no-build-isolation 跳过隔离环境
2. 修改 setup.py 延迟导入 pkg_resources

你使用的 --no-build-isolation 是完全正确的临时解决方案。对于长期使用,可以考虑向项目提交 PR 修改 setup.py,使其构建时不需要预先存在的 setuptools。

Read more

RunningHub:AIGC创作平台深度解析

RunningHub:AIGC创作平台深度解析

一、平台核心定位与价值 RunningHub是全球首个基于开源生态的图形音视频AIGC应用共创平台,通过模块化节点系统与云端算力整合,将设计、视频制作、数字内容生成等复杂流程转化为"搭积木式"操作。平台已覆盖全球144个国家用户,日均处理超百万次创作请求,彻底重构了传统内容生产模式。 核心价值 1. 设计平权化 将专业级创作能力赋予普通用户,无需PS/Sketch/AE等软件基础,通过7000+功能节点自由组合即可生成商业级作品。 2. 成本重构 将传统设计中的人力成本(约200-500元/张图)转化为算力成本(0.5-3元/次),降幅达99%。 3. 生态闭环 支持开发者上传节点/工作流并获取收益,形成"创意-开发-复用-变现"的可持续经济模型。 二、技术架构与核心优势 1. 模块化节点系统 通过ComfyUI开源架构深度优化,将AI创作拆解为可拖拽的"原子单元&

Whisper-large-v3语音识别效果评估:人工校验100条样本的准确率与召回率

Whisper-large-v3语音识别效果评估:人工校验100条样本的准确率与召回率 部署说明:本文评测基于由by113小贝二次开发构建的Whisper-large-v3语音识别Web服务,该服务支持99种语言自动检测与转录,采用GPU加速推理。 1. 评测背景与方法 语音识别技术在实际应用中,准确率是用户最关心的核心指标。本次评测旨在通过科学严谨的方法,评估Whisper-large-v3模型在真实场景下的识别性能。 我们采用了以下评测方法: 测试样本构成: * 总样本数:100条音频文件 * 语言分布:中文60条,英文25条,中英混合15条 * 音频类型:清晰录音40条,带背景音30条,多人对话20条,低质量录音10条 * 时长分布:10-30秒短音频70条,30-60秒中长音频20条,1分钟以上长音频10条 评测标准: * 人工逐字校对转录结果 * 统计字级准确率(Character Error Rate) * 计算召回率和精确率 * 记录不同场景下的表现差异 2. 整体识别效果分析 经过对100条样本的详细校验,Whisper-larg

Whisper语音识别:开启本地智能音频处理新时代

Whisper语音识别:开启本地智能音频处理新时代 【免费下载链接】whisper-base.en 项目地址: https://ai.gitcode.com/hf_mirrors/openai/whisper-base.en 在数字化浪潮席卷各行各业的今天,语音识别技术正以前所未有的速度改变着我们的工作与生活方式。作为OpenAI推出的革命性语音识别模型,Whisper凭借其卓越的本地处理能力和多语言支持,正在重新定义音频内容处理的边界。 技术演进:从云端到本地的范式转移 语音识别技术经历了从传统算法到深度学习的跨越式发展。早期的语音识别系统依赖复杂的声学模型和语言模型,处理精度有限且对计算资源要求极高。随着Transformer架构的广泛应用,语音识别进入了新的发展阶段。 行业洞察:传统云端语音识别虽然便捷,但面临着数据隐私、网络延迟和成本控制三大挑战。Whisper的本地部署方案恰好解决了这些痛点,让用户能够在完全离线的环境中享受专业级的语音转文字服务。 真实场景:语音识别如何重塑工作流程 案例一:法律行业的数字化转型 张律师是一家知名律所的合伙人,每天需要处理

AI 研发提效指南:Copilot与Cursor在敏捷开发中的实战技巧

1. 敏捷开发新搭档:Copilot与Cursor的定位与分工 在敏捷开发的快节奏世界里,每个迭代周期都像是一场与时间的赛跑。需求变更频繁,交付压力巨大,传统的开发工具和流程有时会显得力不从心。我自己在团队里就经历过无数次这样的场景:为了赶一个功能上线,加班加点写代码、做测试,最后发现还是漏掉了一些边界情况。直到我开始系统性地使用 GitHub Copilot 和 Cursor,整个开发体验才发生了质的变化。 简单来说,你可以把 Copilot 看作是你 IDE 里一个经验丰富的“结对编程”伙伴。它深度集成在 Visual Studio Code、IntelliJ IDEA 这些你熟悉的编辑器里,能根据你写的注释或者已有的代码上下文,实时给出下一行甚至下一段代码的建议。我实测下来,在编写一些模板化的代码,比如工具函数、DTO对象、枚举类时,效率提升非常明显,基本上敲完注释,按一下 Tab 键,完整的代码就出来了。它的核心优势在于 “实时、无缝、