LLaMA-Factory 环境配置与 WebUI 启动指南：CUDA 适配与依赖解决 | 极客日志

PythonAI算法

LLaMA-Factory 环境配置与 WebUI 启动指南：CUDA 适配与依赖解决

记录在 Windows 10 环境下基于 Anaconda 部署 LLaMA-Factory 并启动 WebUI 的过程，涵盖网络克隆、CUDA 适配及依赖配置等核心问题的排查与解决方案。通过配置 Git 镜像、安装适配 CUDA 12.5 的 PyTorch 版本、正确激活 Conda 环境及添加低显存优化参数，最终成功实现 GPU 加速运行。

雾岛听风发布于 2026/4/6更新于 2026/7/2154 浏览

本文记录在 Windows 10 环境下基于 Anaconda 部署 LLaMA-Factory 并启动 WebUI 的过程，涵盖网络克隆、CUDA 适配及依赖配置等核心问题的排查与解决方案。

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

目标是在 Windows 10 环境下，基于 Anaconda 创建虚拟环境，部署 LLaMA-Factory 并启动 WebUI，利用本地 NVIDIA MX230 显卡（2GB 显存）实现 GPU 加速。但从克隆仓库开始，就遇到了一系列报错，主要涉及三类问题：

仓库克隆失败（GitHub 连接重置、Gitee 403 权限拒绝）；
PyTorch CUDA 支持缺失（报'Torch not compiled with CUDA enabled'）；
虚拟环境依赖缺失（直接运行 WebUI 报'ModuleNotFoundError: No module named 'torch''）。

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

从 GitHub 克隆时提示连接重置，从某 Gitee 镜像克隆时提示 403 权限拒绝：

(base) PS E:\pc-project> git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git Cloning into 'LLaMA-Factory'... fatal: unable to access 'https://github.com/hiyouga/LLaMA-Factory.git/': Recv failure: Connection was reset (base) PS E:\pc-project> git clone https://gitee.com/qzl9999/LLaMA-Factory.git Cloning into 'LLaMA-Factory'... remote: [session-6b44feb3] Access denied fatal: unable to access 'https://gitee.com/qzl9999/LLaMA-Factory.git/': The requested URL returned error: 403

原因分析

GitHub 克隆失败是国内网络访问限制导致；Gitee 403 是因为选择的镜像仓库权限设置问题（非公开可克隆）。

解决方案

优先选择 GitHub 国内镜像站，配合 Git 网络配置优化；备选方案使用官方维护的 Gitee 镜像：

# 1. 配置 Git 超时与网络参数（避免连接超时） git config --global http.lowSpeedLimit 0 git config --global http.lowSpeedTime 999999 git config --global http.timeout 300 # 2. 使用 GitHub 镜像站克隆（推荐） git clone --depth 1 https://github.91chi.fun/https://github.com/hiyouga/LLaMA-Factory.git # 3. 备选：使用 Gitee 官方维护镜像 rm -rf LLaMA-Factory # 删除之前失败的文件夹 git clone https://gitee.com/mirrors_LLaMA-Factory/LLaMA-Factory.git

如果 Git 命令仍失败，可直接手动下载源码压缩包：访问 https://github.com/hiyouga/LLaMA-Factory/archive/refs/heads/main.zip，解压后重命名为'LLaMA-Factory'即可。

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

进入 Python 交互环境，调用 torch.cuda 相关函数时报错：

>>>  torch >>> torch.cuda.current_device() Traceback (most recent call last): File , line ,  <module> File , line ,  _lazy_init  AssertionError() AssertionError: Torch  compiled  CUDA enabled

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

PyTorch 编译配置： PyTorch built with: ... - Build settings: ... USE_CUDA=0, ...

# 在 PowerShell 中执行，查看显卡信息 nvidia-smi

# 1. 激活 llama_factory 虚拟环境 conda activate llama_factory # 2. 卸载 CPU 版 PyTorch pip uninstall torch -y pip cache purge # 清理缓存，避免安装冲突 # 3. 安装适配 CUDA 12.5 的 PyTorch（cu124 版本兼容 CUDA 12.5） pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu124

>>> import torch >>> print("CUDA 是否可用：", torch.cuda.is_available()) # 输出 True 即成功 >>> print("GPU 名称：", torch.cuda.get_device_name(0)) # 输出 NVIDIA GeForce MX230 >>> print("PyTorch 版本：", torch.__version__) # 输出 2.4.0+cu124

(base) PS E:\pc-project\LLaMA-Factory> & D:/python/miniconda3/python.exe e:/pc-project/LLaMA-Factory/src/webui.py Traceback (most recent call last): File "e:\pc-project\LLaMA-Factory\src\webui.py", line 7, in <module> from llamafactory.extras.misc import fix_proxy, is_env_enabled File "e:\pc-project\LLaMA-Factory\src\llamafactory\extras\misc.py", line 23, in <module> import torch ModuleNotFoundError: No module named 'torch'

# 1. 激活 llama_factory 虚拟环境 conda activate llama_factory # 2. 切换到 LLaMA-Factory 根目录 cd E:\pc-project\LLaMA-Factory # 3. 运行 webui.py（适配 2GB 显存，添加优化参数） python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

# 直接指定 llama_factory 环境的 Python 路径 & D:/python/miniconda3/envs/llama_factory/python.exe e:/pc-project/LLaMA-Factory/src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

# 1. 激活虚拟环境 conda activate llama_factory # 2. 切换到项目根目录 cd E:\pc-project\LLaMA-Factory # 3. 优化参数启动 WebUI python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

LLaMA-Factory 环境配置与 WebUI 启动指南：CUDA 适配与依赖解决

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

原因分析

解决方案

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

更多推荐文章

相关免费在线工具

原因分析

解决方案

坑 3：依赖缺失——虚拟环境未激活

报错现象

原因分析

解决方案

坑 4：WebUI 启动无响应——低显存适配

问题现象

原因分析

解决方案

三、避坑总结与关键提醒

四、最终成功启动流程（一键复制）

更多推荐文章

相关免费在线工具

LLaMA-Factory 环境配置与 WebUI 启动指南：CUDA 适配与依赖解决

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

原因分析

解决方案

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

原因分析

解决方案

坑 3：依赖缺失——虚拟环境未激活

报错现象

原因分析

解决方案

坑 4：WebUI 启动无响应——低显存适配

问题现象

原因分析

解决方案

三、避坑总结与关键提醒

四、最终成功启动流程（一键复制）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具