LLaMA-Factory 本地部署：环境配置、CUDA 适配与 WebUI 启动 | 极客日志

PythonAI算法

LLaMA-Factory 本地部署：环境配置、CUDA 适配与 WebUI 启动

介绍在 Windows 10 环境下使用 Anaconda 部署 LLaMA-Factory 并启动 WebUI 的完整流程。涵盖 GitHub/Gitee 仓库克隆网络问题解决方案，PyTorch CUDA 版本匹配与安装步骤，虚拟环境激活与依赖管理，以及针对 2GB 显存显卡（如 MX230）的量化加载与显存优化参数配置。通过具体命令和报错分析，帮助解决环境配置中的常见坑点，实现本地 GPU 加速运行。

CloudNative发布于 2026/4/5更新于 2026/7/1246 浏览

本文记录在 Windows 10 环境下部署 LLaMA-Factory 及启动 WebUI 的完整过程，重点解决环境配置中的常见问题。

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

目标是在 Windows 10 环境下，基于 Anaconda 创建虚拟环境，部署 LLaMA-Factory 并启动 WebUI，利用本地 NVIDIA MX230 显卡（2GB 显存）实现 GPU 加速。但从克隆仓库开始，就遇到了一系列报错，主要涉及三类问题：

仓库克隆失败（GitHub 连接重置、Gitee 403 权限拒绝）；
PyTorch CUDA 支持缺失（报'Torch not compiled with CUDA enabled'）；
虚拟环境依赖缺失（直接运行 WebUI 报'ModuleNotFoundError: No module named 'torch''）。

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

从 GitHub 克隆时提示连接重置，从某 Gitee 镜像克隆时提示 403 权限拒绝：

(base) PS E:\pc-project> git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
Cloning into 'LLaMA-Factory'...
fatal: unable to access 'https://github.com/hiyouga/LLaMA-Factory.git/': Recv failure: Connection was reset
(base) PS E:\pc-project> git clone https://gitee.com/qzl9999/LLaMA-Factory.git
Cloning into 'LLaMA-Factory'...
remote: [session-6b44feb3] Access denied
fatal: unable to access 'https://gitee.com/qzl9999/LLaMA-Factory.git/': The requested URL returned error: 403

原因分析

GitHub 克隆失败是国内网络访问限制导致；Gitee 403 是因为选择的镜像仓库权限设置问题（非公开可克隆）。

解决方案

优先选择 GitHub 国内镜像站，配合 Git 网络配置优化；备选方案使用官方维护的 Gitee 镜像：

# 1. 配置 Git 超时与网络参数（避免连接超时）
git config --global http.lowSpeedLimit 0
git config --global http.lowSpeedTime 999999
git config --global http.timeout 300

# 2. 使用 GitHub 镜像站克隆（推荐）
git clone --depth 1 https://github.91chi.fun/https://github.com/hiyouga/LLaMA-Factory.git

# 3. 备选：使用 Gitee 官方维护镜像
rm -rf LLaMA-Factory # 删除之前失败的文件夹
git clone https://gitee.com/mirrors_LLaMA-Factory/LLaMA-Factory.git

如果 Git 命令仍失败，可直接手动下载源码压缩包：访问 https://github.com/hiyouga/LLaMA-Factory/archive/refs/heads/main.zip，解压后重命名为'LLaMA-Factory'即可。

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

进入 Python 交互环境，调用 torch.cuda 相关函数时报错：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

>>> import torch
>>> torch.cuda.current_device()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "...\torch\cuda\__init__.py", line 403, in _lazy_init
    raise AssertionError("Torch not compiled with CUDA enabled")
AssertionError: Torch not compiled with CUDA enabled

PyTorch 编译配置：
PyTorch built with: ... - Build settings: ... USE_CUDA=0, ...

# 在 PowerShell 中执行，查看显卡信息
nvidia-smi

# 1. 激活 llama_factory 虚拟环境
conda activate llama_factory

# 2. 卸载 CPU 版 PyTorch
pip uninstall torch -y
pip cache purge # 清理缓存，避免安装冲突

# 3. 安装适配 CUDA 12.5 的 PyTorch（cu124 版本兼容 CUDA 12.5）
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu124

>>> import torch
>>> print("CUDA 是否可用：", torch.cuda.is_available()) # 输出 True 即成功
>>> print("GPU 名称：", torch.cuda.get_device_name(0)) # 输出 NVIDIA GeForce MX230
>>> print("PyTorch 版本：", torch.__version__) # 输出 2.4.0+cu124

(base) PS E:\pc-project\LLaMA-Factory> & D:/python/miniconda3/python.exe e:/pc-project/LLaMA-Factory/src/webui.py
Traceback (most recent call last):
  File "e:\pc-project\LLaMA-Factory\src\webui.py", line 7, in <module>
    from llamafactory.extras.misc import fix_proxy, is_env_enabled
  File "e:\pc-project\LLaMA-Factory\src\llamafactory\extras\misc.py", line 23, in <module>
    import torch
ModuleNotFoundError: No module named 'torch'

# 1. 激活 llama_factory 虚拟环境
conda activate llama_factory

# 2. 切换到 LLaMA-Factory 根目录
cd E:\pc-project\LLaMA-Factory

# 3. 运行 webui.py（适配 2GB 显存，添加优化参数）
python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

# 直接指定 llama_factory 环境的 Python 路径
& D:/python/miniconda3/envs/llama_factory/python.exe e:/pc-project/LLaMA-Factory/src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

# 1. 激活虚拟环境
conda activate llama_factory

# 2. 切换到项目根目录
cd E:\pc-project\LLaMA-Factory

# 3. 优化参数启动 WebUI
python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

LLaMA-Factory 本地部署：环境配置、CUDA 适配与 WebUI 启动

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

原因分析

解决方案

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

更多推荐文章

相关免费在线工具

原因分析

解决方案

坑 3：依赖缺失——虚拟环境未激活

报错现象

原因分析

解决方案

坑 4：WebUI 启动无响应——低显存适配

问题现象

原因分析

解决方案

三、避坑总结与关键提醒

四、最终成功启动流程（一键复制）

更多推荐文章

相关免费在线工具

LLaMA-Factory 本地部署：环境配置、CUDA 适配与 WebUI 启动

一、问题背景：本地部署 LLaMA-Factory 的核心诉求

二、核心报错解析与分步解决方案

坑 1：仓库克隆失败——网络限制与镜像选择

报错现象

原因分析

解决方案

坑 2：CUDA 不可用——PyTorch 版本错配

报错现象

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

原因分析

解决方案

坑 3：依赖缺失——虚拟环境未激活

报错现象

原因分析

解决方案

坑 4：WebUI 启动无响应——低显存适配

问题现象

原因分析

解决方案

三、避坑总结与关键提醒

四、最终成功启动流程（一键复制）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具