LLaMA-Factory环境配置与WebUI启动全攻略：从CUDA适配到依赖踩坑

优质文章学习记录

07 Apr 2026 — 7 min read

最近在本地部署LLaMA-Factory时，踩了一连串环境配置的坑——从GitHub克隆失败、CUDA不可用到虚拟环境依赖缺失，最终成功启动WebUI。这篇文章就把完整的排错过程和解决方案整理出来，希望能帮到遇到类似问题的同学。

一、问题背景：本地部署LLaMA-Factory的核心诉求

目标是在Windows 10环境下，基于Anaconda创建虚拟环境，部署LLaMA-Factory并启动WebUI，利用本地NVIDIA MX230显卡（2GB显存）实现GPU加速。但从克隆仓库开始，就遇到了一系列报错，主要涉及三类问题：

仓库克隆失败（GitHub连接重置、Gitee 403权限拒绝）；
PyTorch CUDA支持缺失（报“Torch not compiled with CUDA enabled”）；
虚拟环境依赖缺失（直接运行WebUI报“ModuleNotFoundError: No module named 'torch'”）。

二、核心报错解析与分步解决方案

坑1：仓库克隆失败——网络限制与镜像选择

报错现象

从GitHub克隆时提示连接重置，从某Gitee镜像克隆时提示403权限拒绝：

(base) PS E:\pc-project> git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git Cloning into 'LLaMA-Factory'... fatal: unable to access 'https://github.com/hiyouga/LLaMA-Factory.git/': Recv failure: Connection was reset (base) PS E:\pc-project> git clone https://gitee.com/qzl9999/LLaMA-Factory.git Cloning into 'LLaMA-Factory'... remote: [session-6b44feb3] Access denied fatal: unable to access 'https://gitee.com/qzl9999/LLaMA-Factory.git/': The requested URL returned error: 403

原因分析

GitHub克隆失败是国内网络访问限制导致；Gitee 403是因为选择的镜像仓库权限设置问题（非公开可克隆）。

解决方案

优先选择GitHub国内镜像站，配合Git网络配置优化；备选方案使用官方维护的Gitee镜像：

# 1. 配置Git超时与网络参数（避免连接超时） git config --global http.lowSpeedLimit 0 git config --global http.lowSpeedTime 999999 git config --global http.timeout 300 # 2. 使用GitHub镜像站克隆（推荐） git clone --depth 1 https://github.91chi.fun/https://github.com/hiyouga/LLaMA-Factory.git # 3. 备选：使用Gitee官方维护镜像 rm -rf LLaMA-Factory # 删除之前失败的文件夹 git clone https://gitee.com/mirrors_LLaMA-Factory/LLaMA-Factory.git

如果Git命令仍失败，可直接手动下载源码压缩包：访问https://github.com/hiyouga/LLaMA-Factory/archive/refs/heads/main.zip，解压后重命名为“LLaMA-Factory”即可。

坑2：CUDA不可用——PyTorch版本错配

报错现象

进入Python交互环境，调用torch.cuda相关函数时报错：

>>> import torch >>> torch.cuda.current_device() Traceback (most recent call last): File "<stdin>", line 1, in <module> File "...\torch\cuda\__init__.py", line 403, in _lazy_init raise AssertionError("Torch not compiled with CUDA enabled") AssertionError: Torch not compiled with CUDA enabled

查看PyTorch编译配置，发现USE_CUDA=0（纯CPU版本）：

PyTorch编译配置： PyTorch built with: ... - Build settings: ... USE_CUDA=0, ...

原因分析

默认安装的是纯CPU版本的PyTorch，而本地有NVIDIA MX230显卡（支持CUDA 12.5），需要安装带CUDA支持的PyTorch版本。

解决方案

步骤1：先确认本地显卡与CUDA支持情况

# 在PowerShell中执行，查看显卡信息 nvidia-smi

输出显示显卡为NVIDIA GeForce MX230，驱动版本556.12，支持CUDA 12.5，确认硬件支持GPU加速。

步骤2：卸载纯CPU版本PyTorch，安装适配CUDA 12.5的版本

# 1. 激活llama_factory虚拟环境 conda activate llama_factory # 2. 卸载CPU版PyTorch pip uninstall torch -y pip cache purge # 清理缓存，避免安装冲突 # 3. 安装适配CUDA 12.5的PyTorch（cu124版本兼容CUDA 12.5） pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu124

步骤3：验证CUDA是否可用

>>> import torch >>> print("CUDA是否可用：", torch.cuda.is_available()) # 输出True即成功 >>> print("GPU名称：", torch.cuda.get_device_name(0)) # 输出NVIDIA GeForce MX230 >>> print("PyTorch版本：", torch.__version__) # 输出2.4.0+cu124

坑3：依赖缺失——虚拟环境未激活

报错现象

直接用base环境的Python运行webui.py，提示缺少torch模块：

(base) PS E:\pc-project\LLaMA-Factory> & D:/python/miniconda3/python.exe e:/pc-project/LLaMA-Factory/src/webui.py Traceback (most recent call last): File "e:\pc-project\LLaMA-Factory\src\webui.py", line 7, in <module> from llamafactory.extras.misc import fix_proxy, is_env_enabled File "e:\pc-project\LLaMA-Factory\src\llamafactory\extras\misc.py", line 23, in <module> import torch ModuleNotFoundError: No module named 'torch'

原因分析

Anaconda的base环境与llama_factory虚拟环境相互隔离，torch等依赖只安装在llama_factory环境中，base环境中没有这些依赖，导致报错。

解决方案

核心是“先激活虚拟环境，再运行脚本”，提供两种可行方式：

方式1：激活环境后运行（推荐）

# 1. 激活llama_factory虚拟环境 conda activate llama_factory # 2. 切换到LLaMA-Factory根目录 cd E:\pc-project\LLaMA-Factory # 3. 运行webui.py（适配2GB显存，添加优化参数） python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

方式2：直接调用虚拟环境的Python（无需手动激活）

# 直接指定llama_factory环境的Python路径 & D:/python/miniconda3/envs/llama_factory/python.exe e:/pc-project/LLaMA-Factory/src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing

参数说明：

--device cuda:0：指定使用第0号GPU（本地MX230）；
--load_in_4bit：4比特量化加载模型，大幅降低显存占用；
--use_gradient_checkpointing：梯度检查点，进一步节省显存。

坑4：WebUI启动无响应——低显存适配

问题现象

执行启动命令后，终端无响应或长时间无输出。

原因分析

MX230显卡仅2GB显存，默认启动方式显存占用过高，导致静默崩溃；或首次启动需加载依赖，过程较慢。

解决方案

添加日志输出参数查看进度，同时进一步优化显存占用：

python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

参数说明：

--offload_folder ./offload：将部分模型数据卸载到硬盘，牺牲少量速度换显存；
--verbose：打印启动日志，清晰看到加载进度（如“Loading tokenizer...”“Initializing model...”）。

启动成功后，终端会显示访问地址（如http://127.0.0.1:7860），打开浏览器即可进入WebUI。

三、避坑总结与关键提醒

环境隔离是核心：Anaconda虚拟环境必须激活后使用，所有依赖安装和脚本运行都要在目标环境中进行，避免混用base环境；
CUDA版本要匹配：安装PyTorch前先通过nvidia-smi确认显卡支持的CUDA版本，选择兼容的PyTorch-CUDA版本（如CUDA 12.5适配cu124版本）；
低显存显卡需优化：2GB显存仅能运行小模型（如LLaMA-3-8B 4bit、Qwen-1.8B），必须添加--load_in_4bit等量化参数，否则会显存不足；
日志是排错关键：遇到无响应或报错时，添加--verbose参数查看详细日志，快速定位问题所在。

四、最终成功启动流程（一键复制）

# 1. 激活虚拟环境 conda activate llama_factory # 2. 切换到项目根目录 cd E:\pc-project\LLaMA-Factory # 3. 优化参数启动WebUI python src/webui.py --device cuda:0 --load_in_4bit --use_gradient_checkpointing --offload_folder ./offload --verbose

按照以上步骤，就能顺利解决LLaMA-Factory部署过程中的克隆、CUDA适配、依赖缺失等问题，成功启动WebUI。如果遇到其他报错，建议优先查看终端日志，重点关注“网络连接”“显存占用”“依赖版本”这三个核心点，大部分问题都能迎刃而解。

FPGA图像处理之：图像畸变矫正原理及matlab与fpga实现

一、概述图像畸变矫正（Image Distortion Correction）是图像处理中的重要任务，通常用于纠正因镜头畸变、拍摄角度等原因造成的图像失真。它的核心原理涉及几何变换，通过对图像进行变换，使其恢复到理想状态。（一）图像畸变的类型 1.径向畸变（Radial Distortion）：主要表现为图像中心到边缘的失真，常见的有“桶形畸变”（Barrel Distortion）和“枕形畸变”（Pincushion Distortion）。桶形畸变：图像的边缘向外膨胀。枕形畸变：图像的边缘向内收缩。 2.切向畸变（Tangential Distortion）：由于相机镜头的装配不精确，可能会导致图像出现某些不规则的切向失真。（二）畸变矫正的原理图像畸变矫正的目标是通过数学模型来恢复图像的真实几何结构。一般采用如下的模型来进行畸变建模与矫正：（1）径向畸变模型：径向畸变模型通常采用以下公式：

ROS新手必看：5分钟搞定rqt工具箱核心插件配置（附无人机调试实战）

ROS实战：从零到一掌握rqt工具箱，打造你的机器人数据可视化中枢如果你刚开始接触ROS，面对海量的节点、话题和消息数据，是不是感觉像在黑暗中摸索？命令行里的文本输出虽然精确，但缺乏直观性，调试一个简单的PID参数可能都要反复重启节点、查看日志，效率低下。这正是rqt工具箱设计的初衷——为ROS开发者提供一套基于Qt的图形化“瑞士军刀”，将复杂的数据流变成一目了然的图表和图形界面。我记得第一次用rqt_plot可视化无人机角速度数据时，那种“原来如此”的顿悟感。不再需要去解析冗长的命令行数字，期望值与实际值的曲线对比直接在屏幕上展开，超调、震荡、响应延迟变得肉眼可见。rqt不仅仅是几个工具，它更像是一个可自由拼装的工作台，你可以把计算图、参数配置、数据曲线、日志信息全部整合在一个窗口里，形成专属的调试仪表盘。本文将带你超越基础的“点击操作”，深入理解rqt的插件化架构，并结合作者真实的无人机调试经验，展示如何高效配置核心插件，解决常见的“灰色加号”等棘手问题，最终让你能灵活运用rqt应对各种机器人开发场景。 1. 重新认识rqt：不止于工具集，而是可视化框架很多人把rq

埃斯顿机器人快速入门

本文章适合有一定基础的人学习如：abb，发那科，库卡等这些主流的机器人，一些通用的知识点就不在这里过多描述，只讲一下不同的地方以便快速入门接手项目。有一定基础！！！有一定基础！！！有一定基础！！！目录 * 1.仿真软件Editor * 1.1下载Editor2.6.05 * 1.2官方最新版下载 * 2.界面介绍 * 3.IO配置 * 4.程序变量与语法 * 5.程序下载 1.仿真软件Editor 1.1下载Editor2.6.05 这个软件是埃斯顿机器人的仿真软件，适合在没有机器人前期准备程序及配置的时候使用。入门学习也非常合适，毕竟也不是一直有都有机会拿实机去练习的。仿真软件可以选择在官网下载，但是在官网下载有点问题一开始我都找不到，使用我这里先给一个截止到这一篇文章发布前最新版的连接。点🐔下载！！！ 1.2官方最新版下载进入埃斯顿官网点击资料下载见面，你会发现哎嘿！你要搜索相关的手册或者安装包的名称才能下载，输错了就找不到了! 可以跟着我输入关键字：Editor 2.

YOLOv8【第十章：多任务扩展深度篇·第11节】旋转框角度回归优化：CSL（Circular Smooth Label）与 DCL 编码实战！

🏆 本文收录于《YOLOv8实战：从入门到深度优化》专栏。该专栏系统复现并梳理全网各类 YOLOv8 改进与实战案例（当前已覆盖分类 / 检测 / 分割 / 追踪 / 关键点 / OBB 检测等方向），坚持持续更新 + 深度解析，质量分长期稳定在 97 分以上，可视为当前市面上覆盖较全、更新较快、实战导向极强的 YOLO 改进系列内容之一。部分章节也会结合国内外前沿论文与 AIGC 等大模型技术，对主流改进方案进行重构与再设计，内容更偏实战与可落地，适合有工程需求的同学深入学习与对标优化。 ✨特惠福利：当前限时活动一折秒杀，一次订阅，终身有效，后续所有更新章节全部免费解锁，👉 点此查看详情 🎯 本文定位：计算机视觉 × 多任务扩展深度系列 📅 更新时间：2026年 🏷️ 难度等级：⭐⭐⭐⭐（高级进阶） 🔧 技术栈：Python 3.9+ · PyTorch

一、问题背景：本地部署LLaMA-Factory的核心诉求

二、核心报错解析与分步解决方案

坑1：仓库克隆失败——网络限制与镜像选择

报错现象

原因分析

解决方案

坑2：CUDA不可用——PyTorch版本错配

报错现象

原因分析

解决方案

坑3：依赖缺失——虚拟环境未激活

报错现象

原因分析

解决方案

坑4：WebUI启动无响应——低显存适配

问题现象

原因分析

解决方案

三、避坑总结与关键提醒

四、最终成功启动流程（一键复制）

Read more

FPGA图像处理之：图像畸变矫正原理及matlab与fpga实现

ROS新手必看：5分钟搞定rqt工具箱核心插件配置（附无人机调试实战）

埃斯顿机器人快速入门

YOLOv8【第十章：多任务扩展深度篇·第11节】旋转框角度回归优化：CSL（Circular Smooth Label）与 DCL 编码实战！