Windows环境LLaMA-Factory本地部署终极指南：从0到1搭建大模型工具链

下载：访问Miniconda官网下载页，直接点击“Download”即可（Windows 64位自动匹配）；
安装：勾选“Add Miniconda3 to my PATH environment variable”（关键选项，确保CMD能直接调用conda）；
其他选项保持默认，点击“Next”直至安装完成；
验证：打开新的CMD窗口（必须新打开，让环境变量生效），输入conda --version，若输出“conda 23.x.x”（版本号可能不同），则安装成功。

工具2：Git（可选，源码获取工具）

作用：快速拉取LLaMA-Factory源码，后续更新也更便捷。若不想安装Git，可直接下载源码压缩包。

下载：访问Git官网下载页，点击“64-bit Git for Windows Setup”；
安装：全程默认下一步即可，安装完成后在CMD输入git --version，输出“git version 2.x.x”即成功。

三、核心部署步骤：五步完成搭建

按“环境准备→源码获取→依赖安装→验证启动”的逻辑操作，每一步都附命令说明和验证方法，确保不遗漏关键节点。

步骤1：创建并激活独立虚拟环境

这是Windows环境部署的“避坑第一招”，所有依赖都安装在独立环境中，不会影响电脑其他Python程序。

打开CMD窗口：按下“Win+R”，输入“cmd”后回车，打开命令提示符；
创建虚拟环境：输入以下命令，创建名为“llama-env”、基于Python 3.10的虚拟环境（Python 3.10是Windows下兼容性最佳的版本）： conda create -n llama-env python=3.10 -y参数说明：-n llama-env指定环境名，python=3.10指定Python版本，-y自动确认安装；
激活虚拟环境：输入以下命令，激活创建的环境： conda activate llama-env✅ 验证：CMD窗口的前缀从“(base)”变为“(llama-env)”，说明环境激活成功，后续所有操作都将在该环境中进行。
应急方案：若激活失败，输入完整路径激活（将路径替换为你的Miniconda安装路径）： D:\python\miniconda3\Scripts\activate.bat D:\python\miniconda3\envs\llama-env

步骤2：获取LLaMA-Factory源码

选择以下一种方式获取源码，推荐Git方式（后续更新只需执行“git pull”即可）。

方式1：Git拉取（推荐，已安装Git）

在CMD中输入以下命令，进入你想存放源码的目录（以“E:\pc-project\LLaMA”为例）： cd /d E:\pc-project\LLaMA说明：/d参数用于跨盘符切换目录，若你的目录在C盘，可省略该参数；
拉取源码：输入以下命令，Git会自动将源码下载到“LLaMA-Factory”文件夹中： git clone https://github.com/hiyouga/LLaMA-Factory.git等待执行完成，若出现“Receiving objects: 100%”，说明拉取成功。

方式2：ZIP包解压（无Git，简单直接）

访问LLaMA-Factory的GitHub主页，点击右上角的“Code”按钮，选择“Download ZIP”；
将下载的ZIP压缩包右键解压到“E:\pc-project\LLaMA”目录；
将解压后的文件夹重命名为“LLaMA-Factory”（确保文件夹名无中文、空格或特殊字符，否则后续会报错）。

步骤3：安装核心依赖（PyTorch+LLaMA-Factory）

核心依赖分为两部分：PyTorch（深度学习框架）和LLaMA-Factory本身及配套工具。按顺序安装，避免依赖解析混乱。

第一步：安装CPU版PyTorch（无显卡必选）

PyTorch是LLaMA-Factory的运行基础，Windows CPU环境下优先选择2.1.0版本（经过实测，该版本无DLL冲突问题，且满足功能需求）。

pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cpu

参数说明：--index-url指定从PyTorch官方CPU源下载，避免下载到GPU版本导致冲突；

若你有NVIDIA显卡（支持CUDA 11.8及以上），可替换为GPU版命令，推理和微调速度会大幅提升：pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu118

第二步：安装LLaMA-Factory及配套依赖

先切换到LLaMA-Factory源码目录（替换为你的实际路径）： cd /d E:\pc-project\LLaMA\LLaMA-Factory
执行以下命令，安装LLaMA-Factory及所有配套依赖（使用清华源加速，避免国内下载超时）： pip install llamafactory[torch,metrics] -i https://pypi.tuna.tsinghua.edu.cn/simple说明：[torch,metrics]表示安装LLaMA-Factory的完整依赖，包括transformers（模型库）、peft（参数高效微调工具）等，无需手动逐个安装。

步骤4：验证依赖安装是否成功

安装完成后，通过简单命令验证核心依赖是否正常加载，这是避免后续启动失败的关键一步。

python -c "import torch; import transformers; import llamafactory; print('PyTorch版本:', torch.__version__); print('LLaMA-Factory版本:', llamafactory.__version__)"

✅ 验证成功：若输出类似以下内容，且无报错，说明依赖安装正常：

PyTorch版本: 2.1.0+cpu LLaMA-Factory版本: 0.9.3

❌ 常见问题：若提示“ModuleNotFoundError: No module named xxx”，说明该依赖未安装成功，重新执行步骤3的安装命令即可。

步骤5：启动LLaMA-Factory WebUI

这是最后一步，启动后将通过浏览器访问可视化界面，完成本地部署。

启动命令：在LLaMA-Factory源码目录下，输入以下命令（指定端口7861，避免与其他工具冲突）： llamafactory-cli webui --server-port 7861
等待启动完成：首次启动需加载Gradio前端资源，耗时约10-30秒（取决于网络速度）；
若出现“jieba pkg_resources is deprecated”等警告，无需理会，不影响功能；
启动成功后，CMD会输出“Running on local URL: http://localhost:7861”。
访问WebUI：打开任意浏览器，在地址栏输入“http://localhost:7861”，即可看到LLaMA-Factory的可视化界面，本地部署正式完成！

四、优化体验：创建“一键启动”脚本

每次启动都输入命令较繁琐，可创建批处理脚本，双击即可完成“激活环境→启动WebUI”全流程。

新建批处理文件：在LLaMA-Factory源码目录（E:\pc-project\LLaMA\LLaMA-Factory）下，右键“新建→文本文档”，将文件名改为“start_llamafactory.bat”（确保后缀是.bat，而非.txt）；
写入脚本内容：用记事本打开该文件，粘贴以下内容（将路径替换为你的实际路径）： @echo off echo ============== 正在激活虚拟环境 ============== call D:\python\miniconda3\Scripts\activate.bat D:\python\miniconda3\envs\llama-env echo ============== 正在切换到源码目录 ============== cd /d E:\pc-project\LLaMA\LLaMA-Factory echo ============== 正在启动LLaMA-Factory ============== llamafactory-cli webui --server-port 7861 echo ============== 启动完成，按任意键关闭 ============== pause
使用方式：双击“start_llamafactory.bat”，等待CMD执行完成后，直接在浏览器访问“http://localhost:7861”即可。

五、常见问题排查（避坑宝典）

部署过程中可能遇到各类问题，以下是高频问题及解决方案，覆盖90%以上的启动失败场景。

问题1：“llamafactory-cli”不是内部或外部命令

根源：虚拟环境未激活，或LLaMA-Factory未安装成功。

解决方案：

确保CMD前缀是“(llama-env)”，若不是，重新执行激活命令；
重新安装LLaMA-Factory：pip install --force-reinstall llamafactory -i 清华源。

问题2：DLL初始化例程失败（c10.dll）

根源：PyTorch版本与Windows系统VC++运行库不兼容。

解决方案：

安装/修复VC++ 2019-2022运行库：下载vc_redist.x64.exe，选择“修复”后重启电脑；
重新安装PyTorch 2.1.0 CPU版（步骤3的命令）。

问题3：浏览器访问“localhost:7861”无响应

根源：端口被占用，或WebUI未完成启动。

解决方案：

更换端口启动：llamafactory-cli webui --server-port 7862，访问“http://localhost:7862”；
耐心等待：确保CMD输出“Running on local URL”后再访问，避免启动中途访问。

问题4：虚拟环境找不到（EnvironmentNameNotFound）

根源：虚拟环境未创建成功，或conda缓存异常。

解决方案：重新创建虚拟环境（步骤1的命令），确保执行过程无报错。

六、后续使用：快速上手LLaMA-Factory

部署完成后，可通过WebUI快速实现核心功能：

模型加载：在“Model”标签页的“Model Name or Path”中，输入本地模型路径（如“E:\models\llama2-7b”）或Hugging Face模型名（如“llama2-7b”，会自动下载）；
对话推理：切换到“Chat”标签页，输入问题即可与模型对话；
数据集微调：在“Train”标签页上传自定义数据集，配置微调参数（CPU模式建议将“Batch Size”设为2-4），点击“Start Training”即可。

七、总结

Windows环境下LLaMA-Factory的本地部署，核心是“虚拟环境隔离+稳定版本选择+依赖自动解析”。只要遵循本文步骤，避开“未激活环境”“版本不兼容”“端口冲突”这三大坑，即使是零基础也能顺利完成搭建。

部署完成后，你将拥有一个本地的大模型工具链，无论是用于学术研究、项目开发还是兴趣探索，都能实现高效、安全的大模型开发。若在使用过程中遇到新问题，可查看LLaMA-Factory的官方文档，或在评论区交流。

Windows环境LLaMA-Factory本地部署终极指南：从0到1搭建大模型工具链

Ne0inhk

一、部署前的核心认知：为什么要本地部署？

二、前置准备：必装工具清单

工具1：Miniconda3（Python环境管理器）

工具2：Git（可选，源码获取工具）

三、核心部署步骤：五步完成搭建

步骤1：创建并激活独立虚拟环境

步骤2：获取LLaMA-Factory源码

方式1：Git拉取（推荐，已安装Git）

方式2：ZIP包解压（无Git，简单直接）

步骤3：安装核心依赖（PyTorch+LLaMA-Factory）

第一步：安装CPU版PyTorch（无显卡必选）

第二步：安装LLaMA-Factory及配套依赖

步骤4：验证依赖安装是否成功

步骤5：启动LLaMA-Factory WebUI

四、优化体验：创建“一键启动”脚本

五、常见问题排查（避坑宝典）

问题1：“llamafactory-cli”不是内部或外部命令

问题2：DLL初始化例程失败（c10.dll）

问题3：浏览器访问“localhost:7861”无响应

问题4：虚拟环境找不到（EnvironmentNameNotFound）

六、后续使用：快速上手LLaMA-Factory

七、总结

Read more

Java重入锁（ReentrantLock）全面解析：从入门到源码深度剖析

JAVA 注解（Annotation）：从原理到实战应用

【JAVA 进阶】SpringMVC全面解析：从入门到实战的核心知识点梳理

【Java 开发日记】运行时有出现过什么异常？