LLaMA-Factory 全流程模型训练指南 | 极客日志

PythonAI算法

LLaMA-Factory 全流程模型训练指南

在 Docker 环境下使用 LLaMA-Factory 进行大模型微调的全流程。内容包括构建 Docker 容器、安装 CUDA 驱动与 Python 环境、部署 LLaMA-Factory 框架、下载 Qwen 模型、配置训练参数、执行微调训练以及后续的模型评估与推理测试。通过命令行操作与配置文件管理，实现了从环境搭建到模型应用落地的完整闭环。

PentesterX发布于 2026/4/6更新于 2026/7/1959 浏览

LLaMA-Factory 全流程模型训练指南

本文主要讲述在 Docker 环境下使用 LLaMA-Factory 进行模型的训练与推理。

拉取镜像

启动 Docker，在终端中输入以下命令：

docker run -tid --gpus all -p 8000:8000 --name LLM -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all --privileged=true ubuntu:20.04

该命令启动了一个 Ubuntu 20.04 容器，使用所有可用的 GPU，并将主机 8000 端口映射到容器 8000 端口。

进入容器

docker exec -it LLM /bin/bash

安装 CUDA 驱动

仅映射 GPU 到 Docker 中是不够的，还需要安装驱动。

wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sh cuda_12.6.2_560.35.03_linux.run

按照指引默认安装即可。安装后检查环境变量是否包含 CUDA bin 路径：

ls /usr/local/ | grep cuda
nvcc -V

如果提示 command not found，需编辑环境变量 ~/.bashrc 并添加以下内容：

export PATH=/usr/local/cuda-12.6/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH
source ~/.bashrc

安装 Python

Docker 拉取的 Ubuntu 20.04 未预装 Python，需手动编译安装。

wget https://www.python.org/ftp/python/3.10.6/Python-3.10.6.tgz
tar -zxvf Python-3.10.6.tgz
cd Python-3.10.6
sudo ./configure
sudo make
sudo make test
sudo make install

安装 LLaMA-Factory

克隆仓库

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

如果使用昇腾 NPU，需先设置环境变量：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

export ASCEND_HOME_PATH=/usr/local/Ascend/ascend-toolkit/latest

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

### model
model_name_or_path: /home/Qwen/Qwen2.5-1.5B-Instruct
### method
stage: sft
do_train: true
finetuning_type: freeze
dataset: alpaca_zh_demo
template: qwen
cutoff_len: 10240
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16
### output
output_dir: output
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true
### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 2
learning_rate: 1.0e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
fp16: true
ddp_timeout: 180000000
### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

llamafactory-cli train examples/train.yaml

***** train metrics *****
epoch = 3.0
total_flos = 2906404GF
train_loss = 1.0846
train_runtime = 0:04:15.80
train_samples_per_second = 10.555
train_steps_per_second = 5.277

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_name_or_path = "/home/LLaMA-Factory/output"
model = AutoModelForCausalLM.from_pretrained(model_name_or_path)
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

prompt = "列出一个应该在野营应急包中的 7 件物品。"
inputs = tokenizer(prompt, return_tensors="pt").to(device)
with torch.no_grad():
    outputs = model.generate(inputs.input_ids, max_length=50)
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(response)

llamafactory-cli eval --task mmlu --model_name_or_path /home/Qwen/Qwen2.5-1.5B-Instruct --template qwen --batch_size 1 --n_shot 5

model_name_or_path: /home/Qwen/Qwen2.5-1.5B-Instruct
template: qwen
do_sample: false

llamafactory-cli chat infer.yaml

LLaMA-Factory 全流程模型训练指南

LLaMA-Factory 全流程模型训练指南

拉取镜像

进入容器

安装 CUDA 驱动

安装 Python

安装 LLaMA-Factory

克隆仓库

更多推荐文章

相关免费在线工具

下载模型

配置微调文件

开始微调训练

加载模型对话

评估与推理

更多推荐文章

相关免费在线工具

LLaMA-Factory 全流程模型训练指南

LLaMA-Factory 全流程模型训练指南

拉取镜像

进入容器

安装 CUDA 驱动

安装 Python

安装 LLaMA-Factory

克隆仓库

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

下载模型

配置微调文件

开始微调训练

加载模型对话

评估与推理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具