LLaMA-Factory 全流程训练模型 | 极客日志

PythonAI算法

LLaMA-Factory 全流程训练模型

在 Docker 环境下使用 LLaMA-Factory 进行模型训练和推理的全流程。内容包括启动 Docker 容器、配置 CUDA 驱动、安装 Python 环境、克隆并配置 LLaMA-Factory、准备微调数据、执行 SFT 训练、查看训练指标、以及加载模型进行对话测试和评估。文章提供了具体的命令行操作、YAML 配置文件示例及 Python 推理代码，适合希望快速上手大模型微调的开发者参考。

机器人发布于 2026/4/6更新于 2026/7/543 浏览

LLaMA-Factory 全流程训练模型

本文主要讲述在 docker 下使用 LLaMA-Factory 训练推理模型。

拉取镜像

首先需要启动 docker，然后在终端中输入：

docker run -tid --gpus all -p 8000:8000 --name LLM -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all --privileged=true ubuntu:20.04

这个命令启动了一个 Ubuntu 20.04 容器，使用所有可用的 GPU
主机的 8000 端口映射到容器的 8000 端口
容器命名为 LLM，以特权模式运行容器

进入容器

docker exec -it LLM /bin/bash

安装 CUDA 驱动

docker 拉取的 Ubuntu 20.04 没有任何配置，比如 wget 等命令需要自己通过 apt-get install 安装。目前只将 GPU 映射到了 docker 里，还没有安装驱动。

wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sh cuda_12.6.2_560.35.03_linux.run

随后会生成一些指引，默认安装就行。

root@82c2f2b69781:/home# ls /usr/local/ | grep cuda
cuda cuda-12.6 root@82c2f2b69781:/home# nvcc -V
bash: nvcc: command not found

这说明系统的 PATH 环境变量没有包含 /usr/local/cuda-12.6/bin。

编辑环境变量 vim ~/.bashrc 加入下面两行：

export PATH=/usr/local/cuda-12.6/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH

然后重新运行一下就生效了：source ~/.bashrc。验证成功。

root@82c2f2b69781:/home# echo $PATH
/usr/local/cuda-12.6/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin

Docker 内安装 Python

docker 拉取的 Ubuntu 20.04 没有任何配置，比如 wget 等命令需要自己通过 apt-get install 安装。

这是 python 源码包的地址（3.10.6 为例）：Index of /ftp/python/3.10.6/

wget https://www.python.org/ftp/python/3.10.6/Python-3.10.6.tgz
tar -zxvf Python-3.10.6.tgz
 Python-3.10.6
 ./configure

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

sudo make
sudo make test
sudo make install

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

export ASCEND_HOME_PATH=/usr/local/Ascend/ascend-toolkit/latest

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

### model
model_name_or_path: /home/Qwen/Qwen2.5-1.5B-Instruct
### method
stage: sft
do_train: true
finetuning_type: freeze
# lora_target: all
dataset: alpaca_zh_demo
template: qwen
cutoff_len: 10240
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16
### output
output_dir: output
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true
### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 2
learning_rate: 1.0e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
fp16: true
ddp_timeout: 180000000
### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

llamafactory-cli train examples/train.yaml

***** train metrics *****
epoch = 3.0
total_flos = 2906404GF
train_loss = 1.0846
train_runtime = 0:04:15.80
train_samples_per_second = 10.555
train_steps_per_second = 5.277

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 我们的模型输出路径
model_name_or_path = "/home/LLaMA-Factory/output"

model = AutoModelForCausalLM.from_pretrained(model_name_or_path)
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

prompt = "列出一个应该在野营应急包中的 7 件物品。"
inputs = tokenizer(prompt, return_tensors="pt").to(device)
with torch.no_grad():
    outputs = model.generate(inputs.input_ids, max_length=50)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

llamafactory-cli eval --task mmlu --model_name_or_path /home/Qwen/Qwen2.5-1.5B-Instruct --template qwen --batch_size 1 -n_shot 5

model_name_or_path: /home/Qwen/Qwen2.5-1.5B-Instruct
template: qwen
do_sample: false

llamafactory-cli chat infer.yaml

LLaMA-Factory 全流程训练模型

LLaMA-Factory 全流程训练模型

拉取镜像

进入容器

安装 CUDA 驱动

Docker 内安装 Python

更多推荐文章

相关免费在线工具

LLaMA-Factory 安装与配置

安装

下载模型

创建配置文件

开始微调训练

训练指标总结

加载模型对话

评估

推理

更多推荐文章

相关免费在线工具

LLaMA-Factory 全流程训练模型

LLaMA-Factory 全流程训练模型

拉取镜像

进入容器

安装 CUDA 驱动

Docker 内安装 Python

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

LLaMA-Factory 安装与配置

安装

下载模型

创建配置文件

开始微调训练

训练指标总结

加载模型对话

评估

推理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具