使用 LLaMA-Factory 进行大语言模型微调详解 | 极客日志

PythonAI算法

使用 LLaMA-Factory 进行大语言模型微调详解

综述由AI生成使用 LLaMA-Factory 对大语言模型进行微调的全过程。内容包括检查 GPU 计算能力并安装匹配的 PyTorch 版本，克隆并安装 LLaMA-Factory 及 unsloth 优化组件，下载 Qwen 等模型文件，准备和注册数据集（如 identity），配置 LoRA 或 Unsloth 进行微调训练，验证权重并导出合并，最后将模型转换为 GGUF 格式导入 Ollama 部署。通过对比原始模型与微调后的表现，验证了微调效果。

剑仙发布于 2026/4/5更新于 2026/5/2326 浏览

一、安装 PyTorch

1. 检查 GPU 计算能力

在开始微调之前，首先需要确认 GPU 的计算能力，因为不同架构的 GPU 对 PyTorch 版本有不同要求。

nvidia-smi --query-gpu=compute_cap --format=csv

2. 匹配 PyTorch 版本

根据 GPU 计算能力选择合适的 PyTorch 版本：

计算能力 < 7.0 (如 Maxwell 架构)：使用较老版本
计算能力 7.x (Volta/Turing)：PyTorch 1.8+
计算能力 8.x (Ampere)：PyTorch 1.10+
计算能力 9.x (Ada Lovelace)：PyTorch 2.0+

3. 重新安装合适版本的 PyTorch

如果当前安装的 PyTorch 版本与 GPU 计算能力不匹配，需要重新安装合适版本。

# 卸载当前版本
pip uninstall torch torchvision torchaudio
# 安装新版本 (参考官网命令)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

二、安装 LLaMA-Factory

1. LLaMA-Factory

LLaMA-Factory 是一个专门用于微调大语言模型的工具包。

git clone -b v0.8.1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]

2. unsloth 的显存优化机制

为了降低显存占用，建议安装 liger_kernel 0.5.2 版本。

pip install liger-kernel==0.5.2

三、下载模型

模型下载是微调过程中的关键步骤，需确保下载正确的模型文件和权重。

# 模型安装目录示例
/data/models/Qwen/Qwen2.5-7B-Instruct

建议使用 Git LFS 管理大文件。Qwen2.5-7B-Instruct 适合进行进一步的领域适配微调。

四、数据集

1. 内置数据集

LLaMA-Factory 提供了内置的数据集支持。

准备数据集文件，json 格式，存放到 data 目录下。
注册数据集，将 json 文件注册到 data 目录下的 dataset_info.json 文件。
使用内置 identity 数据集，用于修改模型的自我意识。
替换 identity.json 里面的占位符。

sed -i 's/{{name}}/XX 智能助手/g; s/{{author}}/XX 科技/g' data/identity.json

2. 数据集注册

对于非内置数据集，需要在 dataset_info.json 文件中添加数据集的元信息，包括文件路径、格式说明等。

五、微调

1. 基本

基本微调配置提供了最基础的训练参数设置。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

llamafactory-cli train \
    --stage sft \
    --model_name_or_path path_to_model \
    --dataset identity \
    --template default \
    --finetuning_type lora \
    --output_dir saves/lora/sft

llamafactory-cli train \
    --stage sft \
    --model_name_or_path path_to_model \
    --dataset identity \
    --finetuning_type lora \
    --quantization_bit 4 \
    --gradient_accumulation_steps 4

ll -lhS ./saves/lora/sft

llamafactory-cli chat \
    --model_name_or_path saves/lora/sft \
    --dataset identity

llamafactory-cli export \
    --model_name_or_path path_to_base_model \
    --adapter_name_or_path saves/lora/sft \
    --export_dir saves/merged \
    --export_size 2 \
    --export_legacy_format false

# 这里使用单卡
vllm serve path_to_base_model

# 单卡
vllm serve saves/merged

llamafactory-cli chat --model_name_or_path path_to_export_model

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make

./convert-hf-to-gguf.py path_to_merged_model --outfile model.gguf

FROM /opt/fine-tune/LLaMA-Factory/saves/lora/xxx.gguf
TEMPLATE "{{ .System }} {{ .Prompt }}"
PARAMETER system "You are a helpful assistant."

ollama create sunmao -f Modelfile

使用 LLaMA-Factory 进行大语言模型微调详解

一、安装 PyTorch

1. 检查 GPU 计算能力

2. 匹配 PyTorch 版本

3. 重新安装合适版本的 PyTorch

二、安装 LLaMA-Factory

1. LLaMA-Factory

2. unsloth 的显存优化机制

三、下载模型

四、数据集

1. 内置数据集

2. 数据集注册

五、微调

1. 基本

更多推荐文章

相关免费在线工具

2. 使用 unsloth

3. 查看 LoRA 权重

4. 预测评估

5. 权重合并导出

六、测试

1. 原始模型

2. 微调模型

3. 多轮对话测试（Chat 模式）

七、转换导入 Ollama

1. 下载 llama.cpp

2. 转换

3. 导入

更多推荐文章

相关免费在线工具

使用 LLaMA-Factory 进行大语言模型微调详解

一、安装 PyTorch

1. 检查 GPU 计算能力

2. 匹配 PyTorch 版本

3. 重新安装合适版本的 PyTorch

二、安装 LLaMA-Factory

1. LLaMA-Factory

2. unsloth 的显存优化机制

三、下载模型

四、数据集

1. 内置数据集

2. 数据集注册

五、微调

1. 基本

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 使用 unsloth

3. 查看 LoRA 权重

4. 预测评估

5. 权重合并导出

六、测试

1. 原始模型

2. 微调模型

3. 多轮对话测试（Chat 模式）

七、转换导入 Ollama

1. 下载 llama.cpp

2. 转换

3. 导入

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具