使用 LLaMA-Factory 进行大语言模型全流程微调实战

介绍如何使用 LLaMA-Factory 工具进行大语言模型的微调。内容包括基于 Conda 的环境搭建、数据集注册与配置、WebUI 及命令行两种训练模式的操作步骤、训练过程中 Loss 曲线的监控与分析，以及显存溢出（OOM）问题的常见解决方案。旨在帮助开发者快速上手主流开源模型的微调流程。

PgDevote发布于 2026/4/5更新于 2026/5/2230 浏览

LLaMA-Factory 的核心优势在于集成了几乎所有主流国产模型（DeepSeek, Qwen, Yi）和海外模型（Llama 3, Mistral），并且原生支持 Gradio 可视化面板，让你在网页上点点鼠标就能完成模型训练。

一、环境搭建：打造训练环境

为了保证训练不因版本冲突而崩溃，建议使用 Conda 进行物理隔离。

克隆项目

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git  
cd LLaMA-Factory

安装核心依赖 (针对 CUDA 12.1 环境)

pip install -e .[metrics,bitsandbytes,qwen]

验证是否安装成功

llamafactory-cli version

二、准备数据：注册自定义数据集

LLaMA-Factory 有一套自己的数据集管理逻辑。你需要将生成的 security_expert_data.jsonl 放入 data/ 目录，并在 data/dataset_info.json 中注册它。

注册示例：

{
  "my_security_data": {
    "file_name": "security_expert_data.jsonl",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }
}

三、开始训练：WebUI 模式与脚本模式

初学者推荐：WebUI 模式在终端执行 llamafactory-cli webui。你会看到一个极其直观的界面。你需要设置：
- 模型名称：选择 DeepSeek-V3 或 Qwen2.5-7B。
- 微调方法：选择 lora。
- 数据集：勾选你刚刚注册的 my_security_data。
- 学习率：建议 5e-5。
- 计算精度：显存够选 bf16，不够选 fp16 或 int4。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

llamafactory-cli train \
--stage sft \
--do_train \
--model_name_or_path /path/to/your/model \
--dataset my_security_data \
--template qwen \
--finetuning_type lora \
--output_dir ./saves/security_agent_v1 \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--lr_scheduler_type cosine \
--logging_steps 10 \
--save_steps 100 \
--learning_rate 5e-5 \
--num_train_epochs 3.0 \
--plot_loss \
--fp16

使用 LLaMA-Factory 进行大语言模型全流程微调实战

一、环境搭建：打造训练环境

二、准备数据：注册自定义数据集

三、开始训练：WebUI 模式与脚本模式

更多推荐文章

相关免费在线工具

四、关键指标：如何看懂训练 Loss 曲线

五、避坑指南：显存溢出的解决方案

更多推荐文章

相关免费在线工具

使用 LLaMA-Factory 进行大语言模型全流程微调实战

一、环境搭建：打造训练环境

二、准备数据：注册自定义数据集

三、开始训练：WebUI 模式与脚本模式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、关键指标：如何看懂训练 Loss 曲线

五、避坑指南：显存溢出的解决方案

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具