使用 LLaMA-Factory 进行大语言模型微调的全流程实战 | 极客日志

PythonAI算法

使用 LLaMA-Factory 进行大语言模型微调的全流程实战

使用 LLaMA-Factory 进行大语言模型微调的完整流程。内容包括环境搭建（Conda 隔离、依赖安装）、数据集准备与注册、WebUI 及命令行两种训练模式配置、Loss 曲线监控与调优策略，以及显存溢出（OOM）问题的常见解决方案。旨在帮助开发者快速上手微调任务，掌握关键参数设置与故障排查方法。

氛围发布于 2026/4/6更新于 2026/7/2462 浏览

很多初学者卡在环境配置和复杂的 torch.train 逻辑上。LLaMA-Factory 的核心优势在于它集成了几乎所有主流国产模型（DeepSeek, Qwen, Yi）和海外模型（Llama 3, Mistral），并且原生支持 Gradio 可视化面板，让你在网页上点点鼠标就能'炼丹'。

一、环境搭建：打造你的'炼丹炉'

为了保证训练不因版本冲突而崩溃，建议使用 Conda 进行物理隔离。

1. 克隆项目

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

2. 安装核心依赖 (针对 CUDA 12.1 环境)

pip install -e .[metrics,bitsandbytes,qwen]

3. 验证是否安装成功

llamafactory-cli version

二、准备数据集：注册自定义数据

LLaMA-Factory 有一套自己的数据集管理逻辑。你需要把准备好的 security_expert_data.jsonl 放入 data/ 目录，并在 data/dataset_info.json 中注册它。

注册示例：

{
  "my_security_data": {
    "file_name": "security_expert_data.jsonl",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }
}

三、启动训练：WebUI 模式与脚本模式

1. 初学者推荐：WebUI 模式

在终端执行 llamafactory-cli webui。你会看到一个极其直观的界面。你需要设置：

模型名称：选择 DeepSeek-V3 或 Qwen2.5-7B。
微调方法：选择 lora。
数据集：勾选你刚刚注册的 my_security_data。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

llamafactory-cli train \
--stage sft \
--do_train \
--model_name_or_path /path/to/your/model \
--dataset my_security_data \
--template qwen \
--finetuning_type lora \
--output_dir ./saves/security_agent_v1 \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--lr_scheduler_type cosine \
--logging_steps 10 \
--save_steps 100 \
--learning_rate 5e-5 \
--num_train_epochs 3.0 \
--plot_loss \
--fp16

使用 LLaMA-Factory 进行大语言模型微调的全流程实战

一、环境搭建：打造你的'炼丹炉'

1. 克隆项目

2. 安装核心依赖 (针对 CUDA 12.1 环境)

3. 验证是否安装成功

二、准备数据集：注册自定义数据

三、启动训练：WebUI 模式与脚本模式

1. 初学者推荐：WebUI 模式

更多推荐文章

相关免费在线工具

2. 高阶推荐：命令行模式 (CLI)

四、关键指标：如何看懂 Loss 曲线

五、避坑指南：显存溢出的解决方案

更多推荐文章

相关免费在线工具

使用 LLaMA-Factory 进行大语言模型微调的全流程实战

一、环境搭建：打造你的'炼丹炉'

1. 克隆项目

2. 安装核心依赖 (针对 CUDA 12.1 环境)

3. 验证是否安装成功

二、准备数据集：注册自定义数据

三、启动训练：WebUI 模式与脚本模式

1. 初学者推荐：WebUI 模式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 高阶推荐：命令行模式 (CLI)

四、关键指标：如何看懂 Loss 曲线

五、避坑指南：显存溢出的解决方案

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具