LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化 | 极客日志

Python

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化在日常的大模型微调工作中，你是否经常遇到这些困扰：训练过程像个黑盒子，不知道模型到底学到了什么；损失曲线突然异常，却找不到问题根源；多轮实验参数混乱，无法有效对比效果？今天我们就来全面介绍 LLaMA Factory 这一强大的大模型微调框架，重点讲解如何在 Ubuntu 22.04 系统上使用四种可视化工具监控训练过程，…

AiEngineer发布于 2026/4/6更新于 2026/7/2364K 浏览

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

在日常的大模型微调工作中，你是否经常遇到这些困扰：训练过程像个黑盒子，不知道模型到底学到了什么；损失曲线突然异常，却找不到问题根源；多轮实验参数混乱，无法有效对比效果？

今天我们就来全面介绍 LLaMA Factory 这一强大的大模型微调框架，重点讲解如何在 Ubuntu 22.04 系统上使用四种可视化工具监控训练过程，让你的模型训练透明可控、调优有据。

一、LLaMA Factory 训练监控体系概览

LLaMA Factory 通过模块化设计实现了全面的指标监控功能，主要覆盖训练稳定性、模型性能和资源利用三大维度。系统默认在 src/llamafactory/train/sft/metric.py 中实现基础评估逻辑，同时支持通过配置文件扩展自定义指标。

核心监控指标包括：

训练稳定性：损失值、梯度范数、学习率变化
模型性能：准确率、困惑度、ROUGE 分数
文本质量：生成内容的流畅性和相关性
资源利用：GPU 内存占用、训练速度

指标数据通过标准化流程采集：计算层→评估层→存储层→展示层，最终在各种可视化工具上呈现。

二、Ubuntu 22.04 环境准备

在开始之前，确保你的 Ubuntu 22.04 系统已准备好基础环境：

# 创建并激活虚拟环境
conda create -n llama-factory-monitor python=3.10
conda activate llama-factory-monitor

# 安装 LLaMA Factory 及依赖
git clone https://github.com/hiyouga/LLaMA-Factory
cd LLaMA-Factory
pip install -e ".[torch,metrics,swanlab]"

# 安装 TensorBoard
pip install tensorboard

如果网络环境对 HuggingFace 下载不友好，可以设置国内镜像源：

# 下载源改为魔搭社区
export USE_MODELSCOPE_HUB=1
# 或者改为魔乐社区
export USE_OPENMIND_HUB=1

三、四大监控工具实战详解

1. LlamaBoard：内置 WebUI 监控

LlamaBoard 是 LLaMA Factory 自带的 Web 可视化界面，开箱即用，适合快速上手。

启动方式：

llamafactory-cli webui

启动后访问 http://127.0.0.1:7860 即可进入界面。

功能特点：

实时损失曲线显示：训练过程中自动更新损失曲线
基础训练指标：当前 epoch、学习率等关键参数
模型加载状态：实时显示模型和数据加载进度
简易参数配置：通过 Web 界面调整训练参数

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

swanlab login

### swanlab 配置
use_swanlab: true
swanlab_project: llamafactory
swanlab_run_name: Qwen2-VL-7B-Instruct

pip install tensorboard

# 训练时添加--report_to 参数
python src/train.py \
  --config examples/train_lora/llama3_lora_sft.yaml \
  --report_to tensorboard

tensorboard --logdir=./runs --port=6006

# 目录结构
runs/
├── exp1_lr1e-5
├── exp2_lr3e-5
└── exp3_lr5e-5

# 启动 TensorBoard 时指定父目录
tensorboard --logdir=./runs --port=6006

pip install wandb
wandb login

# 在训练配置 YAML 文件中添加
report_to: wandb
wandb_project: my-llama-project
wandb_run_name: experiment-1

# examples/train_lora/qwen2_lora_sft.yaml
model_name_or_path: Qwen/Qwen2.5-1.5B-Instruct
dataset: alpaca_zh_demo
finetuning_type: lora

# 监控配置
report_to:
  - tensorboard
  - swanlab
  - wandb
use_swanlab: true
swanlab_project: qwen2.5b-demo
swanlab_run_name: first-experiment
wandb_project: llama-factory-demo

# 在 metric.py 中添加自定义指标
eval_metrics = ["accuracy", "perplexity", "rouge-1", "rouge-2", "rouge-l"]

llamafactory-cli train examples/train_lora/qwen2_lora_sft.yaml

# 在配置中添加梯度裁剪
gradient_clip_val: 1.0
gradient_norm_threshold: 10.0

工具特性	LlamaBoard	SwanLab	TensorBoard	Weights & Biases
安装配置难度	简单	中等	中等	复杂
功能丰富度	基础	中等	丰富	非常丰富
多实验对比	不支持	支持	支持	强大支持
团队协作	不支持	支持	有限支持	强大支持
本地部署	是	支持混合	是	云端为主
学习曲线	平缓	中等	中等	陡峭

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

一、LLaMA Factory 训练监控体系概览

二、Ubuntu 22.04 环境准备

三、四大监控工具实战详解

1. LlamaBoard：内置 WebUI 监控

更多推荐文章

相关免费在线工具

2. SwanLab：国产开源训练看板

3. TensorBoard：经典强大的可视化工具

4. Weights & Biases（W&B）：企业级实验跟踪

四、实战案例：多工具协同监控训练过程

五、训练异常诊断与调优

1. 损失曲线异常分析

2. 梯度监控

3. 资源瓶颈诊断

六、工具对比与选择建议

七、总结

更多推荐文章

相关免费在线工具

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

LLaMA Factory 训练可视化管理：Loss 曲线解析与性能优化

一、LLaMA Factory 训练监控体系概览

二、Ubuntu 22.04 环境准备

三、四大监控工具实战详解

1. LlamaBoard：内置 WebUI 监控

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. SwanLab：国产开源训练看板

3. TensorBoard：经典强大的可视化工具

4. Weights & Biases（W&B）：企业级实验跟踪

四、实战案例：多工具协同监控训练过程

五、训练异常诊断与调优

1. 损失曲线异常分析

2. 梯度监控

3. 资源瓶颈诊断

六、工具对比与选择建议

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具