基于 LLaMA-Factory 微调 ChatGLM3 模型实战 | 极客日志

PythonAI算法

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

综述由AI生成使用 LLaMA-Factory 框架对 ChatGLM3 模型进行微调的完整流程。内容涵盖 Conda 环境搭建、项目依赖安装、Web 界面参数配置、训练命令解析、自定义数据集格式规范及模型合并导出步骤。同时提供了显存优化策略、Loss 异常排查及 Tokenizer 加载错误等常见问题的解决方案，旨在帮助开发者高效实现垂直领域模型的定制化训练与部署。

CloudNative发布于 2025/2/7更新于 2026/6/224 浏览

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

本文详细介绍如何使用 LLaMA-Factory 框架对智谱 AI 的 ChatGLM3 模型进行监督微调（SFT），包括环境配置、Web 界面操作、命令行参数详解、自定义数据集准备及常见问题处理。

1. 创建虚拟环境

建议使用 Conda 创建独立的 Python 环境，避免依赖冲突。

conda create -n chatglm3 python=3.10 -y
conda activate chatglm3

注意：ChatGLM3 推荐在 Python 3.10 环境下运行，CUDA 版本需与显卡驱动匹配。

2. 部署 LLaMA-Factory

（1）克隆项目

从 GitHub 获取最新代码：

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

（2）安装依赖

根据系统环境安装必要的库。推荐使用 requirements.txt 快速安装：

pip install -r requirements.txt

若遇到特定包版本冲突，可尝试指定版本安装，例如：

pip install transformers==4.37.0
pip install peft==0.8.0

（3）启动 Web UI

使用以下命令启动训练管理界面：

CUDA_VISIBLE_DEVICES=0 python src/train_web.py

启动成功后，浏览器访问 http://localhost:7860 即可看到控制面板。

LLaMA-Factory 主界面

3. ChatGLM3 模型微调配置

在 Web 界面中，选择 ChatGLM3 作为基座模型，并配置以下关键参数：

Stage: 选择 sft (Supervised Fine-Tuning)。
Model Name: 指向本地下载好的 ChatGLM3 模型路径。
Finetuning Type: 推荐使用 lora，显存占用更低且训练速度快。
Dataset: 选择或上传准备好的指令微调数据集。

微调参数配置

点击'预览命令'可查看底层执行的 Python 脚本，便于调试和复现。

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \
    --stage sft \
    --do_train \
    --model_name_or_path /root/LLaMA-Factory-main/chatglm3 \
    --dataset alpaca_gpt4_zh \
    --template default \
    --finetuning_type lora \
    --lora_target q_proj,v_proj \
    --output_dir path_to_sft_checkpoint \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate 5e-5 \
    --num_train_epochs 3.0 \
    --plot_loss \
    --fp16

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("/path/to/merged_model", trust_remote_code=True)
model = AutoModel.from_pretrained("/path/to/merged_model", trust_remote_code=True)

response, history = model.chat(tokenizer, "你好", history=[])
print(response)

[
  {
    "instruction": "用户指令（必填）",
    "input": "用户输入（选填）",
    "output": "模型回答（必填）",
    "system": "系统提示词（选填）",
    "history": [
      ["第一轮指令", "第一轮回答"],
      ["第二轮指令", "第二轮回答"]
    ]
  }
]

{
  "chatglm3_custom": {
    "file_name": "chatglm3_train.json",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output",
      "system": "system",
      "history": "history"
    }
  }
}

AttributeError: property 'eos_token' of 'ChatGLMTokenizer' object has no setter

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

1. 创建虚拟环境

2. 部署 LLaMA-Factory

（1）克隆项目

（2）安装依赖

（3）启动 Web UI

3. ChatGLM3 模型微调配置

更多推荐文章

相关免费在线工具

参数详解

4. 推理测试

5. 模型合并导出

6. 使用官方项目运行微调合并后的模型

7. 自定义数据集指南

数据集结构

注册数据集

8. 常见问题与解决方案

（1）合并后的模型无法加载

（2）显存不足

（3）Loss 不下降

9. 总结

更多推荐文章

相关免费在线工具

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

基于 LLaMA-Factory 微调 ChatGLM3 模型实战

1. 创建虚拟环境

2. 部署 LLaMA-Factory

（1）克隆项目

（2）安装依赖

（3）启动 Web UI

3. ChatGLM3 模型微调配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

参数详解

4. 推理测试

5. 模型合并导出

6. 使用官方项目运行微调合并后的模型

7. 自定义数据集指南

数据集结构

注册数据集

8. 常见问题与解决方案

（1）合并后的模型无法加载

（2）显存不足

（3）Loss 不下降

9. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具