LLaMA Factory 微调 Llama3 模型实战指南 | 极客日志

PythonAI算法

LLaMA Factory 微调 Llama3 模型实战指南

使用 LLaMA Factory 框架对 Llama3-8B 模型进行微调的完整流程。涵盖环境搭建、数据集格式准备、WebUI 界面配置训练参数、模型评估及对话测试等关键步骤，旨在帮助开发者快速掌握开源大模型的本地化微调方法。

GRACE Grace发布于 2025/2/6更新于 2026/6/228 浏览

LLaMA Factory 微调 Llama3 模型实战指南

LLaMA Factory 是一款开源低代码大模型微调框架，集成了业界广泛使用的微调技术，支持通过 Web UI 界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架之一。

环境准备

硬件推荐

建议使用显存 24GB 及以上的 GPU（如 A10），以确保微调过程流畅运行。

镜像选择

推荐使用 DSW 官方镜像：modelscope:1.14.0-pytorch2.1.2-gpu-py310-cu121-ubuntu22.04。

安装 LLaMA Factory

首先拉取项目源码：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

然后安装依赖环境：

pip uninstall -y vllm
pip install llamafactory[metrics]==0.7.1
pip install accelerate==0.30.1

安装完成后，可通过以下命令检查版本：

llamafactory-cli version

数据集准备

LLaMA-Factory 内置了丰富的数据集，位于 data 目录下。用户也可以准备自定义数据集，将数据处理为框架特定的格式放入 data 下，并修改 dataset_info.json 文件。

Alpaca 格式

标准的数据结构如下：

[
  {
    "instruction": "人类指令（必填）",
    "input": "人类输入（选填）",
    "output": "模型回答（必填）",
    "system": "系统提示词（选填）",
    "history": [
      ["第一轮指令（选填）", "第一轮回答（选填）"],
      [

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

"数据集名称": {
  "file_name": "data.json",
  "columns": {
    "prompt": "instruction",
    "query": "input",
    "response": "output",
    "system": "system",
    "history": "history"
  }
}

%cd LLaMA-Factory
!wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/llama_factory/data.zip
!mv data rawdata && unzip data.zip -d data

export USE_MODELSCOPE_HUB=1 && llamafactory-cli webui

llamafactory-cli train \
  --stage sft \
  --do_predict \
  --model_name_or_path meta-llama/Llama-3-8B-Instruct \
  --adapter_name_or_path ./train_llama3 \
  --dataset alpaca_demo \
  --template llama3 \
  --finetuning_type lora \
  --output_dir ./infer_output

LLaMA Factory 微调 Llama3 模型实战指南

LLaMA Factory 微调 Llama3 模型实战指南

环境准备

硬件推荐

镜像选择

安装 LLaMA Factory

数据集准备

Alpaca 格式

更多推荐文章

相关免费在线工具

下载示例数据

模型微调

启动 Web UI

配置训练参数

模型评估与对话

命令行推理示例

常见问题与建议

更多推荐文章

相关免费在线工具

LLaMA Factory 微调 Llama3 模型实战指南

LLaMA Factory 微调 Llama3 模型实战指南

环境准备

硬件推荐

镜像选择

安装 LLaMA Factory

数据集准备

Alpaca 格式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

下载示例数据

模型微调

启动 Web UI

配置训练参数

模型评估与对话

命令行推理示例

常见问题与建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具