Llama3 微调实践教程（XTuner 版） | 极客日志

PythonAI算法

Llama3 微调实践教程（XTuner 版）

Llama 3 发布 8B 和 70B 模型，采用 GQA 和 Tiktoken 分词器。介绍使用 XTuner 进行 Llama 3 全量微调的实践流程，包括环境配置、模型下载、数据集准备、配置文件修改及训练推理验证。仅需 2 张 A100 即可支持 8K 上下文全量微调，通过自定义认知数据可实现模型个性化设定。

GopherDev发布于 2025/2/7更新于 2026/7/2144 浏览

Llama 3 概览

首先回顾一下 Llama 3 的亮点：

首次出现 8B 模型，且 8B 与 70B 模型全系列使用 GQA (Group Query Attention)。
最大模型达到 400B 规模大小，未来几个月内发布！
分词器由 SentencePiece 换为了 Tiktoken，与 GPT4 保持一致。
相比于 Llama2 的 32000 词表大小，Llama3 的词表大小来到了惊人的 128256。
数据方面上，Llama3 使用了约 15T token 用于模型的训练。
开源模型大小为 8B 和 70B 两种，每种规模均有开源基座模型和 instruct 模型。
Llama3 8B Instruct 模型在数学与代码能力方面数倍于 Llama2 7B chat 模型。

2*A100 即可全量微调

8K 上下文 Llama3 8B

在正式实战之前先看一下 XTuner 团队对 Llama 3 8B 的性能测试结果。以下使用不同数量 GPU 全量微调 Llama3 8B 时的训练效率，仅需 2 * A100 80G 即可全量微调 8k 上下文 Llama3 8B。

Llama3 微调性能测试

使用 8 * A100 80G 全量微调不同上下文长度的 Llama3 8B 时的训练效率。

Llama3 微调效率对比

实践教程

Web Demo 部署

本小节将带大家部署 Llama3 Web Demo。

Web Demo 界面

环境配置

conda create -n llama3 python=3.10
conda activate llama3
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia
conda install git
git-lfs install

下载 Llama3 模型

首先通过 OpenXLab 下载 Llama-3-8B-Instruct 这个模型。

mkdir -p ~/model
cd ~/model
git clone https://code.openxlab.org.cn/MrCat/Llama-3-8B-Instruct.git Meta-Llama-3-8B-Instruct

或者软链接本地模型。

ln -s /root/share/new_models/meta-llama/Meta-Llama-3-8B-Instruct ~/model/Meta-Llama-3-8B-Instruct

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .

streamlit run ~/Llama3-XTuner-CN/tools/web_demo.py /path/to/model/Llama-3-8B-Instruct

cd ~/Llama3-XTuner-CN
python tools/gdata.py

import json

# 输入你的名字或者机构
name = 'YourCompany'
# 重复次数
n = 2000

data = [
    {
        "conversation": [
            {
                "system":"你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是 {}，一个由 YourCompany 打造的人工智能助手，请问有什么可以帮助您的吗？".format(name)
            }
        ]
    }
]

for i in range(n):
    data.append(data[0])

with open('data/personal_assistant.json', 'w', encoding='utf-8') as f:
    json.dump(data, f, ensure_ascii=False, indent=4)

[
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是 SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    },
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是 SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    },
    ...
]

cd /root/project/llama3-ft
xtuner train configs/assistant/llama3_8b_instruct_qlora_assistant.py --work-dir /root/llama3_pth

# Adapter PTH 转 HF 格式
xtuner convert pth_to_hf /root/llama3_pth/llama3_8b_instruct_qlora_assistant.py \
/root/llama3_pth/iter_500.pth \
/root/llama3_hf_adapter

# 模型合并
export MKL_SERVICE_FORCE_INTEL=1
xtuner convert merge /root/model/Meta-Llama-3-8B-Instruct \
/root/llama3_hf_adapter \
/root/llama3_hf_merged

streamlit run ~/Llama3-XTuner-CN/tools/web_demo.py /root/llama3_hf_merged

Llama3 微调实践教程（XTuner 版）

Llama 3 概览

2*A100 即可全量微调

8K 上下文 Llama3 8B

实践教程

Web Demo 部署

环境配置

下载 Llama3 模型

更多推荐文章

相关免费在线工具

安装 XTuner

运行 web_demo.py

XTuner 微调 Llama 3 个人小助手认知

自我认知训练数据集准备

XTuner 配置文件准备

训练模型

推理验证

更多推荐文章

相关免费在线工具

Llama3 微调实践教程（XTuner 版）

Llama 3 概览

2*A100 即可全量微调

8K 上下文 Llama3 8B

实践教程

Web Demo 部署

环境配置

下载 Llama3 模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

安装 XTuner

运行 web_demo.py

XTuner 微调 Llama 3 个人小助手认知

自我认知训练数据集准备

XTuner 配置文件准备

训练模型

推理验证

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具