Llama 3 模型微调实战指南：基于 XTuner 的 QLoRA 方法

Llama 3 模型微调实战指南：基于 XTuner 的 QLoRA 方法 | 极客日志

conda create -n llama3 python=3.10
conda activate llama3
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

conda install git
git-lfs install

mkdir -p ~/model
cd ~/model
git clone https://code.openxlab.org.cn/MrCat/Llama-3-8B-Instruct.git Meta-Llama-3-8B-Instruct

ln -s /root/share/new_models/meta-llama/Meta-Llama-3-8B-Instruct \
    ~/model/Meta-Llama-3-8B-Instruct

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .

import json

# 输入你的名字或者机构名称
name = '您的团队名称'
n = 2000

data = [
    {
        "conversation": [
            {
                "system":"你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是 {}，一个由 {} 打造的人工智能助手，请问有什么可以帮助您的吗？".format(name, name)
            }
        ]
    }
]

for i in range(n):
    data.append(data[0])

with open('data/personal_assistant.json', 'w', encoding='utf-8') as f:
    json.dump(data, f, ensure_ascii=False, indent=4)

cd /root/project/llama3-ft
xtuner train configs/assistant/llama3_8b_instruct_qlora_assistant.py --work-dir /root/llama3_pth

xtuner convert pth_to_hf /root/llama3_pth/llama3_8b_instruct_qlora_assistant.py \
  /root/llama3_pth/iter_500.pth \
  /root/llama3_hf_adapter

export MKL_SERVICE_FORCE_INTEL=1
xtuner convert merge /root/model/Meta-Llama-3-8B-Instruct \
  /root/llama3_hf_adapter \
  /root/llama3_hf_merged

streamlit run ~/Llama3-XTuner-CN/tools/internstudio_web_demo.py \
  /root/llama3_hf_merged

Llama 3 模型微调实战指南：基于 XTuner 的 QLoRA 方法

Llama 3 模型微调实战指南

1. Llama 3 概览

2. 硬件与环境要求

2.1 硬件建议

2.2 环境配置

3. 模型下载与准备

4. 安装 XTuner

5. 数据集准备

6. 配置文件详解

7. 开始训练

8. 推理验证

9. 常见问题与调优

10. 总结

更多推荐文章

相关免费在线工具

Llama 3 模型微调实战指南：基于 XTuner 的 QLoRA 方法

Llama 3 模型微调实战指南

1. Llama 3 概览

2. 硬件与环境要求

2.1 硬件建议

2.2 环境配置

3. 模型下载与准备

4. 安装 XTuner

5. 数据集准备

6. 配置文件详解

7. 开始训练

8. 推理验证

9. 常见问题与调优

10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具