多模态 Llama-3 模型微调实战教程

多模态 Llama-3 模型微调实战教程 | 极客日志

conda create -n llama3 python=3.10
conda activate llama3
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .

cd ~
git lfs install
git clone https://code.openxlab.org.cn/MrCat/Llama-3-8B-Instruct.git Meta-Llama-3-8B-Instruct

cd ~
ln -s /root/new_models/openai/clip-vit-large-patch14-336 .
# 若无特定路径，可直接从 HuggingFace 下载

cd ~
git clone https://github.com/InternLM/tutorial -b camp2
python ~/tutorial/xtuner/llava/llava_data/repeat.py \
  -i ~/tutorial/xtuner/llava/llava_data/unique_data.json \
  -o ~/tutorial/xtuner/llava/llava_data/repeated_data.json \
  -n 200

cd ~
git clone https://github.com/SmartFlowAI/Llama3-XTuner-CN
mkdir -p ~/project/llama3-ft
cd ~/project/llama3-ft
xtuner train ~/Llama3-XTuner-CN/configs/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py --work_dir ~/project/llama3-ft/llava --deepspeed deepspeed_zero2

# 转换 Pretrain 阶段权重
xtuner convert pth_to_hf ~/Llama3-XTuner-CN/configs/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py \
  ~/llama3-llava-iter_2181.pth \
  ~/project/llama3-ft/llava/pretrain_iter_2181_hf

# 转换 Finetune 后权重
xtuner convert pth_to_hf ~/Llama3-XTuner-CN/configs/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py \
  ~/project/llama3-ft/llava/iter_1200.pth \
  ~/project/llama3-ft/llava/finetune_iter_1200_hf

xtuner chat ~/Meta-Llama-3-8B-Instruct \
  --visual-encoder ~/clip-vit-large-patch14-336 \
  --llava ~/project/llama3-ft/llava/finetune_iter_1200_hf \
  --prompt-template llama3_chat \
  --image ~/tutorial/xtuner/llava/llava_data/test_img/oph.jpg

多模态 Llama-3 模型微调实战教程

多模态 Llama-3 模型微调实战教程

1. 背景介绍

2. 环境与模型准备

2.1 配置基础环境

2.2 模型权重准备

2.2.1 准备 Llama3 权重

2.2.2 准备 Visual Encoder 权重

2.2.3 准备 Image Projector 权重

2.3 数据准备

3. 微调过程详解

3.1 配置文件说明

3.2 启动训练

3.3 模型转换

4. 效果体验与推理

4.1 命令行推理

4.2 结果对比

5. 常见问题与优化建议

5.1 显存不足

5.2 训练效果不佳

5.3 部署建议

6. 总结

更多推荐文章

相关免费在线工具

多模态 Llama-3 模型微调实战教程

多模态 Llama-3 模型微调实战教程

1. 背景介绍

2. 环境与模型准备

2.1 配置基础环境

2.2 模型权重准备

2.2.1 准备 Llama3 权重

2.2.2 准备 Visual Encoder 权重

2.2.3 准备 Image Projector 权重

2.3 数据准备

3. 微调过程详解

3.1 配置文件说明

3.2 启动训练

3.3 模型转换

4. 效果体验与推理

4.1 命令行推理

4.2 结果对比

5. 常见问题与优化建议

5.1 显存不足

5.2 训练效果不佳

5.3 部署建议

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具