LLaMA Factory 微调 Llama3 模型实战指南
LLaMA Factory 是一款开源低代码大模型微调框架,集成了业界广泛使用的微调技术,支持通过 Web UI 界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架之一。
环境准备
硬件推荐
建议使用显存 24GB 及以上的 GPU(如 A10),以确保微调过程流畅运行。
镜像选择
推荐使用 DSW 官方镜像:modelscope:1.14.0-pytorch2.1.2-gpu-py310-cu121-ubuntu22.04。
安装 LLaMA Factory
首先拉取项目源码:
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
然后安装依赖环境:
pip uninstall -y vllm
pip install llamafactory[metrics]==0.7.1
pip install accelerate==0.30.1
安装完成后,可通过以下命令检查版本:
llamafactory-cli version
数据集准备
LLaMA-Factory 内置了丰富的数据集,位于 data 目录下。用户也可以准备自定义数据集,将数据处理为框架特定的格式放入 data 下,并修改 dataset_info.json 文件。
Alpaca 格式
标准的数据结构如下:
[
{
"instruction": "人类指令(必填)",
"input": "人类输入(选填)",
"output": "模型回答(必填)",
"system": "系统提示词(选填)",
"history": [
["第一轮指令(选填)", "第一轮回答(选填)"],
[


