LLaMA-Factory 模型微调基础教程
LLaMA-Factory 概述
使用 LLaMA-Factory 进行模型微调具有多方面的好处。首先,它简化了大模型微调的过程,使得用户能够轻松进行模型的优化和改进。此外,LLaMA-Factory 支持多种训练方法,如全量调参、LoRA 等,以及不同的对齐方案,如 DPO、PPO 等。这为用户提供了灵活性,可以根据具体需求选择合适的微调策略。
LLaMA-Factory 还提供了一站式服务,从模型微调到量化处理,再到运行,整个过程一气呵成。此外,它支持多种流行的语言模型,如 LLaMA、BLOOM、Mistral、Baichuan 等,涵盖了广泛的应用场景。
在模型量化方面,LLaMA-Factory 能够有效地压缩模型规模,减少模型运行所需的计算量和存储空间,使得模型能够在性能稍弱的设备上也能流畅运行。这不仅提高了模型的可访问性,也降低了运行成本。
此外,LLaMA-Factory 的训练过程中记录的内容比较全面,除了同步输出 loss 曲线图以外,还自带 BLEU 等评测指标,这有助于用户更好地监控和评估模型的性能。
LLaMA-Factory 安装
环境依赖详情
官方建议 Python 版本至少为 3.9,推荐 3.10。
依赖安装
- 进入 LLaMA-Factory 目录后执行以下命令:
pip install -r requirements.txt
- 执行完整依赖安装:
pip install -e ".[torch,metrics]"
CUDA 安装
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia
记得输入 y 继续安装。
量化 BitsAndBytes 安装
如果要在 Windows 平台上开启量化 LoRA(QLoRA),需要安装预编译的 bitsandbytes 库。支持 CUDA 11.1 到 12.2,请根据您的 CUDA 版本情况选择适合的发布版本。
pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl
可视化微调启动
- 启动命令:
llamafactory-cli webui
- 如果出现无法访问 localhost 的错误,可能需要修改
interface.py代码中的share参数。 - 找到
run_web_ui()和run_web_demo()方法,将share=gradio_share修改为share=True。 - 再次运行即可成功。注意此时不要使用代理工具,否则界面可能加载不出来。
数据集准备
所需工具下载
使用数据导出工具进行聊天记录解析。例如可以使用 MemoTrace 或其他类似工具(如 finetune_dataset_maker)。
使用教程
- 点击导出数据,按照步骤操作。
- 解压后找到可执行文件双击执行。
- 登录账号,在工具中点击解析数据。
- 选择 AI 对话 txt 和 json 格式按需导出。
- 仅勾选文本数据以获取纯文本内容。
- 记录导出目录路径。
- 导出完毕后,相对路径文件夹下会有生成的数据文件。


