LLaMA-Factory 模型微调基础教程
LLaMA-Factory 概述
使用 LLaMA-Factory 进行模型微调具有多方面的好处。首先,它简化了大模型微调的过程,使得即使是没有深厚技术功底的用户也能轻松进行模型的优化和改进。此外,LLaMA-Factory 支持多种训练方法,如全量调参、LoRA 等,以及不同的对齐方案,如 DPO、PPO 等。这为用户提供了灵活性,可以根据具体需求选择合适的微调策略。
LLaMA-Factory 还提供了一站式服务,从模型微调到量化处理,再到运行,整个过程一气呵成,无需在不同的工具和流程之间来回切换。此外,它支持多种流行的语言模型,如 LLaMA、BLOOM、Mistral、Baichuan 等,涵盖了广泛的应用场景。
在模型量化方面,LLaMA-Factory 能够有效地压缩模型规模,减少模型运行所需的计算量和存储空间,使得模型能够在性能稍弱的设备上也能流畅运行。这不仅提高了模型的可访问性,也降低了运行成本。
此外,LLaMA-Factory 的训练过程中记录的内容比较全面,除了同步输出 loss 曲线图以外,还自带 BLEU 等评测指标,这有助于用户更好地监控和评估模型的性能。
LLaMA-Factory 下载
GitHub: LLaMA-Factory
- 进到 LLaMA-Factory 后点击 code 下载就行,建议下载 zip 包。
- 解压完成之后记录一下解压路径。
Anaconda 环境创建
软硬件依赖详情
- 创建虚拟环境:官方给出的是 python 至少 3.9,推荐 3.10。
- 打开终端。
- 导航到刚才解压的地址。
LLaMA-Factory 依赖安装
- 依赖下载:
pip install -r requirements.txt - 最好都执行一遍:
pip install -e ".[torch,metrics]"
CUDA 安装
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia
记得输入 y 继续安装。
量化 BitsAndBytes 安装
如果要在 Windows 平台上开启量化 LoRA(QLoRA),需要安装预编译的 bitsandbytes 库。支持 CUDA11.1 到 12.2,请根据您的 CUDA 版本情况选择适合的发布版本。
pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl
可视化微调启动
- 启动命令:
llamafactory-cli webui - 如果出现无法访问 localhost 的错误,说明 Gradio share 为 false。我们需要更改
interface.py代码。 - 找到
interface.py存在路径,通常在LLaMA-Factory-main\src\llamafactory\webui。 - 找到
run_web_ui()和run_web_demo()方法,把share=gradio_share修改成share=True。 - 然后再次运行即可成功。
数据集准备
所需工具下载
使用数据提取工具导出聊天记录。例如可以使用微信风格化工具或其他类似工具(如 finetune_dataset_maker)。
参考论文:


