llama-factory 是一个零代码大模型训练平台,可以快速搭建模型训练环境,并提供丰富的模型训练功能。建议通过命令行下载项目压缩包或克隆仓库。
依赖安装
使用框架自带的 requirements.txt 下载安装相关依赖,完全匹配当前分支的依赖版本,避免手动指定版本出错。
安装完成后,可以执行 llamafactory-cli version 来快速校验安装是否成功。如果显示版本信息,则安装成功。随后执行运行 webui.py 的代码即可启动 Web UI 界面。
模型选择逻辑
当你选择大模型时,会发现有很多版本。模型名称中的后缀(Chat/Math/Base)代表不同的模型定位和用途。针对'微调大模型'的需求,选择逻辑如下:
- Base: 基座模型,适合继续预训练或作为其他任务的起点。
- Chat: 对话模型,经过指令微调,适合对话场景。
- Math: 数学模型,针对数学推理任务优化。
常见问题与排查
1. 路径与执行目录问题
执行 llamafactory 核心依赖时,必须在 llamafactory 的根目录下执行,否则会报错。
问题原因:不是路径本身的问题,也不是虚拟环境存储路径的问题,而是执行 pip install -e ".[torch,metrics]" 时,当前目录不是 LlamaFactory 的代码根目录。这条命令必须在包含 setup.py/pyproject.toml 的 LlamaFactory 文件夹内执行,否则 pip 找不到安装配置文件。
示例路径:D:\software\liulanqi\weitiao\llamafactory\warehouse\LLaMA-Factory(进入这个文件夹,能看到 setup.py、webui.py、requirements.txt 等文件,即为正确目录)。
核心逻辑差异:
pip install torch:安装公共库。pip install -e ".[torch,metrics]":安装当前目录下的本地项目(LlamaFactory 这个开源项目),核心依赖当前目录的配置文件。
2. 编译环境缺失错误
安装 numpy 时可能触发编译环境缺失错误,原因是 Windows 系统缺少 C/C++ 编译器(比如 Visual Studio 的编译工具),导致 numpy 无法从源码编译安装。需安装相应的编译工具链。
3. 依赖版本冲突
安装可选依赖时,可能会遇到版本冲突报错。例如安装 bitsandbytes 时,pip 自动将 torch 版本升级到了 2.9.1,但原来的 torchaudio 和 torchvision 是依赖 torch==2.1.0+cu121 的,新版本 torch 2.9.1 和它们不兼容。
4. 库版本不兼容
校验安装时出现报错,可能是 transformers 库版本与 torch 版本不兼容导致的。因为 transformers 新版本用到了 torch.utils._pytree.register_pytree_node,但当前 torch 2.1.0 中这个接口还没开放(或命名不同)。
原因分析:

