LLaMa-Factory 开源大模型微调与部署实战

开源大模型微调和部署

开源大模型虽然带有'开源'二字，但与传统软件有所不同。它通常公开模型权重和架构，比如 LLaMA、Qwen 等，能处理自然语言或多模态任务。不过，训练代码和数据往往不公开，这让它更像是一个'免费使用的黑盒'，而非完全透明的白盒。

接下来我们聚焦于如何实操，这里推荐一个高效工具——LLaMA-Factory。它主打轻量与高效，核心目标就是降低微调门槛。通过它，你可以在无需编写复杂代码的前提下，在本地完成上百种预训练模型的微调，支持命令行和 WebUI 交互。

安装环境

如果你选择源码安装，建议先确保 CUDA 环境就绪：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]" --no-build-isolation

或者直接使用 Docker 镜像，里面已经预置好了环境：

docker run -it --rm --gpus=all --ipc=host hiyouga/llamafactory:latest

数据集准备

数据格式是微调的关键。LLaMA-Factory 支持 Alpaca 和 ShareGPT 两种主流格式。你需要在 dataset_info.json 中定义好数据集的列映射。

Alpaca 格式适用于大多数指令微调任务。例如多模态数据，需要在 JSON 中包含图像路径：

[{"instruction":"人类指令","input":"人类输入","output":"模型回答","images":["图像路径"]}]

配置描述如下：

"dataset_name": {"file_name": "data.json", "columns": {

开源大模型微调和部署

安装环境

如果你选择源码安装，建议先确保 CUDA 环境就绪：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]" --no-build-isolation

或者直接使用 Docker 镜像，里面已经预置好了环境：

docker run -it --rm --gpus=all --ipc=host hiyouga/llamafactory:latest

数据集准备

数据格式是微调的关键。LLaMA-Factory 支持 Alpaca 和 ShareGPT 两种主流格式。你需要在 dataset_info.json 中定义好数据集的列映射。

Alpaca 格式适用于大多数指令微调任务。例如多模态数据，需要在 JSON 中包含图像路径：

[{"instruction":"人类指令","input":"人类输入","output":"模型回答","images":["图像路径"]}]

配置描述如下：

"dataset_name": {"file_name": "data.json", "columns": {

参数	说明
model_name_or_path	基座模型名称或路径
stage	训练阶段：rm, pt, sft, PPO, DPO 等
finetuning_type	微调方式：freeze, lora, full
output_dir	输出目录
per_device_train_batch_size	批次大小
learning_rate	学习率

LLaMa-Factory 开源大模型微调与部署实战

开源大模型微调和部署

安装环境

数据集准备

LLaMa-Factory 开源大模型微调与部署实战

开源大模型微调和部署

安装环境

数据集准备

更多推荐文章

相关免费在线工具

开始训练

合并与量化

推理与部署

更多推荐文章

相关免费在线工具

LLaMa-Factory 开源大模型微调与部署实战

开源大模型微调和部署

安装环境

数据集准备

LLaMa-Factory 开源大模型微调与部署实战

开源大模型微调和部署

安装环境

数据集准备

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

开始训练

合并与量化

推理与部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具