一、LLaMA-Factory 的部署
参考官方文档或相关教程完成工程安装步骤,整个过程较为流畅。
二、LLaMA-Factory 的配置文件介绍
以 examples/qwen2_5vl_lora_sft.yaml 为切入点,查看训练自己模型时需要关注的内容。该文件中配置了大模型训练过程中所有的参数,包括:model(模型的选择与配置)、method(训练方式)、dataset(数据集)、output(训练时输出信息)、train(训练参数)。
现阶段要跑通工程需要关注的有:model、dataset。
1. Model 模型的设置
在 examples/qwen2_5vl_lora_sft.yaml 中的 model_name_or_path 设置为自己微调的大模型名称。工程会自动从 HuggingFace 中拉取模型,但这种方式不建议,网络限制和不稳定等原因会让下载过程很不稳定。建议设置为已经下载到本地大模型的绝对路径。该方式需要提前将大模型下载下来对应文件。
2. Dataset 数据集的关联
在 data/dataset_info.json 中配置数据集信息。这两个文件中,设置的变量命名是有对应性的。相同颜色的框内的变量命名一定要是一致的。
data/mllm_demo.json
最小单元内容如下:
{"messages": [{"role": "user", "content": "..."}, {"role": "assistant", "content": "..."}], "images": ["path/to/image.jpg"]}
data/dataset_info.json
{
"mllm_demo"


