大模型训练：LLaMA-Factory 快速上手

大模型训练使用 LLaMA-Factory 工具可简化流程。首先通过 Conda 创建虚拟环境并安装 PyTorch 及依赖库；其次准备 Alpaca 格式的 JSON 数据集存放于 data 目录；最后配置 Accelerate 的 YAML 参数，利用多 GPU 资源执行 LoRA 微调命令。该方案适用于显存≥24GB 的 GPU 环境，支持 Qwen 等模型的高效微调。

未来可期发布于 2026/4/9更新于 2026/5/2419 浏览

第 1 步：安装环境

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
# 推荐使用 conda
conda create -n llama-factory python=3.10
conda activate llama-factory
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
pip install -e ".[torch,metrics]"

⚠️ 注意：推荐使用 CUDA 环境，GPU 显存建议 ≥24GB（如 3090/4090）

第 2 步：准备数据

支持多种格式，最常用的是 Alpaca 格式 JSON 文件：

[{"instruction":"写一首关于春天的诗","input":"","output":"春风拂面花自开，柳绿桃红映山川..."},{"instruction":"解释什么是机器学习","input":"","output":"机器学习是让计算机从数据中自动学习规律的技术..."}]

📌 存为 my_data.json，放在 data/ 目录下。

第 3 步：启动训练 - 多 GPU（以 LoRA 微调为例）

参考 examples/accelerate 下面的文件，准备自己的 yaml 文件。

compute_environment: LOCAL_MACHINE
debug: false
 
 
 
 
 
 
 
 
 
 
 []

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

#!/bin/bash
CUDA_VISIBLE_DEVICES=4,5,6,7 accelerate launch --config_file config.yaml ../src/train.py \\
  --stage sft \\
  --do_train True \\
  --template qwen3 \\
  --finetuning_type lora \\
  --model_name_or_path ../Qwen/Qwen3-0.6B \\
  --dataset_dir ./vehicle_control_dataset \\
  --dataset my_data \\
  --output_dir ./saves \\
  --overwrite_cache \\
  --overwrite_output_dir \\
  --cutoff_len 1024 \\
  --per_device_train_batch_size 1 \\
  --per_device_eval_batch_size 1 \\
  --gradient_accumulation_steps 8 \\
  --lr_scheduler_type cosine \\
  --max_grad_norm 1.0 \\
  --logging_steps 10 \\
  --save_steps 200 \\
  --warmup_steps 0 \\
  --learning_rate 5e-5 \\
  --num_train_epochs 3.0 \\
  --max_samples 100000 \\
  --fp16 True \\
  --lora_rank 8 \\
  --lora_dropout 0.1 \\
  --lora_target all \\
  --plot_loss True

大模型训练：LLaMA-Factory 快速上手

第 1 步：安装环境

第 2 步：准备数据

第 3 步：启动训练 - 多 GPU（以 LoRA 微调为例）

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

大模型训练：LLaMA-Factory 快速上手

第 1 步：安装环境

第 2 步：准备数据

第 3 步：启动训练 - 多 GPU（以 LoRA 微调为例）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具