大模型微调技术深度解析与实践

训练方式	Full 全参数微调	LoRA	4bit-QLoRa
占用 (6B 模型)	68450 MB	15226 MB	8422 MB

大模型微调技术深度解析与实践 | 极客日志

PYTHONPATH=../../.. \
CUDA_VISIBLE_DEVICES=0 \
python llm_sft.py \
    --model_id_or_path 01ai/Yi-6B \
    --model_revision master \
    --sft_type lora \
    --tuner_backend swift \
    --template_type default-generation \
    --dtype fp16 \
    --output_dir output \
    --train_dataset_sample -1 \
    --num_train_epochs 5 \
    --max_length 2048 \
    --max_new_tokens 2048 \
    --check_dataset_strategy warning \
    --lora_rank 8 \
    --lora_alpha 32 \
    --lora_dropout_p 0.05 \
    --lora_target_modules ALL \
    --gradient_checkpointing true \
    --batch_size 1 \
    --weight_decay 0.01 \
    --learning_rate 1e-4 \
    --gradient_accumulation_steps 16 \
    --max_grad_norm 0.5 \
    --warmup_ratio 0.03 \
    --eval_steps 100 \
    --save_steps 100 \
    --save_total_limit 2 \
    --logging_steps 10 \
    --quantization_bit 4 \
    --bnb_4bit_comp_dtype fp16 \
    --custom_train_dataset_path /root/train.jsonl \
    --custom_val_dataset_path /root/train_eval.jsonl

{"query": "11111", "response": "22222"}
{"query": "aaaaa", "response": "bbbbb"}
{"query": "AAAAA", "response": "BBBBB"}

{
  "chartType": "CHART_LINE",
  "chartFields": {
    "dimensions": ["时间"],
    "metrics": ["利润率"]
  },
  "chartTimeFilter": {
    "granularity": "day",
    "dayjsScript": ["subtract", 6, "months"]
  },
  "dimensionFilters": [
    {
      "field": "时间",
      "values": [
        "2022-01-01",
        "2022-01-02",
        "2022-01-03"
      ]
    }
  ],
  "metricFilters": [],
  "mainAxis": "时间"
}

{
  "chartType": "CHART_LINE",
  "chartView": {
    "dimensions": [
      {
        "name": "时间"
      }
    ],
    "metrics": [
      {
        "name": "利润率"
      }
    ]
  },
  "mainAxis": "时间",
  "chartTimeFilter": {
    "granularity": "month",
    "dayjsScript": ["dayjs().subtract(6, 'month').startOf('month')", "dayjs().subtract(0, 'month').endOf('month')"]
  }
}

大模型微调技术深度解析与实践

背景

什么是预训练？

预训练适合什么场景？

什么是微调？

我能用微调定制什么？

可以使用微调来让大模型新增知识吗？

微调方式

微调训练框架的选择

数据准备最佳实践

数据可视化场景的微调

添加示例的限制

使用微调解决

训练数据怎么来？

训练超参数调优指南

常见问题与解决方案

部署与推理优化

总结

更多推荐文章

相关免费在线工具

大模型微调技术深度解析与实践

背景

什么是预训练？

预训练适合什么场景？

什么是微调？

我能用微调定制什么？

可以使用微调来让大模型新增知识吗？

微调方式

微调训练框架的选择

数据准备最佳实践

数据可视化场景的微调

添加示例的限制

使用微调解决

训练数据怎么来？

训练超参数调优指南

常见问题与解决方案

部署与推理优化

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具