Llama3 微调入门实战指南：从零构建专属大模型

Llama3 微调入门实战指南：从零构建专属大模型 | 极客日志

conda create -n llama3_ft python=3.9
conda activate llama3_ft

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install transformers datasets accelerate peft bitsandbytes trl

{"instruction": "请解释什么是深度学习", "input": "", "output": "深度学习是机器学习的一个子集..."}
{"instruction": "写一首关于春天的诗", "input": "", "output": "春风拂面柳丝长..."}

from datasets import load_dataset

# 假设数据存储在 data.jsonl 文件中
dataset = load_dataset("json", data_files="data.jsonl")

# 检查数据分布
print(dataset["train"][0])

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True,
)

model = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Meta-Llama-3-8B-Instruct",
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B-Instruct")
tokenizer.pad_token = tokenizer.eos_token

from peft import LoraConfig, get_peft_model

lora_config = LoraConfig(
    r=16,  # 秩
    lora_alpha=32,
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

model = get_peft_model(model, lora_config)
model.print_trainable_parameters()

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./results",
    per_device_train_batch_size=4,
    gradient_accumulation_steps=4,
    learning_rate=2e-4,
    num_train_epochs=3,
    fp16=False,
    logging_steps=10,
    save_strategy="epoch",
    optim="paged_adamw_8bit",
)

from trl import SFTTrainer

trainer = SFTTrainer(
    model=model,
    train_dataset=dataset["train"],
    dataset_text_field="text",  # 需自定义文本拼接逻辑
    max_seq_length=512,
    tokenizer=tokenizer,
    args=training_args,
)

trainer.train()

model.save_pretrained("./lora_weights")

from peft import PeftModel

base_model = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Meta-Llama-3-8B-Instruct",
    low_cpu_mem_usage=True,
    return_dict=True,
    torch_dtype=torch.float16,
    device_map="auto",
)

merged_model = PeftModel.from_pretrained(base_model, "./lora_weights")
merged_model.save_pretrained("./merged_model")

messages = [
    {"role": "user", "content": "你好，请介绍一下你自己"}
]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(**model_inputs, max_new_tokens=512)
response = tokenizer.batch_decode(generated_ids)[0]
print(response)

Llama3 微调入门实战指南：从零构建专属大模型

Llama3 微调入门实战指南

1. 背景与概述

2. 环境准备

2.1 硬件要求

2.2 软件依赖

3. 数据集构建

3.1 数据格式示例

3.2 数据预处理脚本

4. 模型加载与配置

4.1 加载基座模型

4.2 配置 LoRA

5. 训练流程

5.1 定义训练参数

5.2 启动训练

6. 模型保存与导出

6.1 保存适配器

6.2 合并权重（可选）

7. 推理与部署

7.1 简单推理示例

8. 总结

更多推荐文章

相关免费在线工具

Llama3 微调入门实战指南：从零构建专属大模型

Llama3 微调入门实战指南

1. 背景与概述

2. 环境准备

2.1 硬件要求

2.2 软件依赖

3. 数据集构建

3.1 数据格式示例

3.2 数据预处理脚本

4. 模型加载与配置

4.1 加载基座模型

4.2 配置 LoRA

5. 训练流程

5.1 定义训练参数

5.2 启动训练

6. 模型保存与导出

6.1 保存适配器

6.2 合并权重（可选）

7. 推理与部署

7.1 简单推理示例

8. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具