简单几步微调 Llama 3 大模型 | 极客日志

PythonAI算法

简单几步微调 Llama 3 大模型

基于 Google Colab 免费算力微调 Llama 3 大模型的完整流程。通过配置 Python 环境、加载预训练模型、准备指令数据集，利用 LoRA 技术进行高效微调。最终保存适配器权重并验证推理效果，实现私有化 AI 智能体的构建。

PentesterX发布于 2025/2/7更新于 2026/5/3117 浏览

简单几步微调 Llama 3 大模型

本文介绍如何基于 Google Colab 免费算力，快速完成 Llama 3 大模型的微调。通过配置 Python 环境、加载预训练模型、准备指令数据集，利用 LoRA 技术进行高效微调，最终保存适配器权重并验证推理效果，实现私有化 AI 智能体的构建。

1. 环境准备

首先请准备好 Google 账号和网络环境。本示例基于 Google Colab 的免费 GPU 算力完成。

打开 Colab 链接后，点击 Copy to Drive 将笔记本复制到您的云端硬盘。在弹出的新窗口中，依次运行代码单元格。

安装基础依赖

!pip install transformers peft accelerate bitsandbytes torch datasets trl

等待安装完成后，左侧会出现绿色勾号表示成功。

2. 加载模型与数据

加载 Llama 3 模型

使用 Hugging Face Transformers 库加载 Llama 3 8B Instruct 版本。默认配置下无需修改即可执行。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto",
    use_cache=True
)

准备训练数据集

微调需要指令 - 响应格式的数据。可以使用 JSONL 或 CSV 格式。以下是一个简单的数据集结构示例：

{
  "instruction": "请生成斐波那契数列的前 10 项。",
  "input": "",
  "output": "0, 1, 1, 2, 3, 5, 8, 13, 21, 34"
}

在 Colab 中加载本地或云端的数据集文件。

from datasets import load_dataset

dataset = load_dataset("json", data_files="train.json", split="train")

3. 配置 LoRA 微调参数

LoRA (Low-Rank Adaptation) 是一种高效的微调方法，只需更新少量参数即可适配特定任务。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from peft import LoraConfig, get_peft_model

lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

model = get_peft_model(model, lora_config)
model.print_trainable_parameters()

from trl import SFTTrainer
from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./results",
    per_device_train_batch_size=4,
    gradient_accumulation_steps=4,
    learning_rate=2e-4,
    num_train_epochs=3,
    fp16=True,
    logging_steps=10,
    save_strategy="epoch",
    optim="paged_adamw_8bit"
)

trainer = SFTTrainer(
    model=model,
    train_dataset=dataset,
    tokenizer=tokenizer,
    args=training_args,
    max_seq_length=512,
    packing=False,
)

trainer.train()

model.save_pretrained("./lora_model")
tokenizer.save_pretrained("./lora_model")

from peft import PeftModel

base_model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto"
)
lora_model = PeftModel.from_pretrained(base_model, "./lora_model")

prompt = "请解释什么是人工智能？"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = lora_model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

简单几步微调 Llama 3 大模型

简单几步微调 Llama 3 大模型

1. 环境准备

安装基础依赖

2. 加载模型与数据

加载 Llama 3 模型

准备训练数据集

3. 配置 LoRA 微调参数

更多推荐文章

相关免费在线工具

4. 开始训练

5. 保存与测试模型

保存 LoRA 权重

加载并推理

6. 总结

更多推荐文章

相关免费在线工具

简单几步微调 Llama 3 大模型

简单几步微调 Llama 3 大模型

1. 环境准备

安装基础依赖

2. 加载模型与数据

加载 Llama 3 模型

准备训练数据集

3. 配置 LoRA 微调参数

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 开始训练

5. 保存与测试模型

保存 LoRA 权重

加载并推理

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具