Transformers 库模型推理与微调实战教程 | 极客日志

PythonAI算法

Transformers 库模型推理与微调实战教程

综述由AI生成详细讲解了如何利用 Hugging Face Transformers 库实现大语言模型的推理与微调。内容涵盖环境搭建、AutoModel 推理流程、Pipeline 多任务处理、基于 Trainer 的微调全流程（数据加载、预处理、训练配置、评估）。同时补充了常见网络代理配置、显存优化及训练参数调优建议，适合希望快速落地 NLP 项目的开发者参考。

t ag发布于 2025/2/7更新于 2026/5/3120 浏览

Transformers 库模型推理与微调实战教程

概述

Transformers 是由 Hugging Face 和社区共同维护的开源自然语言处理（NLP）库，广泛应用于机器学习和深度学习领域。它提供了丰富的预训练模型和工具，使得开发者和研究人员能够轻松调用最新的大模型进行推理或针对特定任务进行微调。

在 Hugging Face 官网的模型详情页，点击 "Use this model" 可查看该模型的使用方式，通常包括 Pipeline 和 Directly（直接加载）两种模式。

环境准备

在使用 Transformers 之前，需要安装必要的依赖库。推荐使用 Python 虚拟环境以隔离项目依赖。

# 创建并激活虚拟环境
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安装核心库
pip install transformers datasets accelerate torch

若需使用 GPU 加速，请确保已安装对应版本的 CUDA 驱动及 PyTorch 版本。

使用 AutoModel 类进行推理

Transformers 库中的 AutoClass 系列提供了自动加载预训练模型和分词器的功能，简化了模型的使用过程。我们可以通过 from_pretrained() 方法快速加载所需的模型和分词器。

核心步骤

加载模型：使用 AutoModelForCausalLM 加载因果语言模型。
加载分词器：使用 AutoTokenizer 加载配套的分词器。
构建消息：定义包含系统角色和用户角色的对话列表。
格式化输入：使用 apply_chat_template 将对话格式化为模型可接受的字符串。
生成文本：调用 model.generate 生成回复，可设置最大长度、温度等参数。
解码输出：提取生成的 token 并解码为文本。

代码示例

import os
import time
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# 配置设备
device = "cuda" if torch.cuda.is_available() else "cpu"

# 网络代理配置（国内用户访问 HuggingFace 可能需要）
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"

# ① 加载模型
model = AutoModelForCausalLM.from_pretrained(
    "Qwen/Qwen1.5-0.5B-Chat",
    device_map=,  
    torch_dtype=torch.float16,  
)


tokenizer = AutoTokenizer.from_pretrained()


messages = [
    {: , : },
    {: , : }
]


text = tokenizer.apply_chat_template(
    messages,
    tokenize=,
    add_generation_prompt=
)


model_inputs = tokenizer([text], return_tensors=).to(device)


start_time = time.time()
generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=,
    temperature=,      
    top_p=,            
    do_sample=        
)
end_time = time.time()
()


generated_ids = [
    output_ids[(input_ids):]  input_ids, output_ids  (model_inputs.input_ids, generated_ids)
]


response = tokenizer.batch_decode(generated_ids, skip_special_tokens=)[]
(response)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from huggingface_hub import snapshot_download

snapshot_download(
    repo_id="Qwen/Qwen1.5-0.5B-Chat",
    local_dir="./models/Qwen1.5-0.5B-Chat",
    max_workers=8,
    endpoint="https://hf-mirror.com"
)

from transformers import pipeline

# 初始化生成器
generator = pipeline(model="openai-community/gpt2")

# 单句生成
generator("I can't believe you did such a ", do_sample=False)

# 多序列生成
outputs = generator("My tart needs some", num_return_sequences=4, return_full_text=False)

from transformers import pipeline

classifier = pipeline(model="distilbert/distilbert-base-uncased-finetuned-sst-2-english")
result = classifier("This movie is disgustingly good !")
print(result)  # [{'label': 'POSITIVE', 'score': 0.99...}]

captioner = pipeline(model="ydshieh/vit-gpt2-coco-en", task="image-to-text", device=0)
result = captioner("https://example.com/image.jpg")
print(result)

from datasets import load_dataset

os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"
dataset = load_dataset("yelp_review_full")
print(dataset["train"][0])

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-cased")

def tokenize_function(examples):
    return tokenizer(
        examples["text"],
        padding="max_length",
        truncation=True,
        max_length=128
    )

tokenized_datasets = dataset.map(tokenize_function, batched=True)

# 可选：缩小数据集用于调试
small_train = tokenized_datasets["train"].shuffle(seed=42).select(range(1000))
small_eval = tokenized_datasets["test"].shuffle(seed=42).select(range(1000))

from transformers import AutoModelForSequenceClassification, TrainingArguments

model = AutoModelForSequenceClassification.from_pretrained(
    "google-bert/bert-base-cased",
    num_labels=5  # Yelp 数据集有 5 个类别
)

training_args = TrainingArguments(
    output_dir="./results",
    evaluation_strategy="epoch",
    save_strategy="epoch",
    per_device_train_batch_size=8,
    learning_rate=2e-5,
    num_train_epochs=3,
    weight_decay=0.01,
    logging_steps=10,
    load_best_model_at_end=True,
    metric_for_best_model="accuracy"
)

import numpy as np
import evaluate

metric = evaluate.load("accuracy")

def compute_metrics(eval_pred):
    logits, labels = eval_pred
    predictions = np.argmax(logits, axis=-1)
    return metric.compute(predictions=predictions, references=labels)

from transformers import Trainer

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train,
    eval_dataset=small_eval,
    compute_metrics=compute_metrics,
)

trainer.train()
trainer.save_model("./fine_tuned_model")

Transformers 库模型推理与微调实战教程

Transformers 库模型推理与微调实战教程

概述

环境准备

使用 AutoModel 类进行推理

核心步骤

代码示例

更多推荐文章

相关免费在线工具

优化下载速度

使用 Pipeline 进行推理

1. 文本生成 Pipeline

2. 情感分类 Pipeline

3. 图像描述 Pipeline

模型微调

第一步：准备数据集

第二步：数据集预处理

第三步：配置训练参数

第四步：设置评估函数

第五步：开始训练

常见问题与优化建议

总结

更多推荐文章

相关免费在线工具

Transformers 库模型推理与微调实战教程

Transformers 库模型推理与微调实战教程

概述

环境准备

使用 AutoModel 类进行推理

核心步骤

代码示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

优化下载速度

使用 Pipeline 进行推理

1. 文本生成 Pipeline

2. 情感分类 Pipeline

3. 图像描述 Pipeline

模型微调

第一步：准备数据集

第二步：数据集预处理

第三步：配置训练参数

第四步：设置评估函数

第五步：开始训练

常见问题与优化建议

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具