大语言模型（LLM）基本概念与工作原理详解 | 极客日志

大语言模型（LLM）基本概念与工作原理详解 | 极客日志

from transformers import AutoModel, AutoTokenizer
import torch

# 加载预训练模型和分词器
model_name = "bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

# 对文本进行分词处理
text = "Hello, my name is Kimi."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

# 模型推理
with torch.no_grad():
    outputs = model(**inputs)
    last_hidden_state = outputs.last_hidden_state

print(last_hidden_state.shape)