跳到主要内容Python 类型注解详解:AI 大模型开发实战 | 极客日志PythonAI算法
Python 类型注解详解:AI 大模型开发实战
系统讲解 Python 类型注解的基础与高级用法,涵盖变量、容器、函数参数及返回值、联合类型、生成器、TypedDict 等核心知识点。重点阐述类型注解在 FastAPI、LangChain 等大模型开发框架中的必要性,通过实际代码示例展示如何提升代码可读性、协作规范及静态检查能力,并介绍 mypy 工具的使用,旨在帮助开发者构建更稳健的 AI 工程化项目。
云间运维26 浏览 前言
在 FastAPI、LangChain、LlamaIndex、RAG、大模型服务端 开发中,类型注解(Type Hints) 已经不是可选语法,而是:
- 代码可读性基础
- 多人协作规范
- 静态检查(mypy)依据
- 自动生成 API 文档的核心
- 避免 80% 运行时错误的保障
一、类型注解基础
1.1 什么是类型注解?
类型注解是 Python 3.5+ 引入的静态类型标记,用于:
- 标记变量类型
- 标记函数参数类型
- 标记函数返回值类型
特点:
- 不影响程序运行
- 仅用于提示、检查、文档
- 被 IDE / mypy / 框架识别
1.2 为什么大模型开发必须学?
- 函数参数极多(prompt、temperature、stream、tools…)
- 数据结构复杂(Document、Embedding、Message…)
- 嵌套深、逻辑复杂,无类型完全无法维护
- FastAPI / LangChain 强制依赖类型注解
二、变量类型注解(完整)
2.1 基础类型
name: str = "大模型开发者"
age: int = 25
score: float = 98.5
is_active: bool = True
nothing: None = None
2.2 只声明不赋值
prompt: str
temperature: float
max_tokens: int
stream: bool
2.3 常量注解 Final
from typing import Final
API_KEY: Final[str] = "sk-xxxxxx"
MODEL_NAME: Final[str] = "gpt-3.5-turbo"
三、容器类型注解(list / dict / tuple / set)
Python 3.9+ 内置支持,无需从 typing 导入 List/Dict。
3.1 list 列表
ids: list[int] = [1001, 1002, 1003]
prompts: list[str] = ["介绍 AI", "写 Python 代码"]
embedding: list[float] = [0.12, 0.35, 0.66, 0.92]
matrix: list[list[float]] = [[1.0, 2.0], [3.0, 4.0]]
3.2 dict 字典
config: dict[str, str] = {"model": "gpt-3.5", "version": "v1"}
model_kwargs: dict[str, int | float | bool] = {"temperature": 0.7, "max_tokens": 1024, "stream": True}
3.3 tuple 元组
user: tuple[int, str] = (1001, "AI 用户")
numbers: tuple[int, ...] = (1, 2, 3, 4, 5)
message: tuple[str, str, bool] = ("user", "你好", True)
3.4 set 集合
unique_ids: set[int] = {101, 102, 103}
vocab: set[str] = {"AI", "大模型", "RAG"}
四、函数类型注解(最高频、最重要)
4.1 函数参数注解
def generate_response(
prompt: str,
temperature: float,
max_tokens: int,
stream: bool
) -> str:
return f"生成结果:{prompt}"
4.2 返回值注解 -> 类型
def get_embedding(text: str) -> list[float]:
return [0.1, 0.2, 0.3]
4.3 无返回值 -> None
def log_info(message: str) -> None:
print(f"[日志] {message}")
4.4 默认参数注解
def chat(
prompt: str,
model: str = "gpt-3.5-turbo",
temperature: float = 0.7
) -> str:
...
4.5 可变参数 *args **kwargs
def call_llm(*args: str, **kwargs: int | float) -> str:
...
五、联合类型 | Union(多种可能类型)
5.1 Python 3.10+ 简洁写法(推荐)
user_id: int | str = 1001
score: float | None = None
5.2 旧版写法(兼容低版本)
from typing import Union
user_id: Union[int, str] = 1001
六、可选类型 Optional(等于 X | None)
from typing import Optional
system_prompt: Optional[str] = None
api_key: Optional[str] = None
七、Any 类型(任意类型)
from typing import Any
data: Any = "字符串"
data: Any = 123
data: Any = [1, 2, 3]
⚠️ 工程规范:尽量不要用 Any,会完全失去类型安全意义。
八、迭代器与生成器类型(大模型流式输出必学)
8.1 Iterator 迭代器
from typing import Iterator
def count_to_5() -> Iterator[int]:
for i in range(5):
yield i
8.2 Generator 生成器(流式输出标准)
Generator[产出类型,发送类型,返回类型]
from typing import Generator
def llm_stream() -> Generator[str, None, None]:
yield "我"
yield "是"
yield "AI"
yield "大模型"
ChatGPT、文心、通义千问流式返回都用这个类型。
九、Callable 函数类型(回调函数)
Callable[[参数类型...], 返回值类型]
from typing import Callable
CallbackFunc = Callable[[str], bool]
def process_result(result: str, callback: CallbackFunc) -> None:
callback(result)
十、Type Alias 类型别名(工程化必备)
Embedding = list[float]
Document = dict[str, str | Embedding]
MessageList = list[dict[str, str]]
emb: Embedding = [0.1, 0.2, 0.3]
doc: Document = {"content": "你好", "embedding": emb}
十一、Literal 字面量类型(大模型配置神器)
from typing import Literal
ModelType = Literal["gpt-3.5", "gpt-4", "qwen", "ernie"]
Device = Literal["cpu", "cuda", "mps"]
def run_llm(model: ModelType, device: Device = "cpu") -> None:
...
十二、TypedDict 结构化字典(AI 项目核心)
- 大模型请求/返回体
- RAG 文档结构
- 对话消息格式
from typing import TypedDict
class ChatMessage(TypedDict):
role: str
content: str
name: Optional[str]
msg: ChatMessage = {"role": "user", "content": "你好"}
可选字段 TypedDict
class LLMConfig(TypedDict, total=False):
model: str
temperature: float
max_tokens: int
十三、Class 类与对象注解
13.1 实例属性注解
class LLMModel:
model_name: str
temperature: float
def __init__(self, model_name: str, temperature: float = 0.7):
self.model_name = model_name
self.temperature = temperature
13.2 Self 自身类型(链式调用)
from typing import Self
class LLMBuilder:
def set_prompt(self, prompt: str) -> Self:
self.prompt = prompt
return self
def set_temperature(self, t: float) -> Self:
self.temp = t
return self
13.3 类本身类型 type
class BaseLLM:
pass
def create_llm(llm_class: type[BaseLLM]) -> BaseLLM:
return llm_class()
十四、异步函数类型注解
import asyncio
async def async_llm_call(prompt: str) -> str:
await asyncio.sleep(1)
return f"异步回复:{prompt}"
十五、NoReturn 永不返回
from typing import NoReturn
def raise_error() -> NoReturn:
raise RuntimeError("大模型调用失败")
十六、Protocol 接口类型(高级)
用于定义接口规范,类似 Java/TypeScript 接口。
from typing import Protocol
class EmbeddingModel(Protocol):
def encode(self, text: str) -> list[float]:
...
任何实现 encode 方法的类都被视为 EmbeddingModel。
十七、类型注解在大模型项目中的实战综合示例
from typing import (
Optional,
Literal,
TypedDict,
Generator,
)
ModelName = Literal["gpt-3.5", "gpt-4", "qwen"]
class ChatMessage(TypedDict):
role: str
content: str
name: Optional[str]
def chat_completion(
messages: list[ChatMessage],
model: ModelName = "gpt-3.5",
temperature: float = 0.7,
stream: bool = False
) -> Generator[str, None, None] | str:
if stream:
yield "回复"
else:
return "完整回复"
十八、静态检查工具 mypy(企业级必备)
mypy your_code.py --strict
- 运行前发现类型错误
- 保证大项目质量
- 企业级 AI 工程标配
十九、类型注解最全总结
基础
str, int, float, bool, None
- 变量:
name: str
- 函数:
def fn(a: int) -> str
容器
list[T]
dict[K, V]
tuple[T1, T2, ...]
set[T]
组合类型
- 可选:
T | None / Optional[T]
- 联合:
T1 | T2
- 任意:
Any
高级(AI 必用)
- 生成器:
Generator[Yield, Send, Return]
- 回调:
Callable[[P], R]
- 结构:
TypedDict
- 枚举:
Literal
- 接口:
Protocol
- 异步:直接注解返回值
工程规范
- 不用 Any
- 全部函数加注解
- 复杂结构用 TypedDict
- 配置项用 Literal
- 使用 mypy 检查
相关免费在线工具
- 加密/解密文本
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
- RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
- Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
- 随机西班牙地址生成器
随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online
- Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
- curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online