Python 类型注解详解：AI 大模型开发实战 | 极客日志

PythonAI算法

Python 类型注解详解：AI 大模型开发实战

系统讲解 Python 类型注解的基础与高级用法，涵盖变量、容器、函数参数及返回值、联合类型、生成器、TypedDict 等核心知识点。重点阐述类型注解在 FastAPI、LangChain 等大模型开发框架中的必要性，通过实际代码示例展示如何提升代码可读性、协作规范及静态检查能力，并介绍 mypy 工具的使用，旨在帮助开发者构建更稳健的 AI 工程化项目。

云间运维发布于 2026/3/30更新于 2026/5/2326 浏览

前言

在 FastAPI、LangChain、LlamaIndex、RAG、大模型服务端 开发中，类型注解（Type Hints） 已经不是可选语法，而是：

代码可读性基础
多人协作规范
静态检查（mypy）依据
自动生成 API 文档的核心
避免 80% 运行时错误的保障

一、类型注解基础

1.1 什么是类型注解？

类型注解是 Python 3.5+ 引入的静态类型标记，用于：

标记变量类型
标记函数参数类型
标记函数返回值类型

特点：

不影响程序运行
仅用于提示、检查、文档
被 IDE / mypy / 框架识别

1.2 为什么大模型开发必须学？

函数参数极多（prompt、temperature、stream、tools…）
数据结构复杂（Document、Embedding、Message…）
嵌套深、逻辑复杂，无类型完全无法维护
FastAPI / LangChain 强制依赖类型注解

二、变量类型注解（完整）

2.1 基础类型

# 数字
name: str = "大模型开发者"
age: int = 25
score: float = 98.5
is_active: bool = True
nothing: None = None

2.2 只声明不赋值

prompt: str
temperature: float
max_tokens: int
stream: bool

2.3 常量注解 Final

from typing import Final
API_KEY: Final[str] = "sk-xxxxxx"
MODEL_NAME: Final[str] = "gpt-3.5-turbo"

三、容器类型注解（list / dict / tuple / set）

Python 3.9+ 内置支持，无需从 typing 导入 List/Dict。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 整数列表
ids: list[int] = [1001, 1002, 1003]
# 字符串列表
prompts: list[str] = ["介绍 AI", "写 Python 代码"]
# 浮点向量（大模型 Embedding 必用）
embedding: list[float] = [0.12, 0.35, 0.66, 0.92]
# 嵌套列表
matrix: list[list[float]] = [[1.0, 2.0], [3.0, 4.0]]

# 简单字典
config: dict[str, str] = {"model": "gpt-3.5", "version": "v1"}
# 混合值类型（常用）
model_kwargs: dict[str, int | float | bool] = {"temperature": 0.7, "max_tokens": 1024, "stream": True}

# 固定结构：int + str
user: tuple[int, str] = (1001, "AI 用户")
# 任意长度同类型
numbers: tuple[int, ...] = (1, 2, 3, 4, 5)
# 混合结构
message: tuple[str, str, bool] = ("user", "你好", True)

unique_ids: set[int] = {101, 102, 103}
vocab: set[str] = {"AI", "大模型", "RAG"}

def generate_response(
    prompt: str,
    temperature: float,
    max_tokens: int,
    stream: bool
) -> str:
    return f"生成结果：{prompt}"

def get_embedding(text: str) -> list[float]:
    return [0.1, 0.2, 0.3]

def log_info(message: str) -> None:
    print(f"[日志] {message}")

def chat(
    prompt: str,
    model: str = "gpt-3.5-turbo",
    temperature: float = 0.7
) -> str:
    ...

def call_llm(*args: str, **kwargs: int | float) -> str:
    ...

# 可以是 int 或 str
user_id: int | str = 1001
# 可以是 float 或 None
score: float | None = None

from typing import Union
user_id: Union[int, str] = 1001

from typing import Optional
# 等价于 system_prompt: str | None
system_prompt: Optional[str] = None
api_key: Optional[str] = None

from typing import Any
# 可以是任何类型
data: Any = "字符串"
data: Any = 123
data: Any = [1, 2, 3]

from typing import Iterator

def count_to_5() -> Iterator[int]:
    for i in range(5):
        yield i

from typing import Generator

# 大模型流式输出标准写法
def llm_stream() -> Generator[str, None, None]:
    yield "我"
    yield "是"
    yield "AI"
    yield "大模型"

from typing import Callable

# 回调：接收 str，返回 bool
CallbackFunc = Callable[[str], bool]

def process_result(result: str, callback: CallbackFunc) -> None:
    callback(result)

# 向量别名
Embedding = list[float]
# 文档别名
Document = dict[str, str | Embedding]
# 消息列表
MessageList = list[dict[str, str]]

# 使用
emb: Embedding = [0.1, 0.2, 0.3]
doc: Document = {"content": "你好", "embedding": emb}

from typing import Literal

# 模型名称只能是这三种
ModelType = Literal["gpt-3.5", "gpt-4", "qwen", "ernie"]
# 设备类型
Device = Literal["cpu", "cuda", "mps"]

def run_llm(model: ModelType, device: Device = "cpu") -> None:
    ...

from typing import TypedDict

class ChatMessage(TypedDict):
    role: str      # user / assistant / system
    content: str
    name: Optional[str]  # 必须严格按结构写，少字段/错类型都会报错

msg: ChatMessage = {"role": "user", "content": "你好"}

class LLMConfig(TypedDict, total=False):
    model: str
    temperature: float
    max_tokens: int

class LLMModel:
    # 类属性注解
    model_name: str
    temperature: float

    def __init__(self, model_name: str, temperature: float = 0.7):
        self.model_name = model_name
        self.temperature = temperature

from typing import Self

class LLMBuilder:
    def set_prompt(self, prompt: str) -> Self:
        self.prompt = prompt
        return self

    def set_temperature(self, t: float) -> Self:
        self.temp = t
        return self

class BaseLLM:
    pass

def create_llm(llm_class: type[BaseLLM]) -> BaseLLM:
    return llm_class()

import asyncio

async def async_llm_call(prompt: str) -> str:
    await asyncio.sleep(1)
    return f"异步回复：{prompt}"

from typing import NoReturn

def raise_error() -> NoReturn:
    raise RuntimeError("大模型调用失败")

from typing import Protocol

class EmbeddingModel(Protocol):
    def encode(self, text: str) -> list[float]:
        ...

from typing import (
    Optional,
    Literal,
    TypedDict,
    Generator,
)

ModelName = Literal["gpt-3.5", "gpt-4", "qwen"]

class ChatMessage(TypedDict):
    role: str
    content: str
    name: Optional[str]

def chat_completion(
    messages: list[ChatMessage],
    model: ModelName = "gpt-3.5",
    temperature: float = 0.7,
    stream: bool = False
) -> Generator[str, None, None] | str:
    if stream:
        yield "回复"
    else:
        return "完整回复"

pip install mypy

mypy your_code.py --strict

Python 类型注解详解：AI 大模型开发实战

前言

一、类型注解基础

1.1 什么是类型注解？

1.2 为什么大模型开发必须学？

二、变量类型注解（完整）

2.1 基础类型

2.2 只声明不赋值

2.3 常量注解 Final

三、容器类型注解（list / dict / tuple / set）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.1 list 列表

3.2 dict 字典

3.3 tuple 元组

3.4 set 集合

四、函数类型注解（最高频、最重要）

4.1 函数参数注解

4.2 返回值注解 -> 类型

4.3 无返回值 -> None

4.4 默认参数注解

4.5 可变参数 *args **kwargs

五、联合类型 | Union（多种可能类型）

5.1 Python 3.10+ 简洁写法（推荐）

5.2 旧版写法（兼容低版本）

六、可选类型 Optional（等于 X | None）

七、Any 类型（任意类型）

八、迭代器与生成器类型（大模型流式输出必学）

8.1 Iterator 迭代器

8.2 Generator 生成器（流式输出标准）

九、Callable 函数类型（回调函数）

十、Type Alias 类型别名（工程化必备）

十一、Literal 字面量类型（大模型配置神器）

十二、TypedDict 结构化字典（AI 项目核心）

可选字段 TypedDict

十三、Class 类与对象注解

13.1 实例属性注解

13.2 Self 自身类型（链式调用）

13.3 类本身类型 type

十四、异步函数类型注解

十五、NoReturn 永不返回

十六、Protocol 接口类型（高级）

十七、类型注解在大模型项目中的实战综合示例

十八、静态检查工具 mypy（企业级必备）

十九、类型注解最全总结

基础

容器

组合类型

高级（AI 必用）

工程规范

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具