NVIDIA GPU 架构详解：从 Pascal 到 Blackwell 的演进 | 极客日志

NVIDIA GPU 架构详解：从 Pascal 到 Blackwell 的演进 | 极客日志

架构名称	关键技术	性能特性	代表产品	应用场景
Pascal	CUDA 核心优化、GDDR5X/HBM2 显存、NVLink	性能与能效提升、支持 VR	GeForce GTX 10 系列、Quadro P 系列、Tesla P 系列	游戏、VR 开发、初级 AI
Volta	Tensor Core、HBM2 显存、NVLink 2.0	AI 加速、FP16/INT8 运算优化	Titan V、Tesla V100	深度学习、HPC
Turing	RT Core、第二代 Tensor Core、DLSS	实时光线追踪、混合渲染	GeForce RTX 20 系列、Quadro RTX 系列、Tesla T4	游戏、视觉效果制作、AI 推理
Ampere	第三代 Tensor Core、第二代 RT Core、MIG、PCIe Gen 4	高效 AI 和光线追踪性能、稀疏矩阵运算	GeForce RTX 30 系列、NVIDIA A 系列、A100	游戏、AI 训练和推理、数据中心
Ada	第四代 Tensor Core、第三代 RT Core、DLSS 3	极致光线追踪、高效 AI 加速	GeForce RTX 40 系列、L40	高端游戏、内容创作、AI 推理
Hopper	Transformer Engine、第四代 NVLink、HBM3 显存	针对大模型优化、更高互联带宽	H100	大规模 AI、科学计算
Blackwell	第五代 Tensor Core、第四代 RT Core、新一代显存	更强 AI 和光线追踪性能、更高能效比	GeForce RTX 50 系列（预计）、B 系列（预计）、下一代数据中心 GPU（预计）	下一代游戏、高级 AI、数据中心