核心逻辑图解

一、PyTorch 版本对照表 (推荐)
PyTorch 是目前兼容性最好的框架,只要 CUDA 驱动版本 足高,通常都能向下兼容。对于使用最新硬件(如 RTX 50 系)的用户,请务必使用 2.4 或更高版本。
| PyTorch 版本 | Python 版本 | 推荐 CUDA | 适用显卡建议 |
|---|---|---|---|
| 2.6.x (Dev/Nightly) | 3.10 - 3.13 | 12.8 | RTX 50 系 完美释放性能首选 |
| 2.4.x / 2.5.x | 3.9 - 3.12 | 12.4, 12.1 | RTX 50 系 (基础支持), RTX 40 系,H100 |
| 2.1.x - 2.3.x | 3.8 - 3.11 | 12.1, 11.8 | RTX 40 系,30 系 (50 系不推荐) |
| 1.13.x 及更早 | 3.7 - 3.10 | 11.7, 11.6 | 老架构显卡专用 (Pascal/Maxwell) |
💡 最新显卡安装贴士
如果你使用的是 Blackwell 架构 (RTX 50 系) 或 Ada 架构 (RTX 40 系),建议优先使用 CUDA 12.x 的 PyTorch 包:
二、显卡架构与算力 (Compute Capability) 速查
显卡架构决定了你的算力上限 (Compute Capability) 和 CUDA 版本的下限。新卡不能装太旧的 CUDA,老卡通常可以使用新 CUDA。
| 显卡系列 | 架构代号 | 算力 (Arch) | 最低 CUDA 要求 | 最佳 CUDA 版本 |
|---|---|---|---|---|
| RTX 5090 / 5080 | Blackwell | 10.0 (sm_100) | CUDA 12.4+ | 12.6 / 12.8 |
| H100 / H800 | Hopper | 9.0 (sm_90) | CUDA 11.8 | 12.x |
| RTX 4090 / 4060 | Ada Lovelace | 8.9 (sm_89) | CUDA 11.8 | 12.1+ |
| RTX 3090 / 3060 | Ampere | 8.6 (sm_86) | CUDA 11.1 | 11.8 (万金油) |
| RTX 20 / GTX 16 | Turing | 7.5 (sm_75) | CUDA 10.0 | 11.8 |
| GTX 1080 Ti | Pascal | 6.1 (sm_61) | CUDA 8.0 | 10.2 - 11.x |
三、TensorFlow 版本对应关系
TensorFlow 对新硬件的支持相对滞后。Windows 用户请注意:TF 2.10 是支持 GPU 的最后一个 Windows 本地版本。
| 环境 | 注意事项与建议 |
|---|---|
| Linux (Ubuntu) | 推荐 TensorFlow 2.16+ 配 CUDA 12.3。这是发挥新显卡性能的最佳 OS。 |
| Windows | 原生支持止步于 TF 2.10 (最高支持 RTX 30/40 系,50 系兼容性未知)。 |
| 如需使用新版 TF,必须使用 WSL2 (Ubuntu 子系统)。 | |
| Docker | 最推荐方案。直接拉取 NVIDIA 官方镜像 nvcr.io/nvidia/tensorflow:xx.xx-tf2-py3,无需在宿主机折腾环境。 |
四、不同配置的黄金搭配
最后给大家总结几套无需复杂思考的'黄金配置',请根据自己的硬件对号入座:
- 前沿性能组 (RTX 50/40 系):
- 搭配:Python 3.11 + PyTorch 2.5/2.6 + CUDA 12.4+
- 理由:发挥新架构 (FP8 等) 极致性能,必须拥抱 CUDA 12。
- 主流稳定组 (RTX 30/40 系):
- 搭配:Python 3.10 + PyTorch 2.3/2.4 + CUDA 12.1
- 理由:市面上绝大多数开源项目都能跑,兼容性最佳。
- 经典兼容组 (RTX 20/30 系):
- 搭配:Python 3.9/3.10 + PyTorch 2.0 + CUDA 11.8
- 理由:CUDA 11.8 是过去几年的统一度量衡,极其稳定。
- 古董收藏组 (GTX 10 系):
- 搭配:Python 3.8 + PyTorch 1.12 + CUDA 11.3
- 理由:老卡就别追新了,能跑起来就是胜利。


