YOLOv12 环境配置、训练与推理实战详解
YOLOv12 是近期发布的目标检测模型,由纽约州立大学联合中科院推出。相比前代版本,它在网络结构上进行了优化,引入了残差高效层聚合网络 (R-ELAN) 和区域注意力机制 (Area-Attention),在保持高精度的同时提升了效率。
一、代码获取与模型结构
官方源码地址:https://github.com/sunsmarterjie/yolov12
1. 模型结构图
根据 yolov12.yaml 配置文件绘制的整体结构图显示,YOLOv12 对比 YOLOv11 减少了总层数,网络结构更加精简。核心改进在于 A2C2f 模块中引入的区域注意力机制,通过十字形窗口自我注意机制计算纵横交错的注意力,以较少的计算量获得更大的感受野。

理论细节可参考论文:https://arxiv.org/pdf/2502.12524
二、环境配置教程
YOLOv12 的环境搭建与 v11/v10 等版本通用,建议创建独立的虚拟环境以避免依赖冲突。如果遇到 ImportError: cannot import name 'scaled_dot_product_attention' 错误,通常意味着 PyTorch 版本过低,需重新配置环境。
1. 创建虚拟环境
推荐使用 Python 3.9 至 3.11 版本。这里以 3.11 为例:
conda create -n yolov12 python=3.11
输入 y 确认安装并等待下载完成。
2. 激活虚拟环境
conda activate yolov12
激活成功后,命令行左侧会显示 (yolov12) 标识。
3. 查询 CUDA 支持版本
无显卡用户可跳过此步。有显卡用户可通过终端输入 nvidia-smi 查看支持的最高 CUDA 版本。例如显示 CUDA 12.5,则安装 PyTorch 时可选择向下兼容的版本(如 cu121 或 cu118)。
若驱动过旧导致 CUDA 版本低,可前往 NVIDIA 官网更新驱动后重启电脑再次检查。
4. PyTorch 安装
根据官网推荐及兼容性,建议安装 PyTorch 2.2.2 版本。有 GPU 的用户选择带 CUDA 的版本,无 GPU 则选 CPU 版。
在线安装:
访问 PyTorch 官网复制对应命令,注意 -c 后面的内容无需复制。
离线安装:
若在线安装失败,可下载 .whl 文件进行本地安装。文件名包含关键信息:
cu118/cu102:CUDA 版本cp311/cp39:Python 版本win:操作系统
下载完成后,进入文件所在目录执行:
pip install torch-xxx.whl
pip install torchvision-xxx.whl
pip install torchaudio-xxx.whl


