一、核心默认尺寸(YOLOv8/YOLOv5/YOLOv7 通用)
YOLO 系列的默认输入尺寸为 640×640 像素(正方形),这是 Ultralytics 官方推荐的基础尺寸,对应代码/命令中的参数:
- 推理时:
model.predict(source='img.jpg', imgsz=640) - 训练时:
model.train(data='coco.yaml', imgsz=640)
二、尺寸规则(必须遵守)
- 尺寸需是 32 的整数倍
YOLO 的网络结构包含多次 32 倍下采样(如 640→320→160→80→40→20→10),输入尺寸必须能被 32 整除,否则会导致特征图尺寸不匹配,报错或精度下降。
✅ 合法尺寸:320、416、640、800、960、1280(常用)
❌ 非法尺寸:600、700、801(无法被 32 整除) - 支持非正方形尺寸(YOLOv8+)
YOLOv8 及后续版本支持「矩形推理/训练」(非正方形),只需保证宽高均为 32 的整数倍即可,例如:- 480×640(适配手机竖屏图)
- 800×1280(适配宽屏图)
命令示例:model.predict(imgsz=[480, 640])([高,宽])
三、不同模型不同尺寸的适用场景
| 模型类型 | 具体型号 | 核心特性 | 适用图片大小(imgsz) | 适用场景 | 速度/精度特点(CPU/单卡 GPU) | 参数量 (M) | FLOPs(G) |
|---|---|---|---|---|---|---|---|
| 基础检测模型 | YOLOv8n (nano) | 极致轻量化,网络深度/宽度最小,推理最快 | 320×320、416×416(推荐);≤640×640 | 移动端/嵌入式设备(如树莓派、手机)、实时性优先的低算力场景(如摄像头实时检测) | GPU:~300 FPS,CPU:~20 FPS;精度最低(mAP50≈65) | 3.2 | 8.7 |
| YOLOv8s (small) | 平衡轻量化与精度,基础版中性价比最高 | 416×416、640×640(推荐);≤800×800 | 通用场景(如安防监控、普通目标检测)、边缘设备(如工业相机) | GPU:~200 FPS,CPU:~15 FPS;精度中等(mAP50≈72) | 11.2 | 28.6 | |
| YOLOv8m (medium) | 中等规模,深度/宽度提升,精度显著提高 | 640×640(推荐)、800×800;≤960×960 | 中等算力设备(如中端 GPU)、精度要求较高的场景(如电商商品检测、交通标识识别) | GPU:~100 FPS,CPU:~8 FPS;精度较高(mAP50≈76) | 25.9 | 78.9 | |
| YOLOv8l (large) | 大规模模型,特征提取能力强 | 800×800、960×960(推荐);≤1280×1280 | 高算力设备(如 RTX 30/40 系列 GPU)、高精度需求(如工业缺陷检测、医疗影像初筛) | GPU:~50 FPS,CPU:~4 FPS;精度很高(mAP50≈78) | 43.7 | 165.2 | |
| YOLOv8x (extra large) |

