YOLOv8 推理与训练图片尺寸选择指南

YOLO 系列的默认输入尺寸为 640×640 像素（正方形），这是 Ultralytics 官方推荐的基础尺寸，对应代码/命令中的参数：

尺寸需是 32 的整数倍
YOLO 的网络结构包含多次 32 倍下采样（如 640→320→160→80→40→20→10），输入尺寸必须能被 32 整除，否则会导致特征图尺寸不匹配，报错或精度下降。
✅ 合法尺寸：320、416、640、800、960、1280（常用）
❌ 非法尺寸：600、700、801（无法被 32 整除）
支持非正方形尺寸（YOLOv8+）
YOLOv8 及后续版本支持「矩形推理/训练」（非正方形），只需保证宽高均为 32 的整数倍即可，例如：
- 480×640（适配手机竖屏图）
- 800×1280（适配宽屏图）
  命令示例：model.predict(imgsz=[480, 640])（[高，宽]）

模型类型	具体型号	核心特性	适用图片大小（imgsz）	适用场景	速度/精度特点（CPU/单卡 GPU）	参数量 (M)	FLOPs(G)
基础检测模型	YOLOv8n (nano)	极致轻量化，网络深度/宽度最小，推理最快	320×320、416×416（推荐）；≤640×640	移动端/嵌入式设备（如树莓派、手机）、实时性优先的低算力场景（如摄像头实时检测）	GPU：~300 FPS，CPU：~20 FPS；精度最低（mAP50≈65）	3.2	8.7
	YOLOv8s (small)	平衡轻量化与精度，基础版中性价比最高	416×416、640×640（推荐）；≤800×800	通用场景（如安防监控、普通目标检测）、边缘设备（如工业相机）	GPU：~200 FPS，CPU：~15 FPS；精度中等（mAP50≈72）	11.2	28.6
	YOLOv8m (medium)	中等规模，深度/宽度提升，精度显著提高	640×640（推荐）、800×800；≤960×960	中等算力设备（如中端 GPU）、精度要求较高的场景（如电商商品检测、交通标识识别）	GPU：~100 FPS，CPU：~8 FPS；精度较高（mAP50≈76）	25.9	78.9
	YOLOv8l (large)	大规模模型，特征提取能力强	800×800、960×960（推荐）；≤1280×1280	高算力设备（如 RTX 30/40 系列 GPU）、高精度需求（如工业缺陷检测、医疗影像初筛）	GPU：~50 FPS，CPU：~4 FPS；精度很高（mAP50≈78）	43.7	165.2

更多推荐文章