跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

YOLOv8 模型输入尺寸设置与最佳实践

YOLOv8 模型输入尺寸并非固定不变,但遵循特定规则。默认推荐 640×640 像素,且宽高必须为 32 的整数倍以匹配网络下采样结构。YOLOv8 支持非正方形尺寸,可根据设备性能与目标大小灵活调整。训练与推理尺寸需保持一致,否则影响精度。Ultralytics 库会自动处理图片缩放与填充,无需手动预处理。针对不同模型(如 nano、small、seg、pose 等)及场景(移动端、高精度检测),选择合适的尺寸能平衡速度与精度。分类模型通常适配 224×224。

MqEngine发布于 2026/3/16更新于 2026/4/241 浏览

YOLOv8 模型输入尺寸设置与最佳实践

YOLO(尤其是 Ultralytics YOLOv8)对输入图片的尺寸没有严格固定值,但有核心的「默认尺寸」「最佳实践」和「尺寸规则」。这里梳理一下具体细节。

一、核心默认尺寸

YOLO 系列的默认输入尺寸为 640×640 像素(正方形),这是 Ultralytics 官方推荐的基础尺寸。对应代码或命令中的参数如下:

  • 推理时:model.predict(source='img.jpg', imgsz=640)
  • 训练时:model.train(data='coco.yaml', imgsz=640)

二、尺寸规则

  1. 尺寸需是 32 的整数倍 YOLO 的网络结构包含多次 32 倍下采样(如 640→320→160→80→40→20→10)。输入尺寸必须能被 32 整除,否则会导致特征图尺寸不匹配,报错或精度下降。 ✅ 合法尺寸:320、416、640、800、960、1280(常用) ❌ 非法尺寸:600、700、801(无法被 32 整除)

  2. 支持非正方形尺寸(YOLOv8+) YOLOv8 及后续版本支持「矩形推理/训练」(非正方形),只需保证宽高均为 32 的整数倍即可。例如:

    • 480×640(适配手机竖屏图)
    • 800×1280(适配宽屏图) 命令示例:model.predict(imgsz=[480, 640])([高,宽])

三、不同模型不同尺寸的适用场景

模型类型具体型号核心特性适用图片大小(imgsz)适用场景速度/精度特点(CPU/单卡 GPU)参数量 (M)FLOPs(G)
基础检测模型YOLOv8n (nano)极致轻量化,网络深度/宽度最小,推理最快320×320、416×416(推荐);≤640×640移动端/嵌入式设备(如树莓派、手机)、实时性优先的低算力场景(如摄像头实时检测)GPU:~300 FPS,CPU:~20 FPS;精度最低(mAP50≈65)3.28.7
YOLOv8s (small)平衡轻量化与精度,基础版中性价比最高416×416、640×640(推荐);≤800×800通用场景(如安防监控、普通目标检测)、边缘设备(如工业相机)GPU:~200 FPS,CPU:~15 FPS;精度中等(mAP50≈72)11.228.6
YOLOv8m (medium)中等规模,深度/宽度提升,精度显著提高640×640(推荐)、800×800;≤960×960中等算力设备(如中端 GPU)、精度要求较高的场景(如电商商品检测、交通标识识别)GPU:~100 FPS,CPU:~8 FPS;精度较高(mAP50≈76)25.978.9
YOLOv8l (large)大规模模型,特征提取能力强800×800、960×960(推荐);≤1280×1280高算力设备(如 RTX 30/40 系列 GPU)、高精度需求(如工业缺陷检测、医疗影像初筛)GPU:~50 FPS,CPU:~4 FPS;精度很高(mAP50≈78)43.7165.2
YOLOv8x (extra large)超大模型,精度天花板,参数量最大960×960、1280×1280(推荐);≤1536×1536服务器级 GPU、精度优先无实时性要求的场景(如静态图片分析、数据集标注辅助)GPU:~30 FPS,CPU:~2 FPS;精度最高(mAP50≈79)68.2257.8
轻量化变体YOLOv8n-p2小感受野,适配小尺寸图片(如 48×48、96×96)48×48、96×96(推荐);≤320×320小目标检测(如人脸关键点、细小零件检测)、移动端小尺寸图片推理速度比 YOLOv8n 快 10%,精度针对小目标提升 5%2.87.5
YOLOv8s-p6多尺度特征融合,适配超大尺寸图片(如 1280×1280)1280×1280(推荐)、1536×1536;≤2048×2048远距离目标检测(如无人机航拍、安防远距离监控)速度比 YOLOv8s 慢 15%,大目标精度提升 8%12.535.2
实例分割模型YOLOv8n-seg轻量化分割,检测 + 分割二合一320×320、416×416(推荐);≤640×640移动端分割场景(如简单场景抠图、实时语义分割)GPU:~250 FPS,CPU:~15 FPS;分割精度基础级3.410.1
YOLOv8s-seg平衡分割精度与速度416×416、640×640(推荐);≤800×800通用分割场景(如路面分割、商品轮廓提取)GPU:~180 FPS,CPU:~12 FPS;分割精度中等11.831.4
YOLOv8m-seg中等分割精度640×640(推荐)、800×800;≤960×960工业分割(如零件轮廓检测、缺陷区域分割)GPU:~80 FPS,CPU:~6 FPS;分割精度较高27.285.3
YOLOv8l-seg高精度分割800×800、960×960(推荐);≤1280×1280医疗影像分割(如器官轮廓)、高精度工业质检GPU:~40 FPS,CPU:~3 FPS;分割精度很高45.8176.5
YOLOv8x-seg分割精度天花板960×960、1280×1280(推荐);≤1536×1536科研级分割任务、复杂场景分割(如遥感影像分割)GPU:~25 FPS,CPU:~1 FPS;分割精度最高70.8275.6
姿态估计模型YOLOv8n-pose轻量化姿态估计,检测人体关键点320×320、480×480(推荐);≤640×640移动端人体姿态识别(如健身动作检测、简单行为分析)GPU:~280 FPS,CPU:~18 FPS;关键点检测精度基础级3.39.2
YOLOv8s-pose平衡姿态精度与速度480×480、640×640(推荐);≤800×800通用姿态检测(如监控人体行为、舞蹈动作分析)GPU:~190 FPS,CPU:~14 FPS;关键点检测精度中等11.530.1
YOLOv8m-pose中等姿态精度640×640(推荐)、800×800;≤960×960工业姿态检测(如工人操作规范识别)GPU:~90 FPS,CPU:~7 FPS;关键点检测精度较高26.582.4
YOLOv8l-pose高精度姿态估计800×800、960×960(推荐);≤1280×1280医疗姿态分析(如康复动作检测)、高精度行为识别GPU:~45 FPS,CPU:~3 FPS;关键点检测精度很高44.9172.1
YOLOv8x-pose姿态估计精度天花板960×960、1280×1280(推荐);≤1536×1536科研级姿态分析、复杂行为识别(如体育动作拆解)GPU:~28 FPS,CPU:~2 FPS;关键点检测精度最高69.5268.9
分类模型YOLOv8n-cls轻量化图像分类224×224、320×320(推荐);≤416×416移动端图片分类(如相册分类、简单物品识别)GPU:~350 FPS,CPU:~25 FPS;分类精度基础级2.76.4
YOLOv8s-cls平衡分类精度与速度224×224、416×416(推荐);≤640×640通用分类场景(如商品分类、场景识别)GPU:~220 FPS,CPU:~18 FPS;分类精度中等9.821.5
YOLOv8m-cls中等分类精度224×224、640×640(推荐);≤800×800工业分类(如产品外观分类、物料识别)GPU:~110 FPS,CPU:~9 FPS;分类精度较高22.960.3
YOLOv8l-cls高精度分类224×224、800×800(推荐);≤960×960医疗图像分类(如病灶分类)、复杂场景分类GPU:~55 FPS,CPU:~5 FPS;分类精度很高37.4128.8
YOLOv8x-cls分类精度天花板224×224、960×960(推荐);≤1280×1280科研级分类任务、大规模数据集分类GPU:~35 FPS,CPU:~3 FPS;分类精度最高56.8207.5

四、关键注意事项

  1. 训练与推理尺寸需一致 若训练时用 imgsz=800,推理时也必须用 800(或同比例的 32 倍数),否则会导致检测精度大幅下降。

  2. 自动缩放与填充 YOLO 会自动将输入图片缩放到指定 imgsz,并对不足的区域填充黑边(letterbox),无需手动裁剪/缩放图片。

    • 例:输入一张 1920×1080 的图片,指定 imgsz=640,会先按比例缩放到 640×360,再在上下填充 140 像素黑边,最终得到 640×640。
  3. 自定义尺寸的设置方法

    • 命令行:yolo detect predict imgsz=800 source='img.jpg'
  4. 小目标检测的特殊优化 若检测小目标,除了增大尺寸(如 800/960),还可配合 imgsz+hyp(超参数)调整,或使用 YOLOv8 的 -s 小模型(如 yolov8s.pt)+ 大尺寸。

from ultralytics import YOLO

model = YOLO('yolov8n.pt')

# 正方形尺寸
results = model.predict('img.jpg', imgsz=800)

# 非正方形尺寸(高×宽)
results = model.predict('img.jpg', imgsz=[480, 640])

五、总结

  • 新手/通用场景:直接用默认 640×640;
  • 低算力设备(如树莓派、手机):320×320 或 416×416;
  • 小目标/高精度需求:800×800 或 960×960;
  • 所有尺寸必须是 32 的整数倍,训练和推理尺寸保持一致。
  • 分类模型默认适配 224×224(经典分类网络输入尺寸),也支持更大尺寸。

目录

  1. YOLOv8 模型输入尺寸设置与最佳实践
  2. 一、核心默认尺寸
  3. 二、尺寸规则
  4. 三、不同模型不同尺寸的适用场景
  5. 四、关键注意事项
  6. 正方形尺寸
  7. 非正方形尺寸(高×宽)
  8. 五、总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog

更多推荐文章

查看全部
  • 位运算实战:判断字符唯一性与查找丢失数字
  • MySQL 数据库基础:概念、架构与核心使用指南
  • 数据结构初阶:二叉树链式存储实现
  • Windows 部署 OpenAkita 并接入飞书实现本地 AI 助手
  • Web 火车票务管理系统的设计与实现
  • Linux 进程信号入门:从 Ctrl+C 到信号处理机制
  • Rust 实战:抓取 GitHub Trending 热门仓库
  • Higress 实战:将 REST API 转换为 MCP Server 工具
  • 基于深度学习的宠物识别系统设计与实现
  • MirageLSD 实时直播流扩散模型:视频流自定义风格转换
  • Java 虚拟机核心机制:类加载与垃圾回收详解
  • Java 微服务架构设计模式:云原生分布式系统实战
  • 从 try-catch 回调到链式调用:一种更优雅的 async/await 错误处理方案
  • LeetCode 经典算法题 Python 实战解析:树、链表与 DP
  • AI 时代初级开发者的创意生存指南:数据与创新的边界
  • Ling Studio 深度评测:万亿参数模型如何重塑 AI 开发工作流
  • Python 滑动窗口算法实战:最小长度子数组
  • Ubuntu 22.04 内核升级方案与注意事项
  • 基于 Higress 将 REST API 转换为 MCP Server 工具
  • 借助 DeepSeek 与云算力快速搭建个人网页

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online