Python YOLOv8 进阶教程 | 极客日志

PythonAI算法

Python YOLOv8 进阶教程

综述由AI生成Python YOLOv8 的目标检测、实例分割、姿态估计及图像分类等核心功能。内容涵盖 YOLOv8 技术背景、环境搭建、模型训练与评估、高级应用技巧（如 NMS、量化、多 GPU 训练）、实战项目案例（智能监控、交通流量统计）以及常见问题解决方案。文章提供了完整的代码示例，帮助开发者快速掌握 YOLOv8 的使用与部署。

MqEngine发布于 2026/3/28更新于 2026/5/2630 浏览

Python YOLOv8 进阶教程

一、YOLOv8 技术深度解析

1.1 YOLO 算法发展历程

YOLO（You Only Look Once）是由 Joseph Redmon 等人提出的单阶段目标检测算法，自 2016 年发布以来经历了多次迭代：

YOLOv1：首次提出单阶段检测思想，将目标检测转化为回归问题
YOLOv2：引入批量归一化、锚框机制和多尺度训练，提升检测精度
YOLOv3：使用 Darknet-53 骨干网络，引入多尺度预测和残差连接
YOLOv4：结合 CSPNet、Mosaic 数据增强等多种优化技术
YOLOv5：Ultralytics 团队推出的版本，以易用性和高性能著称
YOLOv6：美团团队推出的工业级目标检测框架
YOLOv7：提出可微辅助分支和动态标签分配等创新技术
YOLOv8：Ultralytics 团队 2023 年推出的最新版本，支持检测、分割、姿态估计等多种任务

1.2 YOLOv8 核心特性

YOLOv8 在保持 YOLO 系列一贯的高速检测特性的同时，在精度和易用性上有了显著提升：

多任务支持：目标检测、实例分割、姿态估计、分类等
模型架构：采用 C2f 模块替代 C3 模块，提升特征提取能力
损失函数：使用 CIoU 损失替代 IoU 损失，优化边界框回归
标签分配：动态标签分配策略，提升小目标检测性能
部署友好：支持 ONNX、TensorRT、CoreML 等多种部署格式

1.3 YOLOv8 模型家族

YOLOv8 提供了多种尺寸的模型，以平衡检测速度和精度：

模型	输入尺寸	参数量 (M)	FLOPs(B)	COCO mAP	速度 (ms)
n	640x640	3.2	8.7	53.9	0.9
s	640x640	11.2	28.6	60.9	2.0
m	640x640	25.9	78.9	64.8	2.7
l	640x640	43.7	165.2	67.2	4.6
x	640x640	68.2	257.8	68.8	6.8

二、环境搭建与配置

2.1 安装依赖

# 安装 ultralytics
pip install ultralytics

pip install opencv-python

pip install torch torchvision

pip install numpy matplotlib pillow

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from ultralytics import YOLO
# 加载模型
model = YOLO("yolov8n.pt")
# 打印模型信息
model.info()

from ultralytics import YOLO
import cv2

# 加载模型
model = YOLO("yolov8n.pt")

# 单张图片检测
results = model("test.jpg")

# 多张图片检测
results = model(["test1.jpg", "test2.jpg", "test3.jpg"])

# 保存检测结果
for i, result in enumerate(results):
    result.save(filename=f"result_{i}.jpg")

# 视频文件检测
results = model("test.mp4", save=True)

# 实时摄像头检测
results = model(0, show=True, save=True)
# 0 表示默认摄像头

# 加载分割模型
model = YOLO("yolov8n-seg.pt")

# 分割检测
results = model("test.jpg")

# 保存分割结果
results[0].save(filename="segment_result.jpg")

# 加载姿态估计模型
model = YOLO("yolov8n-pose.pt")

# 姿态检测
results = model("person.jpg")

# 保存姿态估计结果
results[0].save(filename="pose_result.jpg")

# 加载分类模型
model = YOLO("yolov8n-cls.pt")

# 图像分类
results = model("cat.jpg")

# 打印分类结果
print(results[0].probs)
# 概率分布
print(results[0].probs.top1)
# 最高置信度类别

dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/

# 加载模型
model = YOLO("yolov8n.pt")

# 训练模型
results = model.train(
    data="dataset.yaml",
    epochs=100,
    batch=16,
    imgsz=640,
    device="cuda:0",
    project="my_project",
    name="exp1"
)

# 评估模型
results = model.val()

# 打印评估结果
print(results.box.map)      # [email protected]:0.95
print(results.box.map50)    # [email protected]
print(results.box.map75)    # [email protected]

# 导出为 ONNX 格式
model.export(format="onnx")

# 导出为 TensorRT 格式
model.export(format="engine")

# 导出为 CoreML 格式
model.export(format="coreml")

# 导出量化模型
model.export(format="onnx", int8=True)     # 8 位量化
model.export(format="onnx", fp16=True)     # 16 位浮点量化

# 自定义 NMS 阈值
results = model("test.jpg", conf=0.5, iou=0.7)

# 只检测特定类别
results = model("test.jpg", classes=[0, 2, 5])
# 只检测人、车、自行车

# 过滤低置信度结果
for result in results:
    boxes = result.boxes
    for box in boxes:
        if box.conf[0] > 0.7:
            print(f"{model.names[int(box.cls[0])]}: {box.conf[0]:.2f}")

# 多 GPU 训练
results = model.train(
    data="dataset.yaml",
    epochs=100,
    batch=32,
    device=[0, 1]
)

# 混合精度训练
results = model.train(
    data="dataset.yaml",
    epochs=100,
    amp=True
)

from ultralytics import YOLO
import cv2
import time
import smtplib
from email.mime.text import MIMEText

# 加载模型
model = YOLO("yolov8n.pt")

# 打开摄像头
cap = cv2.VideoCapture(0)

# 异常行为检测函数
def detect_abnormal(results):
    abnormal = False
    for result in results:
        boxes = result.boxes
        for box in boxes:
            cls = box.cls[0]
            # 检测火灾（类别 0）和烟雾（类别 1）
            if int(cls) in [0, 1]:
                abnormal = True
                print(f"检测到异常行为：{model.names[int(cls)]}")
    return abnormal

# 报警函数
def send_alert(message):
    msg = MIMEText(message)
    msg["Subject"] = "监控系统报警"
    msg["From"] = "[email protected]"
    msg["To"] = "[email protected]"
    with smtplib.SMTP("smtp.example.com", 587) as server:
        server.starttls()
        server.login("[email protected]", "your_password")
        server.send_message(msg)

# 主循环
while True:
    ret, frame = cap.read()
    if not ret:
        break

    # 检测物体
    results = model(frame)

    # 检测异常行为
    if detect_abnormal(results):
        send_alert("监控画面中检测到异常行为！")

    # 显示结果
    cv2.imshow("Smart Monitoring", results[0].plot())

    # 按 ESC 键退出
    if cv2.waitKey(1) & 0xFF == 27:
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

from ultralytics import YOLO
import cv2
import numpy as np

# 加载模型
model = YOLO("yolov8n.pt")

# 打开视频文件
cap = cv2.VideoCapture("traffic.mp4")

# 初始化计数器
car_count = 0
bike_count = 0

# 定义检测区域
roi = [(100, 200), (500, 200), (500, 400), (100, 400)]

# 主循环
while True:
    ret, frame = cap.read()
    if not ret:
        break

    # 检测物体
    results = model(frame)

    # 统计车辆
    for result in results:
        boxes = result.boxes
        for box in boxes:
            x1, y1, x2, y2 = box.xyxy[0]
            cls = box.cls[0]
            # 判断是否在检测区域内
            if cv2.pointPolygonTest(np.array(roi, np.int32), ((x1 + x2) / 2, (y1 + y2) / 2), False) >= 0:
                if int(cls) == 2:
                    car_count += 1
                elif int(cls) == 3:
                    bike_count += 1

    # 显示统计结果
    cv2.putText(frame, f"Cars: {car_count}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
    cv2.putText(frame, f"Bikes: {bike_count}", (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

    # 显示结果
    cv2.imshow("Traffic Monitoring", frame)

    # 按 ESC 键退出
    if cv2.waitKey(1) & 0xFF == 27:
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

# 生成报告
print(f"交通流量统计报告：")
print(f"汽车数量：{car_count}")
print(f"摩托车数量：{bike_count}")

# 创建虚拟环境
python -m venv yolov8_env
# 激活虚拟环境
# Windows
yolov8_env\Scripts\activate
# Linux/Mac
source yolov8_env/bin/activate
# 安装依赖
pip install ultralytics

# 查看 CUDA 版本
nvcc --version
# 安装对应版本的 PyTorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

results = model("test.jpg", iou=0.5)
# 降低 iou 阈值可以减少重叠

pip install onnx onnxruntime

Python YOLOv8 进阶教程

Python YOLOv8 进阶教程

一、YOLOv8 技术深度解析

1.1 YOLO 算法发展历程

1.2 YOLOv8 核心特性

1.3 YOLOv8 模型家族

二、环境搭建与配置

2.1 安装依赖

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 验证安装

三、核心功能详解

3.1 目标检测基础

3.1.1 图片检测

3.1.2 视频检测

3.2 实例分割

3.3 姿态估计

3.4 图像分类

四、高级应用技巧

4.1 自定义模型训练

4.1.1 数据集准备

4.1.2 训练配置

4.1.3 模型评估

4.2 模型优化与部署

4.2.1 模型导出

4.2.2 模型量化

4.3 高级后处理

4.3.1 NMS（非极大值抑制）

4.3.2 过滤检测结果

4.4 性能优化

4.4.1 多 GPU 训练

4.4.2 混合精度训练

五、实战项目案例

5.1 智能监控系统

5.1.1 功能需求

5.1.2 代码实现

5.2 交通流量统计系统

5.2.1 功能需求

5.2.2 代码实现

六、常见问题与解决方案

6.1 安装与配置问题

6.2 模型训练问题

6.3 模型推理问题

6.4 模型部署问题

七、更多资源

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具