AI无人机解锁电动自行车交通监管新路径,基于YOLOv11全系列【n/s/m/l/x】参数模型开发构建AI无人机航拍巡检场景下电动车违规载人问题检测预警系统

AI无人机解锁电动自行车交通监管新路径,基于YOLOv11全系列【n/s/m/l/x】参数模型开发构建AI无人机航拍巡检场景下电动车违规载人问题检测预警系统

在我国城市与乡村的大街小巷,电动自行车凭借轻便、快捷、经济的优势,成为大众出行的热门选择。然而,与之相伴的是电动自行车引发的交通事故数量居高不下,给社会和家庭蒙上了沉重的阴影。其中,单人电动车违规载人现象尤为突出,由于座位较短,载人骑行极大地增加了安全隐患,成为交通管理的一大难题。

传统监管:力不从心的困境

长期以来,电动自行车交通监管主要依赖交警现场执法。但这种方式存在明显局限性。交警的精力与时间有限,面对广阔的交通区域和庞大的电动自行车数量,难以做到全面覆盖与实时监管。而且,交警工作受时长和天气等因素制约,无法实现全天候、及时有效的管理。在早晚高峰时段,车流量大、路况复杂,违规行为频发,交警往往应接不暇,难以对每一起违规行为及时纠正,导致事故隐患长期存在。例如,在一些学校周边,放学时段电动自行车违规载人现象屡见不鲜,交警虽尽力管理,但仍有不少违规者趁乱逃脱监管,给学生的出行安全带来极大威胁。

科技赋能:无人机与AI的崛起

随着智能化技术的飞速发展,AI技术正广泛应用于传统行业,为提升效率和安全性注入新动力。在电动自行车交通监管领域,无人机技术的出现为解决传统监管难题带来了新希望。无人机具有机动性强、覆盖范围广、成本低等诸多优点,能够实现对指定区域的自动巡航和实时监控。当AI技术与无人机相结合,更是为电动自行车交通管理带来了革命性的变化。

无人机凭借其便捷、机动性强的特性,可在指定区域内自动巡航,实时采集交通数据。这些数据通过众包平台进行高质量标注处理后,成为构建场景化检测识别模型的宝贵资源。基于这些模型,系统能够精准识别电动自行车的违规行为,如违规载人、闯红灯、逆行等。与传统监管方式相比,这种基于无人机与AI的监管模式具有更高的效率和准确性。

高效监管:精准预警与快速处理

借助无人机的快速机动巡航能力,可高频次地对事故易发区域进行巡检。一旦发现电动自行车违规载人等行为,系统能立即发送预警信息到片区管理人员处。管理人员收到信息后,可迅速赶赴现场进行处理,实现高效精准作业。例如,在城市的商业中心区域,人流和车流量大,电动自行车违规行为时有发生。通过部署无人机进行巡检,能够及时发现违规载人情况,并将信息传递给附近的管理人员。管理人员可以第一时间到达现场,对违规者进行教育和处罚,有效遏制违规行为的发生,降低事故风险。

此外,无人机与AI的结合还能为交通管理部门提供全面的数据分析。通过对大量交通数据的挖掘和分析,管理部门可以了解电动自行车违规行为的分布规律和趋势,有针对性地制定交通管理策略和宣传教育方案。比如,根据数据分析发现某个区域在特定时间段内违规载人现象较为严重,管理部门可以加强该区域的巡逻力度,同时开展针对性的交通安全宣传活动,提高市民的交通安全意识。

本文正是在这样的背景思考下想要趁着闲暇时间从实验性质的角度探索开发构建智能化的检测识别系统,在前文中我们已经进行了相关的开发实践,感兴趣的话可以自行移步阅读即可:

《AI无人机解锁电动自行车交通监管新路径,基于YOLOv10全系列【n/s/m/b/l/x】参数模型开发构建AI无人机航拍巡检场景下电动车违规载人问题检测预警系统》

本文主要是想要基于YOLOv11系列的模型来进行相应的开发实践,首先看下实例效果:

接下来看下实例数据:

ultralytics项目自发布以来目前已经逐步迭代至YOLOv11了,不可谓不快速,官方的项目在这里,如下所示:

YOLO11是Ultralytics YOLO系列实时目标检测器的次新版本,以其尖端的准确性、速度和效率重新定义了可能性。基于之前YOLO版本的显著进步,YOLO11在架构和训练方法上引入了重大改进,使其成为广泛计算机视觉任务的多功能选择。

【主要特点】

增强的特征提取:YOLO11采用了改进的骨干和颈部架构,增强了特征提取能力,以实现更精确的目标检测和复杂任务的性能。
优化的效率和速度:YOLO11引入了精炼的架构设计和优化的训练管道,提供更快的处理速度,并在准确性和性能之间保持最佳平衡。
更少的参数实现更高的准确性:通过模型设计的进步,YOLO11m在COCO数据集上实现了更高的平均精度(mAP),同时比YOLOv8m减少了22%的参数,使其在不影响准确性的情况下计算效率更高。
跨环境的适应性:YOLO11可以无缝部署在各种环境中,包括边缘设备、云平台和支持NVIDIA GPU的系统,确保最大的灵活性。
广泛支持的任务:无论是目标检测、实例分割、图像分类、姿态估计还是定向目标检测(OBB),YOLO11都设计用于应对多样化的计算机视觉挑战。

Ultralytics YOLO11在其前身的基础上引入了多项重大进步。关键改进包括:

增强的特征提取:YOLO11采用了改进的骨干和颈部架构,增强了特征提取能力,以实现更精确的目标检测。
优化的效率和速度:精炼的架构设计和优化的训练管道提供了更快的处理速度,同时在准确性和性能之间保持平衡。
更少的参数实现更高的准确性:YOLO11m在COCO数据集上实现了更高的平均精度(mAP),同时比YOLOv8m减少了22%的参数,使其在不影响准确性的情况下计算效率更高。
跨环境的适应性:YOLO11可以部署在各种环境中,包括边缘设备、云平台和支持NVIDIA GPU的系统。
广泛支持的任务:YOLO11支持多样化的计算机视觉任务,如目标检测、实例分割、图像分类、姿态估计和定向目标检测(OBB)。

YOLO11模型具有多功能性,支持广泛的计算机视觉任务,包括:

目标检测:识别和定位图像中的物体。
实例分割:检测物体并描绘其边界。
图像分类:将图像分类为预定义的类别。
姿态估计:检测和跟踪人体上的关键点。
定向目标检测(OBB):检测具有旋转的物体以提高精度。

YOLO11通过模型设计和优化技术的进步,实现了更少的参数实现更高的准确性。改进的架构允许高效的特征提取和处理,从而在COCO等数据集上实现更高的平均精度(mAP),同时比YOLOv8m减少了22%的参数。这使得YOLO11在不影响准确性的情况下计算效率更高,适合部署在资源受限的设备上,YOLO11设计用于适应各种环境,包括边缘设备。其优化的架构和高效的处理能力使其适合部署在边缘设备、云平台和支持NVIDIA GPU的系统上。这种灵活性确保了YOLO11可以在多样化的应用中使用,从移动设备上的实时检测到云环境中的复杂分割任务。

基础实例实现如下:

from ultralytics import YOLO #n model = YOLO("weights/yolo11n.pt") results = model.train(data='data/self.yaml', epochs=100, device=0,batch=32,workers=0,name="yolov11n") print("results: ", results) #s model = YOLO("weights/yolo11s.pt") results = model.train(data='data/self.yaml', epochs=100, device=0,batch=32,workers=0,name="yolov11s") print("results: ", results) #m model = YOLO("weights/yolo11m.pt") results = model.train(data='data/self.yaml', epochs=100, device=0,batch=32,workers=0,name="yolov11m") print("results: ", results) #l model = YOLO("weights/yolo11l.pt") results = model.train(data='data/self.yaml', epochs=100, device=0,batch=32,workers=0,name="yolov11l") print("results: ", results) #x model = YOLO("weights/yolo11x.pt") results = model.train(data='data/self.yaml', epochs=100, device=0,batch=32,workers=0,name="yolov11x") print("results: ", results)

这里我们依次选择n、s、m、l和x五款不同参数量级的模型来进行开发。

这里给出yolov11的模型文件如下:

# Parameters nc: 1 # number of classes scales: # model compound scaling constants, i.e. 'model=yolo11n.yaml' will call yolo11.yaml with scale 'n' # [depth, width, max_channels] n: [0.50, 0.25, 1024] # summary: 319 layers, 2624080 parameters, 2624064 gradients, 6.6 GFLOPs s: [0.50, 0.50, 1024] # summary: 319 layers, 9458752 parameters, 9458736 gradients, 21.7 GFLOPs m: [0.50, 1.00, 512] # summary: 409 layers, 20114688 parameters, 20114672 gradients, 68.5 GFLOPs l: [1.00, 1.00, 512] # summary: 631 layers, 25372160 parameters, 25372144 gradients, 87.6 GFLOPs x: [1.00, 1.50, 512] # summary: 631 layers, 56966176 parameters, 56966160 gradients, 196.0 GFLOPs # YOLO11n backbone backbone: # [from, repeats, module, args] - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 - [-1, 2, C3k2, [256, False, 0.25]] - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8 - [-1, 2, C3k2, [512, False, 0.25]] - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16 - [-1, 2, C3k2, [512, True]] - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32 - [-1, 2, C3k2, [1024, True]] - [-1, 1, SPPF, [1024, 5]] # 9 - [-1, 2, C2PSA, [1024]] # 10 # YOLO11n head head: - [-1, 1, nn.Upsample, [None, 2, "nearest"]] - [[-1, 6], 1, Concat, [1]] # cat backbone P4 - [-1, 2, C3k2, [512, False]] # 13 - [-1, 1, nn.Upsample, [None, 2, "nearest"]] - [[-1, 4], 1, Concat, [1]] # cat backbone P3 - [-1, 2, C3k2, [256, False]] # 16 (P3/8-small) - [-1, 1, Conv, [256, 3, 2]] - [[-1, 13], 1, Concat, [1]] # cat head P4 - [-1, 2, C3k2, [512, False]] # 19 (P4/16-medium) - [-1, 1, Conv, [512, 3, 2]] - [[-1, 10], 1, Concat, [1]] # cat head P5 - [-1, 2, C3k2, [1024, True]] # 22 (P5/32-large) - [[16, 19, 22], 1, Detect, [nc]] # Detect(P3, P4, P5)

实验阶段我们保持了相同的参数设置,等待长时期的训练过程结束之后我们来对以上六款不同参数量级的模型进行纵向的对比分析,如下:

【Precision曲线】
精确率曲线(Precision Curve)是一种用于评估二分类模型在不同阈值下的精确率性能的可视化工具。它通过绘制不同阈值下的精确率和召回率之间的关系图来帮助我们了解模型在不同阈值下的表现。
精确率(Precision)是指被正确预测为正例的样本数占所有预测为正例的样本数的比例。召回率(Recall)是指被正确预测为正例的样本数占所有实际为正例的样本数的比例。
绘制精确率曲线的步骤如下:
使用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的精确率和召回率。
将每个阈值下的精确率和召回率绘制在同一个图表上,形成精确率曲线。
根据精确率曲线的形状和变化趋势,可以选择适当的阈值以达到所需的性能要求。
通过观察精确率曲线,我们可以根据需求确定最佳的阈值,以平衡精确率和召回率。较高的精确率意味着较少的误报,而较高的召回率则表示较少的漏报。根据具体的业务需求和成本权衡,可以在曲线上选择合适的操作点或阈值。
精确率曲线通常与召回率曲线(Recall Curve)一起使用,以提供更全面的分类器性能分析,并帮助评估和比较不同模型的性能。

【Recall曲线】
召回率曲线(Recall Curve)是一种用于评估二分类模型在不同阈值下的召回率性能的可视化工具。它通过绘制不同阈值下的召回率和对应的精确率之间的关系图来帮助我们了解模型在不同阈值下的表现。
召回率(Recall)是指被正确预测为正例的样本数占所有实际为正例的样本数的比例。召回率也被称为灵敏度(Sensitivity)或真正例率(True Positive Rate)。
绘制召回率曲线的步骤如下:
使用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的召回率和对应的精确率。
将每个阈值下的召回率和精确率绘制在同一个图表上,形成召回率曲线。
根据召回率曲线的形状和变化趋势,可以选择适当的阈值以达到所需的性能要求。
通过观察召回率曲线,我们可以根据需求确定最佳的阈值,以平衡召回率和精确率。较高的召回率表示较少的漏报,而较高的精确率意味着较少的误报。根据具体的业务需求和成本权衡,可以在曲线上选择合适的操作点或阈值。
召回率曲线通常与精确率曲线(Precision Curve)一起使用,以提供更全面的分类器性能分析,并帮助评估和比较不同模型的性能。

【mAP0.5】
mAP0.5,也被称为[email protected]或AP50,指的是当Intersection over Union(IoU)阈值为0.5时的平均精度(mean Average Precision)。IoU是一个用于衡量预测边界框与真实边界框之间重叠程度的指标,其值范围在0到1之间。当IoU值为0.5时,意味着预测框与真实框至少有50%的重叠部分。
在计算mAP0.5时,首先会为每个类别计算所有图片的AP(Average Precision),然后将所有类别的AP值求平均,得到mAP0.5。AP是Precision-Recall Curve曲线下面的面积,这个面积越大,说明AP的值越大,类别的检测精度就越高。
mAP0.5主要关注模型在IoU阈值为0.5时的性能,当mAP0.5的值很高时,说明算法能够准确检测到物体的位置,并且将其与真实标注框的IoU值超过了阈值0.5。

【mAP0.5:0.95】
mAP0.5:0.95,也被称为mAP@[0.5:0.95]或AP@[0.5:0.95],表示在IoU阈值从0.5到0.95变化时,取各个阈值对应的mAP的平均值。具体来说,它会在IoU阈值从0.5开始,以0.05为步长,逐步增加到0.95,并在每个阈值下计算mAP,然后将这些mAP值求平均。
这个指标考虑了多个IoU阈值下的平均精度,从而更全面、更准确地评估模型性能。当mAP0.5:0.95的值很高时,说明算法在不同阈值下的检测结果均非常准确,覆盖面广,可以适应不同的场景和应用需求。
对于一些需求比较高的场合,比如安全监控等领域,需要保证高的准确率和召回率,这时mAP0.5:0.95可能更适合作为模型的评价标准。
综上所述,mAP0.5和mAP0.5:0.95都是用于评估目标检测模型性能的重要指标,但它们的关注点有所不同。mAP0.5主要关注模型在IoU阈值为0.5时的性能,而mAP0.5:0.95则考虑了多个IoU阈值下的平均精度,从而更全面、更准确地评估模型性能。

【loss曲线】
在深度学习的训练过程中,loss函数用于衡量模型预测结果与实际标签之间的差异。loss曲线则是通过记录每个epoch(或者迭代步数)的loss值,并将其以图形化的方式展现出来,以便我们更好地理解和分析模型的训练过程。

【F1值曲线】
F1值曲线是一种用于评估二分类模型在不同阈值下的性能的可视化工具。它通过绘制不同阈值下的精确率(Precision)、召回率(Recall)和F1分数的关系图来帮助我们理解模型的整体性能。
F1分数是精确率和召回率的调和平均值,它综合考虑了两者的性能指标。F1值曲线可以帮助我们确定在不同精确率和召回率之间找到一个平衡点,以选择最佳的阈值。
绘制F1值曲线的步骤如下:
使用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的精确率、召回率和F1分数。
将每个阈值下的精确率、召回率和F1分数绘制在同一个图表上,形成F1值曲线。
根据F1值曲线的形状和变化趋势,可以选择适当的阈值以达到所需的性能要求。
F1值曲线通常与接收者操作特征曲线(ROC曲线)一起使用,以帮助评估和比较不同模型的性能。它们提供了更全面的分类器性能分析,可以根据具体应用场景来选择合适的模型和阈值设置。

综合五款不同参数量级模型的开发实验对比结果来看:5款模型没有拉开较为明显的差距,综合对比考虑最终选择使用yolov11m来作为线上推理模型。

接下来看下yolov11m模型的详细情况。

【离线推理实例】

【Batch实例】

【混淆矩阵】

【F1值曲线】

【Precision曲线】

【PR曲线】

【Recall曲线】

【训练可视化】

无人机与AI技术在电动自行车交通监管中的应用,为解决传统监管难题提供了有效途径,大大提高了监管效率和精准度。然而,要实现电动自行车交通的全面、有效管理,还需要政府、企业和社会各方的共同努力。相信在无人机与AI技术的助力下,电动自行车交通监管将迎来新的发展阶段,我们能够构建一个更加安全、有序、畅通的交通环境,让电动自行车真正成为人们出行的得力助手,而不是交通安全的隐患源头。

Read more

双剑破天门:攻防世界Web题解之独孤九剑心法(九)

双剑破天门:攻防世界Web题解之独孤九剑心法(九)

免责声明:用户因使用公众号内容而产生的任何行为和后果,由用户自行承担责任。本公众号不承担因用户误解、不当使用等导致的法律责任 **本文以攻防世界部分题为例进行演示,后续会对攻防世界大部分的web题目进行演示,如果你感兴趣请关注** 目录 一:Supersqli 二:Warmup 三:总结 1.supersqli 2.Warmup 一:Supersqli 打开如下所示,初步筛查这应该是一道SQL注入题 这确实是一道SQL注入 1’ or 1=1 # 那接下来就是查询字段数 字段数为2 1’ order by 2 # 查询数据库 正常的查询发现不行,被过滤了 但是没有过滤分号那就可以堆叠注入联合show 1’;show tables ;# 成功查询到一个特殊的表 1';show columns from `1919810931114514`;# 查询发现此表含flag但select被过滤如何查询flag 利用handler代替select

35道常见的前端vue面试题,零基础入门到精通,收藏这篇就够了

35道常见的前端vue面试题,零基础入门到精通,收藏这篇就够了

来源 | https://segmentfault.com/a/1190000021936876 今天这篇文章给大家分享一些常见的前端vue面试题。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。 对于前端来说,尽管css、html、js是主要的基础知识,但是随着技术的不断发展,出现了很多优秀的mv*框架以及小程序框架。因此,对于前端开发者而言,需要对一些前端框架进行熟练掌握。这篇文章我们一起来聊一聊VUE及全家桶的常见面试问题。 1、请讲述下VUE的MVVM的理解? MVVM 是 Model-View-ViewModel的缩写,即将数据模型与数据表现层通过数据驱动进行分离,从而只需要关系数据模型的开发,而不需要考虑页面的表现,具体说来如下: Model代表数据模型:主要用于定义数据和操作的业务逻辑。 View代表页面展示组件(即dom展现形式):负责将数据模型转化成UI 展现出来。 ViewModel为model和view之间的桥梁:监听模型数据的改变和控制视图行为、处理用户交互。通过双向数据绑定把 View 层和 Model 层连接了起来,而View

一键拯救大模型的前端审美能力 - 使用Frontend-Design Skill提升AI设计水平

# 一键拯救大模型的前端审美能力 ## 前言 目前,在不额外给风格规范/设计系统/示例参考的情况下,拥有前端审美能力的编程模型只有4款: - Gemini 3 Pro - Gemini 3 Flash   - Claude Opus 4.5 - Claude Sonnet 4.5 当我们看到GPT-5.2-Codex等明明其他方面都很厉害,但是唯独前端审美不行的模型时,常常感叹"哀其不幸、怒其不争"。那么,是否有快速提升他们前端审美能力的方法呢? 答案是:**使用 Anthropic 官方提供的 frontend-design skill** ## 什么是 Frontend-Design Skill? Frontend-Design Skill 是 Anthropic 官方提供的一款技能包,可以为所有主流编程大模型(

Qt 前后端通信(QWebChannel Js / C++ 互操作):原理、示例、步骤解说

Qt 前后端通信(QWebChannel Js / C++ 互操作):原理、示例、步骤解说

Qt 提供的 QWebEngineView 是一个基于 Chromium 内核的浏览器组件,通过它,开发者可以使用 HTML、CSS、JavaScript 等技术开发 Web 页面并呈现在 Qt 桌面应用中,但与开发纯 Web 页面不同的是,这些页面通常需要和 应用中的其他组件交互,例如获取后端数据进行渲染、将前端用户指令传达给后端执行等,这将不可避免地涉及到前端 Js 和 后端 C++ 之间的交互问题,而 Qt 为此给出的解决方案就是 QWebChannel,通过 QWebChannel 前端 Web 页面和与后端 C++ 程序实现自然而顺畅的交互,甚至前后端的操作风格都极为一致。本文我们将细致地介绍QWebChannel 前后端交互的原理,通过四个详实的示例程序讲解每一步重要的操作步骤,通过本文,你将对 QWebChannel 有一个全面而深入的了解。 1. 工作原理