
YOLO 视频 AI 识别算法管理平台核心是 YOLO v8 神经网络模型的推理运算,推理运算涉及操作 CPU 内存、GPU 内存、GPU 并行计算等环节,这些环节可通过 Python 或 C++ 来实现,每隔 1 分钟将推理结果信息和对应的图片推送到文件服务器 MinIO 和消息队列 RocketMQ,便于开发者获取到推理结果进行业务开发。同时支持基于 ONNX 的推理运算和基于 Tensorrt 的加速推理运算两种方式,只需在调用时传递不同参数即可。
YOLO 视频 AI 识别算法管理平台支持 Linux 和 Windows 环境,代码自动判断运行的环境并执行对应的.bat 或.sh 脚本文件以启动 AI 模型推理,包含前端完整代码和后端完整代码,开箱即用,为 Java 开发者训练、部署、使用 AI 模型提供了参考。可实现人、车、火灾烟雾、河道漂浮物、道路裂痕等视频的实时识别,并将识别结果通过 FFmpeg 推流到 ZLMediaKit 流媒体服务器,使得在 Web 页面上可以同时查看原始视频和实时计算视频。
YOLO(You Only Look Once)是一种基于深度神经网络的高效、实时的目标检测算法。它将目标检测任务视为一个回归问题,将图像分为多个网格,并预测每个网格中是否包含对象以及对象的边界框和类别,只需要单次前向传播就可以同时完成目标检测和分类,因此具有极高的检测速度,被广泛应用于计算机视觉领域,包括实时视频分析、自动驾驶、安防监控、智能交通、缺陷检测等。
YOLO 由网络架构、基础网络、特征提取层、网格划分、边界框预测、非最大抑制和损失函数等组成,从而实现了高效而准确的实时目标检测。YOLO 目标检测任务分为四步,分割(Segmentation):定位像素属于哪个目标物或场景;定位(Localization):定位目标位置;分类(Classification):判定目标类别;检测(Detection):判定目标物体是什么。

视频 AI 识别算法平台架构

YOLO 视频 AI 识别算法管理平台结合了 SpringBoot 开发 Web 项目的优势、Python 训练调试 AI 模型的优势、C++ 在与底层 GPU 硬件交互和推理运算方面的性能优势、Shell 脚本便于调用 Linux 服务器资源的优势,将不同语言综合一起协调工作,并将项目运行在 Docker 容器中以便于运维和管理,让 Java 开发者能够方便训练、部署、使用 AI 识别算法模型。
开发环境
- IDE: IDEA、Pycharm
- JDK: 1.8
- Build Tool: Maven
- Version Control: Gitlab
- Data Env: Anaconda3
软件架构
Nginx + SpringBoot + Vue + Shell + Python
技术栈详情
- 前端框架:Vue + Nodejs
- Web 框架:SpringBoot
- Orm 框架:MyBatis3
- 数据库:Mysql、Redis、MongoDB
- 消息队列:RocketMq
- 文件服务:Minio
- 代码生成:FreeMarker 自动生成后端 Java 代码和前端 Vue 代码
- CPU 设备:Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz
- GPU 设备:Nvidia Tesla T4 16G
- AI 模型:Yolov8n/Yolov8m




