基于 YOLO 与大模型的无人机河道智能巡检系统
项目概述
本系统旨在构建一套结合改进 YOLO 深度学习模型与 DeepSeek/Qwen 大语言模型的河道环境智能检测与分析平台。通过计算机视觉技术识别河道目标,并利用自然语言处理能力生成专业分析报告,为河道治理、环境保护提供智能化支持。系统支持单张图片、批量图片、视频文件及实时摄像头等多种输入方式,实现了从环境检测到智能建议的完整闭环。

核心功能特性
多场景检测支持
系统全面覆盖多种输入模式,适应不同作业需求:
- 单图检测:支持拖拽上传或文件选择,实时预览处理进度。
- 批量检测:支持文件夹压缩上传(JSZip),后台自动解压并逐张处理,结果可打包下载。
- 视频检测:支持 MP4、AVI 等格式,逐帧检测标注,输出带框视频或 MJPEG 实时流。
- 实时摄像:接入 USB 或网络摄像头,低延迟实时标注,支持录像保存。
检测对象范围
针对河道环境特点,系统可精准识别以下目标:
- 漂浮物与垃圾:塑料瓶、塑料袋、泡沫等。
- 水生植物:水葫芦、藻类、水草过度生长情况。
- 污染物:油污、化学污染物、浑浊水体。
- 设施状态:护岸、堤坝、桥梁、排污口等。
- 生物与异常:鱼类、鸟类、非法排污、违规捕捞等行为。

系统架构设计
系统采用三层架构设计,确保高内聚低耦合:
- 前端展示层:基于 Vue3 + Element Plus,负责用户交互、实时结果可视化及历史记录管理。
- 业务逻辑层:Spring Boot 处理用户管理与数据存储,Flask 中台负责模型调用与 AI 分析接口,任务调度由后端统一协调。
- 深度学习层:PyTorch 框架下的改进 YOLO 模型,提供高效推理服务,支持模型重训练与优化。

关键技术集成
- 实时通信:SocketIO 实现前后端消息传递与进度反馈。
- 视频处理:FFmpeg 用于转码与流处理。
- 数据存储:MySQL 存储用户数据与检测记录。
- :集成 DeepSeek/Qwen API 进行智能分析。






