基于 YOLOv8/v11 与 LLM 的 Web 视觉检测及情感分析系统

版本更新说明
本次更新主要聚焦于提升系统性能与多模态交互能力:
- 前端优化:导航栏调整为侧边栏布局,视频流传输改用 WebSocket 框架以降低延迟。
- 模型支持:全面兼容 YOLOv8、YOLOv11 系列模型,支持分类、目标检测、分割、OBB(旋转框)及关键点检测任务。
- 双模型联动:新增双模型联合检测机制。例如在人脸表情识别场景中,先由检测模型锁定人脸区域,再输入表情分类模型进行细粒度分析,显著提升复杂场景下的准确率。
- LLM 集成:引入大语言模型智能分析模块,实现从'视觉感知'到'智能分析'再到'对话问答'的闭环。
项目简介
当前人工智能正迈向通用化(AGI),单纯的视觉检测已难以满足复杂业务需求。本项目将 YOLO 目标检测模型与 DeepSeek 等大语言模型(LLM)相结合,采用 Django(后端)+ Vue3(前端)技术栈,构建了一个具备全链路能力的 AI 视觉助手 Web 系统。
该系统不仅支持单模型检测,还支持双模型联合识别,可灵活替换 .pt 权重文件以适应不同场景。无论是科研探索、毕业设计还是工业落地,都能提供强有力的支撑。
核心功能特性
- CV + LLM 多模态融合:YOLO 负责精准提取画面信息(如人数、物品状态),LLM 负责生成自然语言报告、安全预警或业务建议。系统内嵌 AI 智能助手聊天界面,用户可直接针对检测画面提问(例如:'画面中有几个人没戴安全帽?应该采取什么措施?')。
- 灵活的模型配置:支持单模型目标检测与图像分类,也支持双模型联合识别。前端实时渲染多维度标签,支持本地图片、视频流及外接摄像头实时检测。
- 丰富的参数调节:前端支持动态切换模型,通过滑块实时调节置信度 (Confidence) 和交并比 (IoU),并支持结果保存。
典型应用场景
本系统具有高度通用性,只需更换对应的权重文件即可适配以下场景:
- 智能情感陪伴与分析:实时捕捉面部表情,结合 LLM 根据情绪状态提供对话疏导。
- 智慧工地安全巡检:YOLO 抓拍安全帽/反光衣违规,LLM 自动生成安全日报。
- 智慧停车与计费:车辆与车牌检测联动,支持自然语言查询停车时长与费用。
- 异常行为监控:结合跌倒、打架等行为识别,大模型第一时间分析严重程度并生成预案。
目标检测任务
涵盖智慧工地、电网巡检、交通管理、农业病虫害、森林防火、工业质检等多个领域,实现检测与智能业务预警的闭环。
图像分类任务
包括中药材识别、植物科普、垃圾分类、农业病害诊断、野生动物保护、情绪感知、医疗诊断及自动驾驶标志识别等。
关键点检测与姿态估计
应用于智慧教育(课堂行为分析)、养老医疗(跌倒检测与康复评估)、体育竞技动作分析及疲劳驾驶监测等。
旋转目标检测 (OBB)
适用于遥感测绘中的船舶检测、智慧城市停车场车辆倾斜检测、PCB 元器件缺陷检测及文本识别等密集倾斜目标场景。
目标分割任务
实现像素级精细轮廓提取,常用于医学影像辅助分析、自动驾驶高精地图构建、智慧农业果实采摘定位及工业表面缺陷检测等。






















