基于 YOLOv8/v11 与 LLM 的 Web 视觉检测及情感分析系统

系统界面演示

版本更新说明

本次更新主要聚焦于提升系统性能与多模态交互能力：

前端优化：导航栏调整为侧边栏布局，视频流传输改用 WebSocket 框架以降低延迟。
模型支持：全面兼容 YOLOv8、YOLOv11 系列模型，支持分类、目标检测、分割、OBB（旋转框）及关键点检测任务。
双模型联动：新增双模型联合检测机制。例如在人脸表情识别场景中，先由检测模型锁定人脸区域，再输入表情分类模型进行细粒度分析，显著提升复杂场景下的准确率。
LLM 集成：引入大语言模型智能分析模块，实现从'视觉感知'到'智能分析'再到'对话问答'的闭环。

项目简介

当前人工智能正迈向通用化（AGI），单纯的视觉检测已难以满足复杂业务需求。本项目将 YOLO 目标检测模型与 DeepSeek 等大语言模型（LLM）相结合，采用 Django（后端）+ Vue3（前端）技术栈，构建了一个具备全链路能力的 AI 视觉助手 Web 系统。

该系统不仅支持单模型检测，还支持双模型联合识别，可灵活替换 .pt 权重文件以适应不同场景。无论是科研探索、毕业设计还是工业落地，都能提供强有力的支撑。

核心功能特性

CV + LLM 多模态融合：YOLO 负责精准提取画面信息（如人数、物品状态），LLM 负责生成自然语言报告、安全预警或业务建议。系统内嵌 AI 智能助手聊天界面，用户可直接针对检测画面提问（例如：'画面中有几个人没戴安全帽？应该采取什么措施？'）。
灵活的模型配置：支持单模型目标检测与图像分类，也支持双模型联合识别。前端实时渲染多维度标签，支持本地图片、视频流及外接摄像头实时检测。
丰富的参数调节：前端支持动态切换模型，通过滑块实时调节置信度 (Confidence) 和交并比 (IoU)，并支持结果保存。

典型应用场景

本系统具有高度通用性，只需更换对应的权重文件即可适配以下场景：

智能情感陪伴与分析：实时捕捉面部表情，结合 LLM 根据情绪状态提供对话疏导。
智慧工地安全巡检：YOLO 抓拍安全帽/反光衣违规，LLM 自动生成安全日报。
智慧停车与计费：车辆与车牌检测联动，支持自然语言查询停车时长与费用。
异常行为监控：结合跌倒、打架等行为识别，大模型第一时间分析严重程度并生成预案。

目标检测任务

涵盖智慧工地、电网巡检、交通管理、农业病虫害、森林防火、工业质检等多个领域，实现检测与智能业务预警的闭环。

图像分类任务

包括中药材识别、植物科普、垃圾分类、农业病害诊断、野生动物保护、情绪感知、医疗诊断及自动驾驶标志识别等。

关键点检测与姿态估计

应用于智慧教育（课堂行为分析）、养老医疗（跌倒检测与康复评估）、体育竞技动作分析及疲劳驾驶监测等。

旋转目标检测 (OBB)

适用于遥感测绘中的船舶检测、智慧城市停车场车辆倾斜检测、PCB 元器件缺陷检测及文本识别等密集倾斜目标场景。

目标分割任务

实现像素级精细轮廓提取，常用于医学影像辅助分析、自动驾驶高精地图构建、智慧农业果实采摘定位及工业表面缺陷检测等。

模块	界面展示
用户端—登录
用户端—注册
双模型检测任务
分类任务
关键点任务
人脸检测任务
摄像头检测
OBB 旋转框任务
检测记录
AI 模块
AI 助手模块
个人中心
修改密码
参数设置
历史数据管理
用户管理
新增用户
编辑页面
管理端登录

基于 YOLOv8/v11 与 LLM 的 Web 视觉检测及情感分析系统