DeepFace深度学习库+OpenCV实现——情绪分析器

DeepFace深度学习库+OpenCV实现——情绪分析器

目录

应用场景

实现组件

1. 硬件组件

2. 软件库与依赖

3. 功能模块

代码详解(实现思路)

导入必要的库

打开摄像头并初始化变量

主循环

FPS计算

情绪分析及结果展示

显示FPS和图像

退出条件

​编辑

完整代码

效果展示

自然的

开心的

伤心的

恐惧的

惊讶的



 效果展示

自然的

开心的

伤心的

恐惧的

惊讶的


 



应用场景

        应用场景比较广泛,尤其是在需要了解和分析人类情感反应的场合。:

  1. 心理健康评估:在心理健康领域,可以通过长期监控和分析一个人的情绪变化来辅助医生进行诊断或治疗效果评估。
  2. 用户体验研究:在产品设计、广告制作或网站开发过程中,通过观察用户在使用过程中的情绪反应,来优化产品的用户体验。
  3. 互动娱乐:在游戏或虚拟现实应用中,根据玩家的情绪状态动态调整游戏难度或故事情节,以增加沉浸感和互动性。
  4. 安全监控:在公共安全领域,通过情绪识别技术可以早期发现异常行为或潜在威胁,例如在机场安检区域或者大型公共活动场所。
  5. 教育与培训:帮助教师了解学生在学习过程中的情绪状态,以便及时调整教学方法;也可用于职业培训中,通过模拟不同情境下的情绪反应来进行针对性训练。
  6. 智能助手:集成到智能家居系统或个人助理设备中,让设备能够感知用户的情绪状态,并据此提供更加个性化的服务或响应。
  7. 疲劳驾驶预测:对于司机情绪的分析,可以监控和作为一种影响因子判断出出司机的驾驶状态,以至于安全的驾驶。

        总之,随着人工智能技术的发展,情绪识别作为一种重要的交互方式,在许多领域都有着巨大的潜力和广阔的应用前景。


实现组件

1. 硬件组件

  • 摄像头:用于捕捉实时视频流,通常为电脑内置的摄像头或外接USB摄像头。

2. 软件库与依赖

  • OpenCV (cv2):一个开源的计算机视觉和机器学习软件库。它提供了大量的图像处理和计算机视觉算法,这里主要用于捕获摄像头视频流、处理图像以及在图像上绘制矩形框和文字。
  • time:Python标准库的一部分,用于计算时间间隔,进而计算FPS(每秒帧数)。
  • numpy (np):虽然在这段代码中没有直接使用,但它是进行科学计算的基础库,通常与OpenCV一起用于更复杂的图像处理任务。
  • DeepFace:这是一个深度学习库,专门用于面部识别及其相关任务(如年龄、性别、情绪等属性的预测)。在这个应用中,DeepFace被用来对每一帧视频中的人脸进行情绪分析。

3. 功能模块

  • 视频捕捉与处理模块
    • 使用cv2.VideoCapture(0)打开摄像头,并通过循环不断读取视频帧。
    • 对每一帧图像进行处理,包括计算FPS、进行情绪分析以及在图像上标注结果。
  • FPS计算模块
    • 利用time.time()获取当前时间戳,通过计算连续两帧之间的时间差来计算瞬时FPS,并采用滑动平均方法平滑FPS值。
  • 情绪分析模块
    • 调用DeepFace.analyze()函数对每一帧中的所有人脸进行情绪分析。分析结果包含每个人脸的位置、主导情绪及置信度。
  • 结果显示模块
    • 使用OpenCV提供的绘图函数(如cv2.rectangle()cv2.putText())在视频帧上标记出人脸位置、显示情绪信息及置信度,并展示当前的FPS值。
  • 用户交互模块
    • 通过监听键盘输入(cv2.waitKey(1)),允许用户按下q键退出程序。

代码详解(实现思路)

        主要是通过摄像头捕捉实时视频流,然后使用深度学习模型对捕捉到的每一帧进行情绪分析,然后在视频上标记出检测到的情绪和置信度,并显示当前的FPS(每秒帧数)。下面是对代码各个部分的详细解释:

导入必要的库

import cv2 import time import numpy as np from deepface import DeepFace
  • cv2:OpenCV库,用于处理图像和视频流。
  • time:用于计算时间间隔,进而计算FPS。
  • numpy:虽然在这段代码中没有直接使用,但通常与OpenCV一起用于图像处理。
  • DeepFace:一个基于深度学习的面部识别和分析库。

打开摄像头并初始化变量

cap = cv2.VideoCapture(0) prev_time = time.time() fps = 0 alpha = 0.9
  • cv2.VideoCapture(0):打开默认摄像头(0代表第一个摄像头设备)。
  • prev_time 和 fps:用于计算FPS的变量。prev_time保存上一帧的时间戳,而fps保存当前帧率。
  • alpha:用于滑动平均计算FPS的权重值。

主循环

while True: ret, frame = cap.read() if not ret: break ... cap.release() cv2.destroyAllWindows()
  • 这个无限循环不断从摄像头读取帧(cap.read())。如果读取失败(ret为False),则退出循环。
  • 循环体内部实现了帧的获取、FPS计算、情绪分析、结果绘制以及画面显示。
FPS计算
current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps
  • 计算自上次迭代以来经过的时间(delta_time),然后根据这个时间差计算瞬时FPS(instant_fps)。
  • 使用滑动平均更新总体FPS(fps)。
情绪分析及结果展示
result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) ...
  • 对每一帧调用DeepFace.analyze()方法进行情绪分析。actions=['emotion']指定只执行情绪分析。
  • 遍历返回的结果,在画面上标出人脸的位置(cv2.rectangle)和识别出的情绪信息(cv2.putText)。
显示FPS和图像
cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) cv2.imshow("Emotion Detection", frame)
  • 在图像上显示当前的FPS。
  • 使用cv2.imshow()显示带有标注的图像。
退出条件
if cv2.waitKey(1) & 0xFF == ord('q'): break
  • 如果按下键盘上的q键,则退出循环结束程序。

最后,释放摄像头资源(cap.release())并关闭所有窗口(cv2.destroyAllWindows())。


完整代码

import cv2 import time import numpy as np from deepface import DeepFace # 打开摄像头 cap = cv2.VideoCapture(0) # FPS 计算参数 prev_time = time.time() fps = 0 alpha = 0.9 # 滑动平均权重,数值越大,FPS 越平稳 while True: ret, frame = cap.read() if not ret: break # 计算 FPS current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps # 计算滑动平均 FPS try: # 进行表情识别 result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) for face in result: x, y, w, h = face['region']['x'], face['region']['y'], face['region']['w'], face['region']['h'] emotion = face['dominant_emotion'] confidence = face['emotion'][emotion] # 获取表情的置信度 # 绘制人脸矩形框 cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2) # 在人脸上方显示情绪信息 text = f'{emotion} ({confidence:.2f}%)' cv2.putText(frame, text, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 255, 0), 2) except Exception as e: print("无法检测到人脸:", e) # 显示 FPS(平滑更新) cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) # 显示图像 cv2.imshow("Emotion Detection", frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() 

总结

        核心在于结合了OpenCV进行视频处理和DeepFace进行面部情绪分析的能力。通过这些组件,实现从摄像头实时捕捉视频、分析视频中人物的情绪状态并在视频画面上直观地展示分析结果的功能。

        这不仅展示了如何利用现有的AI库快速构建实用的应用程序,也为进一步开发基于情感识别的复杂系统提供了基础框架或者是组件。

Read more

【STL源码剖析】从源码看 list:从迭代器到算法

【STL源码剖析】从源码看 list:从迭代器到算法

半桔:个人主页  🔥 个人专栏: 《Linux手册》《手撕面试算法》《C++从入门到入土》 🔖源码之前,了不秘密。 文章目录 * 前言 * 一. list 概述 * 二. list 的节点 * 三. list 迭代器 * 3.1 定义 * 3.2 构造 * 3.3 重载 * 四. list 数据结构 * 五. list 的构造和内存管理 * 六. list 的接口 本文并不适合STL初学者。对于那些熟练掌握 C++ 模板和 STL 的日常使用,理解内存分配与对象生命周期,并且有扎实的数据结构基础,希望深刻了解STL实现细节,从而得以提升对STL的扩充能力,或是希望藉由观察STL源代码,学习世界一流程序员身手,

By Ne0inhk
【C++】STL之list模拟实现:关于链表容器的双向迭代器你知道多少?

【C++】STL之list模拟实现:关于链表容器的双向迭代器你知道多少?

前言: 前面的博客中我已经介绍了STL核心容器之一的list相关接口的使用,今天我们就从底层出发,来模拟实现一下list的那些核心接口函数。同时,也来感受一下list的双向迭代器到底与string和vector的随机迭代器有哪些区别? list容器功能接口介绍:https://blog.ZEEKLOG.net/Miun123/article/details/151685386?spm=1001.2014.3001.5502 废话不多说,我们直接进入今天的正题👇️👇️👇️ list容器深度剖析及模拟实现 我们想要模拟实现list容器,那就要理解list容器的底层结构。前面的博客已经提到,其本质就是一个双向链表,所以,成员变量就应该包含一个记录头节点的指针,以及记录有效节点个数的变量。同时,为了list容器可以满足不同类型的数据,我们将所有的类实现为类模板。 1、定义节点结构 struct创建的类默认所有的成员但是公开的,而节点结构就需要公开被list访问。 template<class T> struct list_node { // 成员变量 T _da

By Ne0inhk
排序--数据结构初阶(4)(C/C++)

排序--数据结构初阶(4)(C/C++)

文章目录 * 前言 * 理论部分: * 1.直接插入排序 * 2.希尔排序 * 3.直接选择排序 * 4.堆排序 * 5.冒泡排序 * 6.快速排序 * 归并排序 * 非比较排序 * 计数排序 * 作业部分 前言 这是数据结构初阶的最后一期,虽然来说在C++的库函数里面有sort函数可以代替这里所有的方法,并且时间复杂度也是优于他们的,但是sort函数是由他们写出来的,因此,还是是有必要学习一下的 理论部分: 这里的代码实现都是按升序来的 排序的话建议先写单趟再写整体 这些排序在两数相等的时候一般是不进行操作的(一般这么写) 1.直接插入排序 就是目前在最后的那个数跟前面每个数比,看看要插哪 时间复杂度:O(n2) 最好的情况下是O(n) 在小段小段有序时有极大的优势(相对于选择排序跟冒泡排序) 代码实现: void InsertSort(int* a, int n)

By Ne0inhk
大模型应用:最优路径规划实践:A*算法找最优解,大模型做自然语言解释.91

大模型应用:最优路径规划实践:A*算法找最优解,大模型做自然语言解释.91

一、引言         算法是个很有意义的课题,尽管大模型让我们不需要像以前学习机器学习那样,需要很深的数学基础,但结合算法来应用大模型确实是个很有趣的事情,传统算法经过数十年发展,已在路径规划、优化计算等领域达到极高的精确度;另一方面,大语言模型的崛起让人机交互变得前所未有的自然流畅。然而,一个不容忽视的现实是:再精确的算法,如果用户看不懂、不会用,就只是实验室里的玩具;再流畅的表达,如果缺乏技术可靠性,就只是华丽的空谈。         想象这样一个场景:导航系统为你计算出了一条理论上最优的路线,却只能用一串坐标告诉你怎么走;或者,一个能言善道的助手热情地为你指路,却把你带进了死胡同。这两种情况,本质上都是技术能力与用户体验之间的断裂。这种断裂并非偶然,而是单一技术路线的固有局限。算法擅长计算却不善表达,模型善于沟通却难以精确,各有所长,也各有所短。因此,真正的突破不在于让某一方变得更强大,而在于让两者形成互补协作的关系,用各自的长处弥补对方的短板。         这是我们今天想探讨得A*算法与大模型融合的核心价值所在。A*算法如同精密的"空间计算大脑",保证路径的数学最

By Ne0inhk