DeepFace深度学习库+OpenCV实现——情绪分析器

DeepFace深度学习库+OpenCV实现——情绪分析器

目录

应用场景

实现组件

1. 硬件组件

2. 软件库与依赖

3. 功能模块

代码详解(实现思路)

导入必要的库

打开摄像头并初始化变量

主循环

FPS计算

情绪分析及结果展示

显示FPS和图像

退出条件

​编辑

完整代码

效果展示

自然的

开心的

伤心的

恐惧的

惊讶的



 效果展示

自然的

开心的

伤心的

恐惧的

惊讶的


 



应用场景

        应用场景比较广泛,尤其是在需要了解和分析人类情感反应的场合。:

  1. 心理健康评估:在心理健康领域,可以通过长期监控和分析一个人的情绪变化来辅助医生进行诊断或治疗效果评估。
  2. 用户体验研究:在产品设计、广告制作或网站开发过程中,通过观察用户在使用过程中的情绪反应,来优化产品的用户体验。
  3. 互动娱乐:在游戏或虚拟现实应用中,根据玩家的情绪状态动态调整游戏难度或故事情节,以增加沉浸感和互动性。
  4. 安全监控:在公共安全领域,通过情绪识别技术可以早期发现异常行为或潜在威胁,例如在机场安检区域或者大型公共活动场所。
  5. 教育与培训:帮助教师了解学生在学习过程中的情绪状态,以便及时调整教学方法;也可用于职业培训中,通过模拟不同情境下的情绪反应来进行针对性训练。
  6. 智能助手:集成到智能家居系统或个人助理设备中,让设备能够感知用户的情绪状态,并据此提供更加个性化的服务或响应。
  7. 疲劳驾驶预测:对于司机情绪的分析,可以监控和作为一种影响因子判断出出司机的驾驶状态,以至于安全的驾驶。

        总之,随着人工智能技术的发展,情绪识别作为一种重要的交互方式,在许多领域都有着巨大的潜力和广阔的应用前景。


实现组件

1. 硬件组件

  • 摄像头:用于捕捉实时视频流,通常为电脑内置的摄像头或外接USB摄像头。

2. 软件库与依赖

  • OpenCV (cv2):一个开源的计算机视觉和机器学习软件库。它提供了大量的图像处理和计算机视觉算法,这里主要用于捕获摄像头视频流、处理图像以及在图像上绘制矩形框和文字。
  • time:Python标准库的一部分,用于计算时间间隔,进而计算FPS(每秒帧数)。
  • numpy (np):虽然在这段代码中没有直接使用,但它是进行科学计算的基础库,通常与OpenCV一起用于更复杂的图像处理任务。
  • DeepFace:这是一个深度学习库,专门用于面部识别及其相关任务(如年龄、性别、情绪等属性的预测)。在这个应用中,DeepFace被用来对每一帧视频中的人脸进行情绪分析。

3. 功能模块

  • 视频捕捉与处理模块
    • 使用cv2.VideoCapture(0)打开摄像头,并通过循环不断读取视频帧。
    • 对每一帧图像进行处理,包括计算FPS、进行情绪分析以及在图像上标注结果。
  • FPS计算模块
    • 利用time.time()获取当前时间戳,通过计算连续两帧之间的时间差来计算瞬时FPS,并采用滑动平均方法平滑FPS值。
  • 情绪分析模块
    • 调用DeepFace.analyze()函数对每一帧中的所有人脸进行情绪分析。分析结果包含每个人脸的位置、主导情绪及置信度。
  • 结果显示模块
    • 使用OpenCV提供的绘图函数(如cv2.rectangle()cv2.putText())在视频帧上标记出人脸位置、显示情绪信息及置信度,并展示当前的FPS值。
  • 用户交互模块
    • 通过监听键盘输入(cv2.waitKey(1)),允许用户按下q键退出程序。

代码详解(实现思路)

        主要是通过摄像头捕捉实时视频流,然后使用深度学习模型对捕捉到的每一帧进行情绪分析,然后在视频上标记出检测到的情绪和置信度,并显示当前的FPS(每秒帧数)。下面是对代码各个部分的详细解释:

导入必要的库

import cv2 import time import numpy as np from deepface import DeepFace
  • cv2:OpenCV库,用于处理图像和视频流。
  • time:用于计算时间间隔,进而计算FPS。
  • numpy:虽然在这段代码中没有直接使用,但通常与OpenCV一起用于图像处理。
  • DeepFace:一个基于深度学习的面部识别和分析库。

打开摄像头并初始化变量

cap = cv2.VideoCapture(0) prev_time = time.time() fps = 0 alpha = 0.9
  • cv2.VideoCapture(0):打开默认摄像头(0代表第一个摄像头设备)。
  • prev_time 和 fps:用于计算FPS的变量。prev_time保存上一帧的时间戳,而fps保存当前帧率。
  • alpha:用于滑动平均计算FPS的权重值。

主循环

while True: ret, frame = cap.read() if not ret: break ... cap.release() cv2.destroyAllWindows()
  • 这个无限循环不断从摄像头读取帧(cap.read())。如果读取失败(ret为False),则退出循环。
  • 循环体内部实现了帧的获取、FPS计算、情绪分析、结果绘制以及画面显示。
FPS计算
current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps
  • 计算自上次迭代以来经过的时间(delta_time),然后根据这个时间差计算瞬时FPS(instant_fps)。
  • 使用滑动平均更新总体FPS(fps)。
情绪分析及结果展示
result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) ...
  • 对每一帧调用DeepFace.analyze()方法进行情绪分析。actions=['emotion']指定只执行情绪分析。
  • 遍历返回的结果,在画面上标出人脸的位置(cv2.rectangle)和识别出的情绪信息(cv2.putText)。
显示FPS和图像
cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) cv2.imshow("Emotion Detection", frame)
  • 在图像上显示当前的FPS。
  • 使用cv2.imshow()显示带有标注的图像。
退出条件
if cv2.waitKey(1) & 0xFF == ord('q'): break
  • 如果按下键盘上的q键,则退出循环结束程序。

最后,释放摄像头资源(cap.release())并关闭所有窗口(cv2.destroyAllWindows())。


完整代码

import cv2 import time import numpy as np from deepface import DeepFace # 打开摄像头 cap = cv2.VideoCapture(0) # FPS 计算参数 prev_time = time.time() fps = 0 alpha = 0.9 # 滑动平均权重,数值越大,FPS 越平稳 while True: ret, frame = cap.read() if not ret: break # 计算 FPS current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps # 计算滑动平均 FPS try: # 进行表情识别 result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) for face in result: x, y, w, h = face['region']['x'], face['region']['y'], face['region']['w'], face['region']['h'] emotion = face['dominant_emotion'] confidence = face['emotion'][emotion] # 获取表情的置信度 # 绘制人脸矩形框 cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2) # 在人脸上方显示情绪信息 text = f'{emotion} ({confidence:.2f}%)' cv2.putText(frame, text, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 255, 0), 2) except Exception as e: print("无法检测到人脸:", e) # 显示 FPS(平滑更新) cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) # 显示图像 cv2.imshow("Emotion Detection", frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() 

总结

        核心在于结合了OpenCV进行视频处理和DeepFace进行面部情绪分析的能力。通过这些组件,实现从摄像头实时捕捉视频、分析视频中人物的情绪状态并在视频画面上直观地展示分析结果的功能。

        这不仅展示了如何利用现有的AI库快速构建实用的应用程序,也为进一步开发基于情感识别的复杂系统提供了基础框架或者是组件。

Read more

算法竞赛备考冲刺必刷题(C++) | AcWing 1152 格雷码

算法竞赛备考冲刺必刷题(C++) | AcWing 1152 格雷码

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来,并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构,旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。 欢迎大家订阅我的专栏:算法题解:C++与Python实现! 附上汇总贴:算法竞赛备考冲刺必刷题(C++) | 汇总 【题目来源】 AcWing:1152. 格雷码 - AcWing题库 【题目描述】 通常,人们习惯将所有 n n n 位二进制串按照字典序排列,例如所有 2 2 2 位二进制串按字典序从小到大排列为: 00 , 01 , 10 , 11 00,01,10,11 00,01,10,11。 格雷码(Gray Code)是一种特殊的 n

By Ne0inhk
【C++开源库使用】调用开源库STB中的stbi_load_from_memory加载图片文件,进行灰化处理,然后调用stbi_write_png或stbi_write_jpg将灰化图片保存到文件中

【C++开源库使用】调用开源库STB中的stbi_load_from_memory加载图片文件,进行灰化处理,然后调用stbi_write_png或stbi_write_jpg将灰化图片保存到文件中

目录 1、图片灰化的实现思路 2、开源STB库下载 3、将图片文件的内容读到buffer中 4、将buffer中存放的图片文件数据传入到stbi_load_from_memory接口中,然后对返回的图片颜色值进行灰化处理 5、调用stbi_write_png或stbi_write_jpg接口将灰化后的图片数据保存成图片文件 6、图片灰化的完整代码        前一篇文章我们讲到了使用libcurl库发http/https请求去下载用户头像文件(文章链接:https://blog.ZEEKLOG.net/chenlycly/article/details/149175549),本篇文章则是同个SDK项目的后续需求中涉及到的功能。第三方厂商要求,对于不在线的人员,要显示灰化的头像。经研究决定使用开源STB库辅助实现图片灰化,调用STB开源库中的stbi_load_from_memory、stbi_write_png或stbi_write_jpg等接口。本文详细讲述一下实现过程,以供大家借鉴或参考。

By Ne0inhk

从 std 到 STL:C++ 标准库到底是什么?(附 Java 类比)

很多初学 C++ 的同学都会有一个疑问: std 是什么?STL 是什么?STL 和 std 是一个东西吗?STL 是不是就是数据结构? 这篇文章一次讲清楚。 一、什么是 std? std 是: standard 的缩写 在 C++ 中,它表示: C++ 标准库的命名空间(namespace std) 也就是说: 所有标准库内容都在这个命名空间里。 例如: std::cout std::string std::vector std::map std::thread 这些都属于: namespace std ⚠ 注意: std 不是功能模块,它只是“名字空间”

By Ne0inhk
C++ 中打开文件的多种方式及相关流类

C++ 中打开文件的多种方式及相关流类

C++学习: https://blog.ZEEKLOG.net/2301_80220607/category_12805124.html?spm=1001.2014.3001.5482 前言: 打开一个文件的方式都有哪些,都可以通过哪些流来获取它? 在 C++ 中,打开文件可以通过多种流类实现,每种方式都有其特定的用途和特点。以下是详细的分类和说明: 目录 1. 使用标准文件流类( ) 1.1 ofstream - 输出文件流(写入) 1.2 ifstream - 输入文件流(读取) 1.3 fstream - 双向文件流(读写) 2. 使用 C 风格文件操作(

By Ne0inhk