【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

前言

本文主要介绍我最近开发的一个个人实战项目,“基于深度学习的人脸门禁+ IPC 智能安防监控系统”,全程满帧流畅运行。这个项目我目前全网搜了一圈,还没发现有相关类型的开源项目。这个项目只要稍微改进下,就可以变成市面上目前流行的三款产品,人脸识别门禁系统、IPC 安防和 NVR。在最下面会有视频演示。

本项目适用于瑞芯微 Rockchip 系列的板端,开源链接在文章最下面。

功能

人脸门禁系统

  • 人靠近自动亮屏,人走自动息屏
  • 支持人脸识别
  • 支持录入人脸,并进行人脸配对(极速配对 < 0.2S)

IPC 智能安防监控系统

  • 支持通过 onvif 实时查看摄像头画面
  • 支持实时目标检测(支持高达80种物体检测)
  • 支持录像
  • 支持检测到人时自动录像
  • 支持检测到人时自动报警

用到的硬件

1738765194618.jpg
  • 野火鲁班猫4 RK3588S2
  • IMX415 800W 4k 摄像头
  • RTL8822CE Wifi+BT
  • mipi LCD RGB 7寸 1024×600 触摸屏
  • 人体红外检测 SR501:通过 GPIO 读取相应数值,用于判断是否有人靠近
  • 128×32 OLED屏:通过 I2C 通信显示画面内容,用于显示人脸检测结果
  • 蓝牙音箱

用到的深度学习模型

  • yolo11:用于实时目标检测
  • retinaFace:用于人脸检测
  • facenet:用于人脸特征提取

模型需要经过转换和量化,并且进行精度评估,如果不知道如何在 Rockchip 平台进行模型转换的同学,可以参考我这篇文章:《瑞芯微 Rockchip 系列 RK3588 主流深度学习框架模型转成 rknn 模型教程》

用到的技术栈

  • C++
  • RKNN:用于在 Rockchip 上进行 NPU 推理
  • FFmpeg:用于音视频编解码,使用了 ffmpeg-rockchip 库进行 MPP 硬件编解码,提高编解码速度
  • Opencv:用于视频帧处理
  • LVGL:流行的 GUI 框架
  • Bluez-Alsa:用于连接蓝牙音箱并播放音频
  • Onvif:一个流行的 IP 摄像头协议标准,支持在电脑端直接查看摄像头画面,操作摄像头云台等等

线程架构图

这个项目涉及的线程较多,其中包含推理线程池、渲染线程、处理线程等待,使用了原子操作、锁、条件变量等解决了线程同步问题。

线程架构如下图所示:

image.png

如果不理解线程池概念的同学,可以参考我这篇文章:《C++ 线程池浅析》

项目演示

项目改进

由于是个人项目且时间有限,因此还存在很多可优化空间。

比如在人脸门禁系统中,可以有如下改进:

  • 加入 IR 摄像头,进行活体检测
  • 为人脸门禁系统加入 NFC 模块,支持通过 NFC 解锁
  • 为人脸门禁系统加入指纹模块,支持通过指纹解锁
  • 添加 mysql 数据库,将姓名、年龄、工号、人脸特征进行存储

而在 IPC 安防摄像头系统中,可以有如下改进:

  • 加入舵机云台,完善 onvif,支持远程控制云台转动
  • 对 yolo11 模型进行微调,加入摔倒识别、火焰识别、打架识别等等
  • 加入 IRCUT 滤光片,添加 IR 灯,实现日夜切换功能
  • 加入 webrtc,实现实时对话功能

https://github.com/qaz624824554/deep_learning_security_system

Read more

从零构建分镜解析能力,手把手带你逆向Seedance2.0引擎的5层语义理解架构,含GitHub开源对照代码

第一章:Seedance2.0自分镜脚本解析引擎概述 Seedance2.0 是面向影视工业化流程设计的下一代分镜脚本智能解析引擎,专为导演、分镜师与AI协同创作场景构建。其核心能力在于将自然语言描述的分镜脚本(如“中景,主角低头推开木门,门外透进一束斜阳”)自动结构化为可执行的镜头元数据,并映射至渲染管线、运镜参数与时间轴事件。引擎采用多阶段语义解析架构,融合领域词典增强的BERT微调模型与规则驱动的语法树重写器,兼顾泛化性与影视专业术语的精确识别。 核心特性 * 支持中文主导的多模态分镜脚本输入(纯文本、带标注Markdown、含时码的SRT片段) * 输出标准化镜头对象(Shot Object),包含shot_id、framing、camera_motion、lighting_hint、temporal_offset_ms等12个必选字段 * 内置影视术语知识图谱,覆盖327类构图术语、89种运镜动作及56种光影描述 快速启动示例 package main import ( "fmt" "github.com/

By Ne0inhk

学生党福利!Cloudflare 部署 GitHub MoonTV 免费追剧教程

以下是针对学生党利用Cloudflare部署GitHub项目MoonTV实现免费追剧的详细教程,内容整合自网络最佳实践: 准备工作 确保拥有GitHub账号和Cloudflare账号。若没有,需提前注册。准备一个可用的域名(免费二级域名也可)。 部署MoonTV项目 将MoonTV项目Fork到个人GitHub仓库。进入项目设置,开启GitHub Pages功能,选择分支为main或master,保存后等待部署完成。 配置Cloudflare 登录Cloudflare控制面板,添加网站并按照提示修改DNS解析。在SSL/TLS设置中,选择Full加密模式。进入Workers & Pages,创建新项目并关联GitHub仓库。 自定义域名绑定 在Cloudflare的Workers & Pages中,找到已部署的项目,进入自定义域名设置。添加域名并按照提示完成CNAME记录配置,确保域名解析生效。 加速优化 启用Cloudflare的Auto Minify功能压缩资源。在Caching配置中,设置缓存规则为Cache Everything,提升加载速度。调整Brows

By Ne0inhk

【亲测免费】 Western Digital SSD Dashboard v4.2.2.5 离线版

Western Digital SSD Dashboard v4.2.2.5 离线版 【下载地址】WesternDigitalSSDDashboardv4.2.2.5离线版Western Digital SSD Dashboard v4.2.2.5 离线版是一款功能强大的SSD管理工具,专为Western Digital SSD用户设计。无需网络连接,即可实时监控SSD的健康状况、温度和使用情况。支持一键式固件更新,确保SSD始终运行在最佳状态。内置性能测试功能,可快速检测读写速度,并提供系统优化建议,帮助提升整体性能。操作简单,只需下载解压后运行应用程序,即可轻松管理您的SSD。此工具集为用户提供了极大的便利,确保SSD的稳定性和高效运行,是Western Digital SSD用户的理想选择。 项目地址: https://gitcode.com/Premium-Resources/fb48a Western Digital

By Ne0inhk