【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

前言

本文主要介绍我最近开发的一个个人实战项目,“基于深度学习的人脸门禁+ IPC 智能安防监控系统”,全程满帧流畅运行。这个项目我目前全网搜了一圈,还没发现有相关类型的开源项目。这个项目只要稍微改进下,就可以变成市面上目前流行的三款产品,人脸识别门禁系统、IPC 安防和 NVR。在最下面会有视频演示。

本项目适用于瑞芯微 Rockchip 系列的板端,开源链接在文章最下面。

功能

人脸门禁系统

  • 人靠近自动亮屏,人走自动息屏
  • 支持人脸识别
  • 支持录入人脸,并进行人脸配对(极速配对 < 0.2S)

IPC 智能安防监控系统

  • 支持通过 onvif 实时查看摄像头画面
  • 支持实时目标检测(支持高达80种物体检测)
  • 支持录像
  • 支持检测到人时自动录像
  • 支持检测到人时自动报警

用到的硬件

1738765194618.jpg
  • 野火鲁班猫4 RK3588S2
  • IMX415 800W 4k 摄像头
  • RTL8822CE Wifi+BT
  • mipi LCD RGB 7寸 1024×600 触摸屏
  • 人体红外检测 SR501:通过 GPIO 读取相应数值,用于判断是否有人靠近
  • 128×32 OLED屏:通过 I2C 通信显示画面内容,用于显示人脸检测结果
  • 蓝牙音箱

用到的深度学习模型

  • yolo11:用于实时目标检测
  • retinaFace:用于人脸检测
  • facenet:用于人脸特征提取

模型需要经过转换和量化,并且进行精度评估,如果不知道如何在 Rockchip 平台进行模型转换的同学,可以参考我这篇文章:《瑞芯微 Rockchip 系列 RK3588 主流深度学习框架模型转成 rknn 模型教程》

用到的技术栈

  • C++
  • RKNN:用于在 Rockchip 上进行 NPU 推理
  • FFmpeg:用于音视频编解码,使用了 ffmpeg-rockchip 库进行 MPP 硬件编解码,提高编解码速度
  • Opencv:用于视频帧处理
  • LVGL:流行的 GUI 框架
  • Bluez-Alsa:用于连接蓝牙音箱并播放音频
  • Onvif:一个流行的 IP 摄像头协议标准,支持在电脑端直接查看摄像头画面,操作摄像头云台等等

线程架构图

这个项目涉及的线程较多,其中包含推理线程池、渲染线程、处理线程等待,使用了原子操作、锁、条件变量等解决了线程同步问题。

线程架构如下图所示:

image.png

如果不理解线程池概念的同学,可以参考我这篇文章:《C++ 线程池浅析》

项目演示

项目改进

由于是个人项目且时间有限,因此还存在很多可优化空间。

比如在人脸门禁系统中,可以有如下改进:

  • 加入 IR 摄像头,进行活体检测
  • 为人脸门禁系统加入 NFC 模块,支持通过 NFC 解锁
  • 为人脸门禁系统加入指纹模块,支持通过指纹解锁
  • 添加 mysql 数据库,将姓名、年龄、工号、人脸特征进行存储

而在 IPC 安防摄像头系统中,可以有如下改进:

  • 加入舵机云台,完善 onvif,支持远程控制云台转动
  • 对 yolo11 模型进行微调,加入摔倒识别、火焰识别、打架识别等等
  • 加入 IRCUT 滤光片,添加 IR 灯,实现日夜切换功能
  • 加入 webrtc,实现实时对话功能

https://github.com/qaz624824554/deep_learning_security_system

Read more

CLI-Anything:一条命令把任意软件变成 AI Agent 原生工具,到底怎么做到的?

CLI-Anything:一条命令把任意软件变成 AI Agent 原生工具,到底怎么做到的?

快速摘要 CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的一个项目,核心做的事情只有一件:把那些只有图形界面的专业软件(GIMP、Blender、LibreOffice、OBS 等),自动生成一套完整的命令行接口(CLI),让 AI Agent 能像操作终端命令一样直接调用这些软件的全部功能。 它以 Claude Code 插件的形式分发,整个过程分为 7 个阶段全自动完成,已在 9 款专业软件上通过了超过 1400 项测试。如果你正在做 AI Agent 相关的开发工作,或者对"让 AI 操控真实软件"这个方向感兴趣,往下看有更详细的原理拆解和上手教程。 这个项目到底在解决什么问题? 做过 AI Agent 开发的朋友应该都有体会:目前的 Agent 在&

OpenClaw(小龙虾)B 端企业级应用实战:CentOS 7 快速部署指南,拥有你的第一个 AI 运维员工

大家好,我是独孤风。 春节期间,OpenClaw(小龙虾)彻底火了,人人都在谈论如何“养一只自己的小龙虾”。 过去一年,我们见识了太多能言善辩的大模型,但它们大多停留在“动嘴”阶段。你问它怎么重启服务器,它给你列出 1234 步骤,最后还得你自己去敲键盘。而 OpenClaw 的爆火,是因为它彻底解决了 “执行” 的问题。 它不是一个只会聊天的对话框,而是一个住在你服务器里、拥有操作权限、能 7x24 小时不间断工作的 “数字员工”。  但是,目前的大部分应用还是停留在助手阶段,帮助我们做一些简单的事务性的工作。在 B 端企业级场景下,应用几乎是没有的。那么OpenClaw能不能在B端应用呢?它的出现能否直接改写了运维与开发的成本结构呢?这篇文章我们就来实战一下,实现一个最基本的OpenClaw小龙虾AI运维员工。 正文共:6013字 25图 预计阅读时间:16分钟 文末联系作者,加入AI学习交流群 一、

AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能

AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能

AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能 AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能,本文介绍 “AI 的智能体专栏”,围绕智能体展开,解析其自主运行原理,教读者用大模型搭建简单智能体及设计多智能体协作。学习该专栏可提升多方面能力,包括理解智能体构成、任务拆解和环境互动原理;掌握搭建简单智能体的步骤、指令设计及测试优化方法;学会多智能体分工、沟通及问题解决;将智能体应用于职场、生活、学习等场景;分析并优化智能体工作效果。专栏分基础原理、搭建智能体等五部分,适合各类人群,附思维导图,强调边学边做等学习建议,并举例说明智能体应用。 前言     人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库,把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。无论你是刚接触 AI 的新手,还是有一定基础想提升的人,

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

🔥 个人主页:杨利杰YJlio❄️ 个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更简单,让重复的工作自动化 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 1. 我先说结论:今天这波 AI 热榜,最重要的不是“谁最火”,而是“风向变了” * 2. GoogleCloudPlatform / generative-ai:平台生态正在成为真正的护城河 * 3. MiroFish:群体智能和多智能体,开始从概念走向更具体的产品叙事