概述
手势识别是 AR 设备实现自然交互的关键技术。Rokid UXR SDK 提供了不同版本的开发工具包,适配不同的 Unity 版本和设备型号。开发者需根据项目需求选择合适的 SDK 版本。
| UXR SDK 版本 | 支持 Unity 版本 | 核心功能差异 | 适配设备 | 适合人群 |
|---|---|---|---|---|
| UXR 2.0 | 2020/2021/2022 LTS | 基础 4 类手势(捏合/握拳/手掌/松开)、基础远近场切换 | Station 2、Max Pro、AR Lite | 新手入门、常规手势交互开发 |
| UXR 3.0 | 2022/2023.3 LTS | 新增图像识别、手势置信度过滤、模型轻量化 30% | Station Pro、Max 2、AR Studio | 高级交互、性能优化需求开发者 |
版本选择
不同版本适配的 Unity 版本、设备、功能存在差异。例如,Unity 2023 建议选 UXR 3.0;若使用 Unity 2021 且仅需简单手势,UXR 2.0 更稳定。
技术原理
手部检测
Rokid 的 3D 手势算法依赖 RGB 摄像头,无需复杂的多摄像头或 ToF 传感器。利用 AI 算法和深度学习模型,实时捕捉手部的 3D 姿态信息,包括 6DoF 位置、26 个关节点及 Hand Mesh 信息。
- 响应速度:移动端毫秒级响应,单帧检测耗时低于 10 毫秒,识别准确率达到 99%,深度估计误差小于 5 厘米。
- 硬件架构:支持 CPU、GPU 和 NPU,适配高通、海思等主流平台。
手势分类
通过'标骨骼点→看姿势'判断手势。核心是 26 个骨骼点的定位精度。
| 手势类型 | 核心判断条件 | 对应现实动作 | 版本优化(UXR3.0) |
|---|---|---|---|
| 捏合(Pinch) | 拇指尖 + 食指尖距离<2cm,其他手指弯 | 捏小物件 | 新增'置信度过滤',<80% 不响应 |
| 握拳(Grip) | 所有指尖都靠近掌心 | 攥拳头 | 支持'半握拳'识别 |
| 手掌(Palm) | 所有手指伸直,指尖离掌心远 | 张开手要东西 | 手掌倾斜 30°也能识别 |
| 捏合松开(OpenPinch) | 之前是捏合,现在拇指 + 食指距离>4cm | 松开东西 | 响应速度快了 10ms |
远近场交互
近场手势用于直接触碰互动,远场手势通过射线和锚点远距离操控。切换依据是手与互动物体的距离,默认设置手在距离 -0.02m ~ 0.04m 范围内为近场,超出则为远场。
UI 操作通过'近→触→压→抬'四阶段反馈实现:
- 靠近:hover 状态,按钮向上抬动。
- 触摸:按钮微变色、微缩放。
- 按压:按钮高亮放大且触发 Down 音效。
- 抬起:按钮复原,Up 音效响起。
性能优化
- 轻量化模型:UXR 3.0 模型比 2.0 小 30%,识别延迟从 120ms 降到 100ms。
- 动态帧率调节:手不动时 20fps,快速动时 30fps,切换平滑。
开发实践
环境确认
- 硬件:支持 Unity 开发的 PC、Rokid Station Pro/Station2、Rokid Max Pro/Max/Max2 眼镜。


