前言
**'灵巧手'(dexterous hand)**通常指具有类人手结构、多自由度的末端执行器,能够进行精细的抓取与操作,而不仅仅局限于平行夹紧。它们模仿人类手指关节和肌腱驱动,使机器人能够执行转动、重定位、穿插等复杂操作。根据结构和材料不同,灵巧手大致可分为刚性型、柔性型和混合型:刚性型采用金属或坚硬塑料结构,关节通过电机或舵机驱动,优点是定位精度高、力矩大;柔性型主要用硅胶、橡胶等软材料,可通过气动驱动或形变实现自适应抓取,天生适合对柔软或不规则物体的抓取;混合型结合刚柔两者,例如刚性骨架包裹柔性层,兼顾承力和安全性。近年来,随着增材制造和传感技术进步,灵巧手的设计趋势是结构更轻便、可拓展且集成丰富传感器,使其在保持精细操作能力的同时降低成本和复杂度。总体来看,从并联双爪等简单夹具到今天的多指柔刚结合的灵巧手,已经形成多条发展脉络,各种创新不断涌现。

在机器人学中,'灵巧手'是把感知—决策—执行闭环落实到接触尺度的关键枢纽,其重要性体现在方法论与系统层两个层面:在方法论上,灵巧手将原本'抓取—位移'的低维任务,提升为包含滚动、指间重排、推挤与非抓取(non-prehensile)操作在内的操作原语集合,使机器人需正面处理接触—摩擦驱动的混合动力学、互补约束与部分可观测性(POMDP),由此推动触觉融合(tactile fusion)、接触状态估计、阻抗/顺应控制、模型—学习混合(model-based × RL/IL)与触觉伺服等核心技术的演进;在系统层面,灵巧手以高自由度与顺应性结构、密集触觉传感为载体,显著扩展同一硬件在开放世界中的任务覆盖率,减少对治具与专用末端执行器的依赖,提升通用机器人在装配、检修、服务与医疗辅具等高价值场景下的经济性与安全性。更进一步,灵巧手是'通用机器人'与'具身智能'落地的瓶颈环节:只有在手内操控(in-hand manipulation)与工具使用被可靠学习与泛化之后,语言/视觉等高层规划才能通过细粒度接触行动被兑现。因此,灵巧手既是推进机器人能力边界的技术抓手,也是将抽象智能转化为可复用、可规模化物理能力的基础设施。
为此,本文主要围绕近期在顶会(RSS,CoRL,ICRA,IROS)发表的'灵巧手'相关主题的论文,进行了简单介绍和分析,按照'一句一图'的模式展开(一句:什么问题,怎么解决;一图:文章最体现的 figure,进行解释),便于浏览及泛读效率。文章对应涉及的复杂公式进行简化处理或略过,深入细节请参考原文。
RSS 2025
DexterityGen: Foundation Controller for Unprecedented Dexterity
作者 Zhao-Heng Yin, Changhao Wang, Luis Pineda, Francois R. Hogan, Chaithanya K. Bodduluri, Akash Sharma, Patrick Lancaster, Ishita Prasad, Mrinal Kalakrishnan, Jitendra Malik, Mike Lambeta, Tingfan Wu, Pieter Abbeel, Mustafa Mukadam.
内容简介:这篇工作把'人类远程操控的意图(高层)'与'强化学习得到的低层运动基元'拼接起来,打造一个通用'灵巧操控基础控制器'。直觉上,人擅长给出粗粒度的动作命令,但很难在没有触觉的异构手上做细致稳定的操作;而 RL 擅长把低层接触与稳定性打磨得很扎实。作者先用 RL 在模拟中学出一大堆'灵巧手运动原子'(如在手内旋转/平移、再抓取等),再把它们组织成'可被人类提示调用'的生成式控制器。到了真实世界,人类只需给出粗指令,控制器就能生成稳定、安全且细致的机器人手动作,完成工具使用、复杂重抓等高难度操控。实验证明它在稳定性(比如持物时长)上显著提升,并能做出此前少见的'用笔/螺丝刀/注射器'等灵巧技能。

如上论文 Fig.1 左侧显示'Coarse Motion Command → Foundation Dexterity Controller → Fine Dexterous Action'的链路,左侧是人类通过远程操控给出粗动作;中间是 DexGen 的'生成控制器',把粗动作翻译成多接触、安全的细动作;右侧是各种高难技能(在手内大幅重定向+工具使用)的实拍帧。要点:①'提示→细动作'的箭头表明这是'以人提示驱动'的运动合成;②控制器内部标出


