SuperTac 仿生多模态触觉传感器
在机器人领域,触觉一直是个棘手的难题:传统传感器要么分辨率低到摸不清纹理,要么只能测压力却辨不出温度。
近日,清华大学丁文伯团队联合无界智航(Xspark AI)及多所国内外科研机构在《Nature Sensors》上发表的 SuperTac 仿生多模态触觉传感器,直接打破了这个僵局——
借鉴鸽子的多光谱视觉原理,把多光谱成像、摩擦电传感、惯性测量揉进 1mm 的电子皮肤里,不仅能精准识别纹理、材质、温度,还能预判碰撞和滑动,分类准确率超 94%。
让机器人触觉感知第一次有了人类级的细腻度。
01 传统触觉传感器的痛点
在 SuperTac 之前,机器人触觉感知主要分两大技术路线,但都有绕不开的局限:
电子皮肤(e-skin):分辨率和模态难两全
早期电子皮肤靠密集电极阵列实现多模态感知,但电极一多就会出现信号串扰——测压力时温度数据会飘,辨纹理时位置精度又下降。
而且为了塞下更多传感器,皮肤厚度往往超过 5 毫米,贴在机器人手指上既不灵活,又无法捕捉 0.1 毫米级的细微凸起(比如布料纹理)。
视觉触觉传感器:光谱范围被卡脖子
后来出现的视觉触觉传感器(靠光学成像测形变)解决了分辨率问题,能做到亚毫米级精度,但大多只局限在可见光范围。
比如想通过温度区分刚煮好的杯子和室温杯子,或者靠紫外线识别特殊材质;而且多数只能测压力 + 纹理,像振动、距离这些关键信息根本拿不到。
数据解读:多模态信息各说各话
就算个别传感器能同时测压力、温度、纹理,不同模态的数据也像不同语言的报告——压力数据是数值,纹理是图像,温度是热图,没有统一的解读框架,机器人拿到数据也无法综合判断。
比如摸到一个物体,知道它硬、凉、光滑,却分不清是玻璃还是金属。
[图片]
SuperTac 的创新,正是从这三个痛点切入:用仿生设计突破感知模态限制,用轻薄结构兼顾分辨率与灵活性,再靠专用语言模型打通数据解读。
02 仿生灵感
SuperTac 的核心创意:鸽子的视觉系统比人类更适合触觉感知。
人类只有 3 种视锥细胞,只能感知可见光;而鸽子有 4 种视锥细胞,能看到紫外线,还能靠视网膜里的特殊分子感知磁场,相当于自带多光谱相机 + 指南针。这种全维度信息捕捉的能力,正是机器人触觉需要的。
[图片]
于是研究将这个原理移植到触觉传感器上,设计出了三层核心结构,总厚度仅 1 毫米:
导电层:既是电极也是透光开关
用 PEDOT:PSS(一种透明导电材料)涂在 TPU 薄膜上,既保证透光性,又能在接触物体时产生摩擦电信号——
不同材质的物体(比如塑料和金属)接触时,产生的电压信号不同,机器人靠这个就能摸出材质差异。
荧光层 + 反射层:多光谱信息接收器
中间层是紫外线荧光油墨,底层是镀银粉末的反射层,配合不同波长的光源(紫外线、可见光、近红外、中红外),就能实现一皮多用:
[图片]
可调节气压,适应不同物体
此外,传感器内部有个微型气腔,能通过调节气压改变硬度——测软物体(比如海绵)时调低气压,让皮肤更贴合;测硬物体(比如金属块)时调高气压,避免过度形变影响精度。
03 DOVE 模型让触觉会说话
光能采集数据还不够,机器人需要知道这些数据意味着什么。
比如摸到硬、凉、光滑、黄色的物体,要能判断这可能是个金属杯子,适合装水。
[图片]
为了解决这个问题,开发了 DOVE 触觉语言模型(85 亿参数),它的核心能力有三个:
多模态数据融合解读
DOVE 能把摩擦电信号(材质)、温度数据、纹理图像、颜色信息整合到一起,生成自然语言描述。
比如触摸一个杯子后,它会输出:这个物体是黄色的,室温,表面有均匀的凸起纹理,靠摩擦电信号判断材质为金属——就像人类触摸后会口头描述一样。
[图片]
物体差异对比推理
如果机器人同时触摸两个物体,DOVE 能找出它们的不同:两个物体颜色和温度相近,纹理相似,但材质不同(一个是塑料,一个是金属),因此是不同物体。这种对比能力,让机器人在分拣任务中效率大大提升。
[图片]
联想判断
它还能结合常识推理物体用途,比如摸到 PET 材质(常用于饮料瓶)、黄色、有光滑曲面的物体,会判断:


