Patch Position Embedding (PPE) 在医疗 AI 中的应用编程分析
一、PPE 的核心原理与医疗场景适配性
- 位置编码的本质需求
在医疗影像(如 CT、MRI、病理切片)中,Transformer 需要将图像划分为若干 Patch 并作为序列输入。但如果不注入空间信息,模型难以区分同一病灶在不同坐标的语义差异。传统的绝对位置编码(如 Sinusoidal PE)对等距网格有效,却无法灵活适配病灶大小多变、图像分辨率不一的医学场景。Patch Position Embedding (PPE) 则通过学习每个 Patch 的二维坐标嵌入,显式保留局部邻接关系和全局拓扑信息,从而显著提升病灶边界定位精度和跨切面一致性(nature.com,