一、DCN的基础原理
1. 传统CNN的局限性
说到DCN,就不得不先聊聊传统卷积神经网络(CNN)的特点和它遇到的一些难题。传统CNN通过固定的卷积核在图像上滑动,捕捉局部区域的特征。这种方式在很多场景下都很有效,比如识别简单的图案或纹理。但当面对现实世界中复杂的图像时,它就有些力不从心了。原因主要有以下几点:
- 对物体形变无能为力:现实中的物体往往不是一成不变的,它们可能会因为旋转、缩放或者姿势变化而呈现不同的形状。可传统卷积核的采样位置是固定的,没法根据物体的变化灵活调整,导致特征提取的效果大打折扣。
- 感受野缺乏灵活性:卷积核的大小和形状一旦确定,它的'视野'就固定了。面对大小不一、位置各异的物体时,很难做到面面俱到。
这些问题在图像分类上可能还能勉强应付,但到了目标检测、语义分割这样的任务,局限性就更加明显了。为了解决这些痛点,DCN应运而生。


