深度学习在 AMD 与正常 OCT 图像分类中的应用
这篇笔记主要梳理了一篇关于利用深度学习区分正常眼底与老年性黄斑变性(AMD)OCT 图像的研究。医疗影像自动化诊断一直是热点,而这篇论文的数据规模和评估维度都相当扎实。
数据集规模
研究使用的数据量非常庞大,总计包含 260 万张 OCT 图像。其中正常人的图像约 5.27 万张,确诊为老年性黄斑变性的患者图像约 4.83 万张。如此规模的数据集为模型的泛化能力提供了坚实基础。
性能指标表现
论文从三个不同粒度评估了模型效果,整体表现相当不错:
- 单张图像层面:ROC 曲线下面积(AUC)达到 92.78%,准确率为 87.63%。
- 黄斑区域层面:聚焦于病变核心区域,AUC 提升至 93.83%,准确率 88.98%。
- 患者层面:这是临床最关心的指标,模型以患者为单位进行判定,AUC 高达 97.45%,准确率 93.45%。
可以看出,随着评估粒度从像素级向患者级聚合,模型的稳定性显著提升。
模型可解释性与遮挡测试
深度学习常被诟病为黑盒,这篇论文通过遮挡测试(Occlusion Test)来增强结果的可信度。具体做法是用一个 20×20 像素的黑色方框在原图上滑动遍历。当某个位置被遮挡后,模型输出的分类概率显著降低,这就说明该区域对最终判断贡献最大。
这种可视化方法比单纯的热力图更能直观地反映模型到底'看'到了哪里。这也是为什么很多后续研究都会引用《Visualizing and Understanding Convolutional Networks》这类经典工作,因为可解释性对于医疗 AI 落地至关重要。
总的来说,这项工作在数据量和评估严谨性上都值得参考,尤其是其多粒度的评估方式,为同类任务提供了很好的基准。

