深度学习方法在细胞图像分析中的应用综述
引言
计算机视觉和机器学习的最新进展支撑了一系列具有令人印象深刻的能力来解密图像内容的算法。这些深度学习算法正被应用于生物图像,并正在改变成像数据的分析和解释方式。这些进步有望使复杂的分析变得常规化,并使研究人员能够进行以前不可能的新实验。
本文回顾了深度学习与细胞图像分析之间的交叉点,概述了对生命科学家相关的深度学习的数学机制和编程框架。我们调查了该领域在四个关键应用方面的进展:图像分类、图像分割、目标跟踪和增强显微镜技术。最后,分享了实验室在实施深度学习过程中的三个关键方面的经验:标注训练数据、选择并训练多种神经网络架构以及部署解决方案。同时,强调了每个被调研应用中现有的数据集和实现案例。
背景与需求
成像技术的进步
成像技术的进步已经改变了生物科学,使研究人员能够获取生命系统中固有的时间和空间变化。光学技术的进步带来了能够在从单个分子到整个生物体的各种空间尺度上进行成像的显微镜。同时,荧光探针的改进增强了荧光蛋白和小分子染料的亮度、光稳定性以及光谱范围。这些进步结合起来,允许在活细胞中进行各种动态测量,从单分子的长期成像,到多个生物传感器的同时测量,再到整个生物体发育过程的观察。它们还导致了固定样本中的令人印象深刻的测量,现在空间基因组学正在推动在固定细胞和组织中同时测量数十种蛋白质或数千种 mRNA 种类,同时保持空间信息。
图像分析的需求增加
随着这些技术进步的同时,生物科学领域对图像分析的需求也在增加。现代成像数据越来越多地需要量化才能提供信息。典型的任务包括无监督图像探索(例如通过基于成像的药物筛选来比较图像集合的特征,识别细胞形态的变化)、图像分类(为图像预测一个标签——例如确定干细胞是否分化)、图像分割(识别对应于不同对象的图像部分——例如在图像中识别单个细胞)和目标跟踪(在一个电影帧之间跟随一个对象——例如活胚胎中的单个细胞)。
为了满足这一需求,研究人员和公司开发了软件库、基于用例的实现和通用计算机视觉生态系统。传统上,实验人员编写利用这些库的软件工具。随着分析任务变得越来越普遍,创建了几种软件工具以通过图形前端提高可访问性。例如,有用于细菌单细胞分析的工具(SuperSegger, Oufti, Morphometrics),用于哺乳动物细胞单细胞分析的工具(CellProfiler, Ilastik, Microscopy Image Browser),以及通用图像分析工具(ImageJ, OMERO)。这些工具和生态系统已经改变了实验设计,使得定量和统计分析可以自动化并高通量执行,并产生了大量的关键生物学见解。
深度学习的引入
令人兴奋的是,深度学习扩展了计算机视觉可以解决的问题范围。这里,'深度学习'指的是一套机器学习技术,特别是具有多层抽象能力的学习数据有效表示的神经网络。请注意与传统的机器学习相比,后者的表现形式是通过特征工程手动设计的。在深度学习中,学习可以是有监督的也可以是无监督的。最成功的有监督方法试图在标注的数据集上最大化性能。无监督方法用于在压缩到低维空间后重建原始数据。
尽管这些技术在数学形式上已经存在了几十年,但直到基于深度学习的方法赢得 2012 年的 ImageNet 大规模视觉识别挑战赛之后,它们才引起了人们的注意。自此以后,能够通过深度学习解决的问题种类大大增加。此外,计算机硬件和深度学习框架的改进使得这些工具对于普通的软件开发者来说触手可及。虽然深度学习主要是在商业领域应用,但现在它开始在物理、化学、医学以及生物科学领域出现,应用于图像和其他类型的数据。
鉴于观察——因此也是成像——在生物科学中所起的核心作用,深度学习有可能彻底改变我们对生命系统内部运作的理解。事实上,目前正发生着一场'淘金热',许多团体都在寻求将这些方法应用于他们的数据以提取新的生物学见解。尽管如此,深度学习尚未在整个生命科学和医学科学中广泛采用。重要的是,上述许多软件工具还没有包含深度学习功能。我们认为,为了让深度学习真正变革生命科学,其应用需要像 BLAST 搜索一样成为常规。
深度学习在整个生物学实验室普及的障碍既有文化上的也有技术上的。数学让某些深度学习算法的内部工作原理变得不透明;深度学习的独特要求促使人们必须以不同的方式思考软件编写。具体而言,对标注数据的需求意味着数据和软件必须共同开发——这种方法最近被称为 Software 2.0。深度学习所需的数据量和计算资源构成了采用的重大障碍,同样需要的知识还包括优化模型性能和解释深度学习模型学到的内容。为了充分利用这些工具的力量,生命科学家必须熟悉它们,以增强现有的工作流程,并为目前无法预见的分析奠定基础。
深度学习的数学基础与组件
核心操作
深度学习模型中常见的数学组件主要包括卷积、激活函数和池化操作。
- 卷积 (Convolution):卷积从图像中提取局部特征,每个滤波器的权重可以调整以针对给定的数据集和任务提取最佳特征。这是卷积神经网络(CNN)的基础,通过滑动窗口机制捕捉图像的纹理、边缘等低级特征,并在深层网络中组合成高级语义特征。
- 激活函数 (Activation Functions):诸如常用的修正线性单元(ReLU)所应用的传递函数使得学习非线性关系成为可能。如果没有非线性激活函数,多层网络将等价于单层线性变换,无法拟合复杂的数据分布。ReLU 因其计算简单且能有效缓解梯度消失问题而被广泛使用。
- 池化 (Pooling):像最大池化这样的池化操作通过下采样生成空间上较为粗糙的特征图。这有助于减少计算量,控制过拟合,并提供一定程度的平移不变性。


