Nature letter2019连续预测未来急性肾损伤的临床应用方法
连续预测未来急性肾损伤的临床应用方法
Nenad Tomaš ev1 *、Xavier Glorot1、Jack W. Rae1,2、Michal Zielinski1、Harry Askham1、Andre Saraiva1、Anne Mottram1、Clemens Meyer1、苏曼·拉武里1、Ivan Protsyuk1、Alistair Connell1、Cían O. Hughes1、Alan Karthikesalingam1、
Julien Cornebise1,12,Hugh Montgomery3,Geraint Rees4,Chris Laing5,Clifton R. Baker6,Kelly Peterson7,8,Ruth Reeves9,Demis Hassabis1,Dominic King1,Mustafa Suleyman1,Trevor Back1,13,Christopher Nielsen 10,11,13,Joseph R. Ledsam1,13* & Shakir Mohamed1,13
这篇文章是一篇关于深度学习在医疗健康领域应用的研究,标题为“A clinically applicable approach to continuous prediction of future acute kidney injury”,由Nenad Tomašev和其他合作者撰写,发表在《Nature》杂志上。
研究背景:急性肾损伤(AKI)是一种常见且可能危及生命的疾病,早期预测对于及时干预至关重要。然而,目前对于AKI的检测依赖于血清肌酐水平的变化,这在肾功能下降后才会有明显变化,导致治疗介入延迟。
研究目标:开发一种深度学习方法,用于连续预测患者未来AKI的风险,并提供足够的预警时间,以便医疗专业人员能够及时采取行动。
研究方法:研究者使用来自美国退伍军人事务部的大规模纵向电子健康记录数据集,该数据集涵盖了703,782名成年患者,包括172个住院和1,062个门诊地点。他们设计了一个递归神经网络模型,该模型能够顺序处理个人的电子健康记录,并在每个时间点输出未来48小时内发生AKI的概率。
研究结果:该模型能够预测55.8%的所有住院AKI事件,并且对于需要后续透析治疗的AKI,预测准确率达到90.2%,提前预警时间可达48小时,并且平均每两个假警报对应一个真警报。模型还提供了置信度评估和对每个预测最相关的临床特征列表,以及临床相关血液检测的预测未来轨迹。
研究意义:这项研究提供了一种新的方法,可以在临床可行的时间窗口内连续预测AKI,有助于医疗专业人员在生理损伤发生之前,为大量患者提供潜在的预防性治疗。
研究限制:尽管模型在退伍军人事务部的数据集上表现出色,但该人群并不能完全代表全球人口。此外,模型的泛化能力需要在更广泛的患者群体和不同的医疗环境中进一步验证。
未来工作:研究者计划在未来的研究中解决训练数据中亚人群的代表性不足问题,并探索模型在提供预防性护理策略方面的作用。这项研究为深度学习在临床护理中的应用提供了新的可能性,并可能成为临床常规路径中不可或缺的一部分。
恶化的早期预测可能在支持医疗保健专业人员方面发挥重要作用,因为估计11%的住院死亡是由于未能及时识别和治疗恶化的患者1。要实现这一目标,需要对患者风险进行持续更新和准确的预测,并在个人层面进行,同时有足够的背景和足够的时间采取行动。在此,我们开发了一种深度学习方法,用于持续预测患者未来恶化的风险,该方法以最近对来自电子健康记录的不良事件进行建模的工作2-17为基础,并以急性肾损伤(一种常见且可能危及生命的疾病18)为例。我们的模型是基于涵盖不同临床环境的大型纵向电子健康记录数据集开发的,该数据集包括172个住院地点和1,062个门诊地点的703,782名成年患者。我们的模型预测,55.8%的急性肾损伤住院发作,90.2%的急性肾损伤需要随后进行透析治疗,提前期最长为48 h,每出现一个真正的警报,就会出现2个错误警报的比率。除了预测未来的急性肾损伤外,我们的模型还提供了置信度评估和对每项预测最显著的临床特征列表,以及临床相关血液检测的预测未来轨迹9。尽管已知急性肾损伤的识别和及时治疗具有挑战性,但我们的方法可能为在允许早期治疗的时间窗内识别风险患者提供机会。
不良事件和临床并发症是导致mor的主要原因-
并且已经做出了大量努力来提高他们的认识18,19。很少有预测因子能进入常规临床实践,因为它们要么缺乏有效的敏感性和特异性,要么报告已经存在的损害20。一个例子与急性肾损伤(AKI)有关,这是一种潜在的危及生命的疾病,在美国大约每五个住院患者中就有一个受到影响21。尽管很大一部分AKI病例被认为可通过早期治疗预防22,但目前检测AKI的算法依赖于血清肌酸酐作为肾功能急性下降标志物的变化。血清cre-atin in的增加滞后于肾损伤相当长的一段时间,从而导致延迟获得治疗。这支持预防性“筛选”型警报的案例,但没有证据表明当前基于规则的警报改善了结果23。为了使预测性警报有效,它们必须通过以下方式使临床医生有能力在重大临床下降发生之前采取行动:(I)提供关于可预防疾病的可操作性见解;(ii)针对特定患者个性化;(iii)提供足够的上下文信息以告知临床决策;和
(iv)一般适用于不同人群的患者24。
最近在对来自电子健康记录2-17的不良事件进行建模方面开展了有前景的工作,这表明纳入机器学习可能实现AKI的早期预测。现有的顺序AKI风险模型示例要么未证明具有临床适用水平的预测性能25,要么侧重于几乎没有时间进行临床评估和干预的短时间范围内的预测26。
我们提出的系统是一个递归神经网络,它对单个电子健康记录按顺序进行操作,一次处理一个步骤的数据,并构建一个内部存储器来跟踪到那时为止所看到的相关信息。在每个时间点,模型输出AKI在未来48小时内在严重程度的任何阶段发生的概率(尽管我们的方法可以扩展到AKI的其他时间窗或严重程度;参见扩展数据表1)。当预测概率超过指定的工作点阈值时,预测被认为是正的。该模型是使用来自美国退伍军人事务部(美国最大的综合医疗保健系统)所有可用站点的703,782名成人患者的多站点回顾性数据集的数据进行培训的。数据集包括以数字格式从医院电子健康记录中获得的信息。数据集中独立条目的总数约为60亿,包括62万个要素。患者按训练集(80%)、验证集(5%)、校准集(5%)和测试集(10%)随机分配。使用国际公认的“肾病:改善全球结局”(KDIGO)标准18添加了任何给定时间点AKI存在的基本事实标签;KDIGO AKI的发生率为入院人数的13.4%。方法和扩展数据图1-3提供了模型和数据集的详细描述。
图1展示了我们模型的使用。在整个入院过程的每一点,该模型提供了未来AKI风险的最新估计以及相关的不确定度。提供与预测相关的不确定性可能有助于临床医生区分不明确病例与完全由可用数据支持的预测。提前足够长的时间发现未来AKI的风险增加是至关重要的,因为更长的提前期可能有助于采取预防措施。即使临床医生可能没有积极干预或监测患者,这也是可能的。补充信息A部分提供了更多使用该模型的示例。采用我们的方法,55.8%的任何严重程度的AKI住院事件都是在最长提前48小时的窗口内提前预测的,且每一个真阳性对应2个假预测的比率。这对应于92.1%的接收器工作特性曲线下的区域和29.7%的精确度-召回率曲线下的区域。当设定在这个阈值时,我们的预测模型将——如果操作化——触发
图1 |风险预测、不确定性和预测的未来实验室值的说明性示例。有慢性阻塞性肺疾病病史的65岁男性患者入院的前8天。a、患者入院期间的肌酐测量值。肌酐测量值,显示第5天出现AKI。b,48小时内任何AKI的模型预测。连续风险预测:模型预测AKI风险在观察前48小时增加。高于0.2的风险
(相当于33%的精确度)是预测AKI的阈值。风险曲线上较浅的绿色边框表示不确定性,取100个集合预测的范围(在对最高和最低的5个值进行修剪后)。c、实验室价值预测
入院4.5天。肌酐、尿素和钾的最大未来观测值预测。
该队列中2.7%住院患者的每日临床评估(扩展数据表2)。在AKI导致持续并发症的患者中,敏感性尤其高。该模型对84.3%需要在任何阶段AKI发作后30天内进行院内或门诊透析治疗的发作以及90.2%计划在AKI发作后90天内进行常规门诊透析治疗的病例提供了正确的早期预测(扩展数据表3)。图2显示了相应的接收机工作特性和精度-召回曲线,以及该模型的工作点频谱。可根据临床优先级选择一个操作点,以进一步增加早期预测的AKI比例或降低每个步骤中错误预测的百分比(图3)。应用于3期AKI时,84.1%的住院事件预测提前至48 h,每一个真阳性对应2个假预测的比率(扩展数据表4)。为了每天对这些警报做出响应,临床医生需要护理约0.8%的住院患者(扩展数据表2)。该模型正确识别了88.5%病例中7项辅助生化试验的未来实质性增加(补充信息,B节),并提供了关于计算每项风险预测最显著因素的信息。在已知与肾功能相关的实验室检查中发现了最显著的异常(补充信息,C节)。我们的模型的预测性能跨时间和医院站点得到了保持,这通过额外的实验得到了证明,这些实验显示了在模型被训练后的时间点所采集的数据的可推广性(扩展
数据表5)。
我们的方法显著优于(P < 0.001)已建立的最先进的基线模型(补充信息,d节)。
例如,我们使用人工精选的已知与肾功能建模和常规护理提供相关的特征(补充信息,E和F节),结合患者近期病史中观察到的趋势的汇总统计信息,使用梯度增强树实施了基线模型。这产生了3,599个临床相关特征,这些特征在每个步骤中被提供给基线(方法)。在精确度相同的情况下,与我们模型的55.8%相比,该基线模型能够提前48小时在住院患者中检测到36.0%的AKI所有发作。
在我们的模型做出的假阳性警报中,24.9%是在随后发生AKI的患者中甚至早于48小时窗做出的阳性预测(扩展数据图4)。其中,57.1%发生在已有慢性肾病的患者中,这些患者发生AKI的风险较高。在剩余的假阳性警报中,24.1%为AKI发作后发生的拖尾预测,似乎已消退;在临床实践中可以过滤掉诸如此类的警报。对于随后未观察到AKI的阳性风险预测(在本回顾性数据集中),很可能许多发生在有AKI风险的患者中,对这些患者给予了适当的预防性治疗,从而避免了随后的AKI。除了这些早期和拖尾预测外,其余88%的假阳性警报发生在严重肾功能损害、已知肾脏病理学或电子健康记录中有证据表明患者需要临床复查的患者中(扩展数据图4)。
我们的目标是提供风险预测,以便能够大规模实施个性化的预防措施。这些预测的使用方式可能因临床情况而异:见习医生可能
实时提醒他们所护理的每一位患者,专科医师或快速反应小组27可以确定高危患者,以确定其反应的优先级。这是可能的,因为多个具有重要临床意义的组(尤其是AKI风险增加的组)的表现一致(补充信息,G节)。我们的模型旨在补充现有的常规护理,因为我们对其进行了专门培训,以预测本回顾性数据集中发生的AKI事件,尽管存在最佳实践。
尽管我们展示了一个模型,该模型是在来自整个美国退伍军人事务部医疗系统的具有临床代表性的一组患者上进行培训和评估的,但这一人群并不代表全球人口。女性患者占数据集中患者的6.38%,该人群的模型性能较低(扩展数据表6)。验证拟议系统对一般人群的预测性能将需要在额外的代表性数据集上对模型进行培训和评估。未来的工作将需要解决培训数据中子人群代表性不足的问题28,并克服与医院流程相关的潜在混杂因素的影响29。KDIGO是AKI的一个指标,在最初肾损害后有很长的滞后时间
损害和模型性能可以通过AKI的基本事实定义和数据质量的改进来提高30。
尽管与现有文献相比,我们的模型具有最先进的回顾性表现,但今后的工作应前瞻性评估并独立验证所提出的模型,以确定其临床实用性和对患者结局的影响,并探索该模型在AKI预防护理策略研究中的作用。
总之,我们证明了一种深度学习方法,可在长达48小时的临床可操作窗口内持续预测AKI。我们报告了一个临床多样化病例和大量研究点的表现,以表明在大量病例中,我们的方法可能允许在生理损伤发生之前提供潜在的预防性治疗。我们的结果为深入学习提供了可能性,以指导临床重要不良事件的预防。随着在临床可操作窗口中提供风险预测的可能性,以及电子健康记录数据集的规模和范围不断扩大,我们现在正在转向一种机器学习在临床护理中的作用可以快速增长的模式,为增强患者和临床医生的经验提供工具,并
潜在地成为常规临床路径的普遍存在的和不可缺少的部分。
在线内容
任何方法、附加参考文献、自然研究报告摘要、源数据、扩展数据、补充信息、致谢、同行评审信息;作者贡献和竞争利益的详情;数据和代码可用性的状态可在。
收到:2018年11月13日;接受:2019年6月18日;
2019年7月31日在线发布。