人工智能作为实现智慧医疗的重要技术基础,正在积极地推动医疗健康行业的数字化转型。如今 DALL-E、GPT-4、LLaMA 等人工智能大模型的出现,给该领域带来了前所未有的技术突破。大模型又被称为预训练模型或基础模型(Foundation models),它可以集中各种模态的数据信息,基于海量数据和超大规模参数进行预训练,并通过微调以适配不同领域的任务需求。在医疗领域,医疗数据本身就具有多模态的特性,大模型将进一步推进智慧医疗、医疗元宇宙和医疗研究的发展进程。例如电子病历理解、医疗问答、医学教育培训、医学影像生成、疾病辅助诊断、药物研发以及虚拟医院和医疗虚拟数字人交互等诸多应用,涵盖医疗领域就诊前、就诊中、就诊后各环节。
人工智能大模型发展概述
人工智能大模型发展与分类
随着人工智能技术的进步和深度学习算法的发展,以及海量多模态数据的爆炸式增长,芯片、网络、算力等基础建设的持续增强,大模型也迎来了快速发展机遇。2014 年生成对抗网络 GAN(Generative Adversarial Network)的出现,推动了生成式人工智能的革命性发展。随后以 Transformer、BERT 为代表的预训练模型的诞生,颠覆了以往的深度学习模型网络结构,大幅提高了模型训练速度和对多模态感知、创作和推理的能力。同时,模型的参数量级也从百万级跃升到了百亿级,甚至出现了千亿级大模型。
截止 2023 年 6 月,国内外有超过百种大模型相继发布。国外如 Stable Diffusion、GPT-4、Med-PaLM 等大模型,国内如文心系列大模型、华为盘古大模型、星火认知大模型、MOSS 大模型等。从研究方向上来看,大模型研究主要集中在自然语言处理(NLP)、计算机视觉(CV)、多模态三大领域。从内容形式上来看,DALLE-2 模型可以将文本转为图像;Dreamfusion 模型可以将文本转为 3D 图像;Flamingo 模型可以将图像转为文本;Phenaki 模型可以将文本转成视频;AudioLM 模型可以将文本转为音频;Codex 模型可以实现文本转编码等。从工程角度看,MaaS(Model as a Service,模型即服务)正在成为该领域的新模式,助力大模型从数据预处理、模型构建、模型训练、模型评估到模型服务全流程构建。
人工智能大模型构建流程
大模型构建流程通常分为:预训练、微调、奖励模型、强化学习四个阶段。
- 预训练:利用海量的训练数据和无监督学习的方法学习到通用的特征或知识,并将这些特征或知识迁移到其他任务上,用于增强模型的泛化能力和表现。这一阶段主要消耗大量计算资源,旨在让模型掌握语言规律和世界知识。
- 微调:是指在已有的预训练语言模型基础上,在新的数据集上进行少量的训练,使得模型能够更好地适应新的任务或领域。提示调优(Prompt-tuning)、指令调优(Instruction-tuning)和前缀调优(Prefix-tuning)是现在大模型微调方法中较为常用的方法。其中 Prompt-tuning 是通过提示来引导模型生成相关内容;Instruction-tuning 通过指令来训练模型执行特定任务;Prefix-tuning 则是通过在输入中添加前缀来控制生成结果的格式和结构。
- 奖励模型:用于对生成的内容进行打分排序,让模型生成的结果更加符合人们理想的答案。这通常涉及人类反馈的标注数据。
- 强化学习:阶段根据用户给出的提示词结合奖励模型,将对结果与语言模型建模目标进行综合,进而得到更好的输出效果,即 RLHF(Reinforcement Learning from Human Feedback)。
人工智能大模型在医疗领域的应用
随着医疗领域信息化的飞速发展,海量多模态医疗数据不断积累,如何对其进行有效利用和深度挖掘,是现代化智慧医疗的迫切要求。现代化智慧医疗融合了大数据、人工智能、元宇宙等前沿技术,旨在优化医疗服务流程,提高医疗质量和效率,促进智能医学的进一步发展。而医疗大模型的出现将进一步加快其发展进程,目前医疗大模型覆盖医学知识问答、生物及药物研发到智慧诊疗的各阶段、医保知识管理等领域。
根据面向对象的不同可分为患者、医护、高校、医疗机构及企业角色等;根据临床场景数据交互类型的不同,又可分为文本任务、视觉任务、语音任务、跨模态任务等。具体来讲,如就诊前的挂号问诊、健康宣教、知识问答等,就诊中的辅助诊断、电子病例生成与理解、手术模拟等,就诊后的健康管理、医药服务、慢病管理等,医学研究领域的文献挖掘、药物研发等,医疗元宇宙中的场景构建、内容生成等。
但由于医疗领域的特殊性,医疗数据的获取和模型的训练制约着大模型的发展。医疗数据往往涉及隐私保护,需要脱敏处理。此外,医疗元宇宙是元宇宙在医疗领域的重要创新,有助于促进虚拟医疗和现实医疗的协同发展,打破现实世界对时空、资源的限制,但医疗元宇宙的构建需要大量的虚拟场景,复杂的智能预测与推理分析,虚拟数字人的建模以及语言与情感表达能力等。另外,对于生物和医药研究活动,需要大量的研究数据和模拟实验,极其耗时费力。由于大模型参数规模巨大,其开发和训练依赖于数据、网络和算力的综合支撑。大模型可依托互联网、专业数据库以及私有数据库的多模态数据进行自监督预训练,通过少量下游任务提示或上下文提示对通用大模型进行微调,并利用迁移学习的思想,提高零样本与小样本学习能力,从而快速构建出不同的专用大模型以满足上述场景的需求。此外,大模型的优化还涉及软、硬件的协同配合,分布式并行策略处理数据、压缩模型网络等以提升运行效率。
人工智能大模型在医疗领域应用的构想
医疗领域大模型依托 CV、NLP、单/多模态技术等使其具有强大的创作能力、交互能力、孪生能力、推理决策能力,为下游具体场景应用奠定基础。最后,通过微调、提示工程等实现智慧医疗全周期、医学研究和医疗元宇宙等具体场景的应用。


