2024 医疗大模型发展趋势:安全性验证与私有化部署
2023 年被称为医疗大模型元年,国内垂直类大模型数量显著增长。2024 年发展重点在于效果验证、解决幻觉问题及推动本地化部署。研究证实大模型在辅助诊断方面具有潜力,但仍面临专家经验习得难、复杂决策支持不足等挑战。通过数据清洗、隐私保护及行业标准制定可提升安全性。轻量化与私有化部署将成为主流,以解决算力短板并保障数据安全。未来需结合多模态技术与人工反馈机制,实现技术、法规与需求的平衡。

2023 年被称为医疗大模型元年,国内垂直类大模型数量显著增长。2024 年发展重点在于效果验证、解决幻觉问题及推动本地化部署。研究证实大模型在辅助诊断方面具有潜力,但仍面临专家经验习得难、复杂决策支持不足等挑战。通过数据清洗、隐私保护及行业标准制定可提升安全性。轻量化与私有化部署将成为主流,以解决算力短板并保障数据安全。未来需结合多模态技术与人工反馈机制,实现技术、法规与需求的平衡。

2023 年被广泛称为'医疗大模型的元年',国内外均有大量厂家将大语言模型应用于医疗健康领域。据统计,截至 2023 年 10 月,我国累计公开的大模型数量已经达到 238 个,其中垂直类大模型达到 103 个。而在 2 月至 9 月期间,我国发布的医疗大模型近 50 个,涉及智慧诊疗、医疗文本处理、药物研发和学术科研等多个方面。
医疗大模型是否能够帮助临床医生和医疗机构提升医疗质量?2024 年医疗大模型又将面对哪些困难?随着技术的演进,大模型在医疗场景应用需兼顾安全性与专业性,可通过数据清洗、标注和验证等控制数据质量;另一方面,大模型的计算需要大量的算力作为支撑,轻量化、本地化部署的大模型将成为重要发展方向。
2023 年 6 月,四川大学华西医院信息中心刘加林教授团队在医学权威期刊 Journal of Medical Internet Research 上发表了研究文章'Utility of ChatGPT in Clinical Practice',证明了 ChatGPT 在临床多个环节为医务人员提供了有效的诊疗决策支持。
研究显示,基于大语言模型的人工智能 ChatGPT 在临床实践中展现出巨大的潜力,或将彻底改变现有的医疗模式。例如,在诊断方面,ChatGPT 在常见病的正确诊断率高达 93.3%。在临床决策方面,再根据多个维度比较了 36 个病例的鉴别诊断、诊断测试、最终诊断和处理的准确性后,ChatGPT 的总体准确率达到了 71.7%(95% CI,69.3%~74.1%)。此外,ChatGPT 还可用于癌症筛查和优化临床决策支持系统,为医生提供重要的辅助信息。
在回答医学问题方面,ChatGPT 也展现出了强大的能力。例如,在视网膜疾病、产科和妇科、肝脏疾病以及癌症等领域提供准确和有用的信息;可用于生成医学文件,如患者医疗报告、放射学报告和医疗记录等。这些文件在准确性、人性化和可读性方面得到了良好的评价,为医疗实践提供了重要的支持。
对于大模型在医疗健康领域的应用,此前中国信通院云大所副所长闵栋提出了 9 个应用场景,包括辅助决策、治疗方案生成和质量控制等。刘加林团队的研究已经证明了大模型在辅助决策方面发挥了作用,还有许多大模型在问诊、影像鉴别等方面取得了不错的准确度,但在其他多个应用场景中,医疗大模型的应用效果仍需进一步研究。
闵栋近日发文表示,目前我国医疗大模型产业仍在发展早期,且大多厂商对标 ChatGPT 同步发展,处于跟进复刻的阶段,创新性总体偏弱。当国内大模型技术积累达到一定阶段,不同应用定位的模型优势将会在产业中显现出来,呈现出差异化,这也是大模型商业落地的主要途径。
随着各厂商大模型产品的研发和应用,2024 年医疗健康领域也将出现覆盖不同应用场景的医疗大模型,更多相关研究工作也将逐步展开和验证。
尽管大模型在医疗健康领域应用效果的研究成果目前仍在少数,但对其存在的隐患已逐渐形成共识。上海市数据科学重点实验室主任、复旦大学附属眼耳鼻喉科医院等多家机构特聘教授肖仰华发表的论文阐述了大模型在医疗应用中的局限性。
医疗是一类典型的严肃、复杂应用场景,对大模型的准确性、精确性、安全性、可靠性、认知能力均提出更高要求。例如医生在对患者进行诊断时,不仅要考虑过往病史,还要通过场景判断患者所述是否属实,多凭借自身丰富经验解决问题。大模型难以仅从文字记载的数据中习得,与资深医疗专家水平仍有差距。
目前,以大模型为核心的人工智能技术在医学中的应用定位仍是辅助决策。ChatGPT 类大模型本质上是在开放环境中实现人机对话,但是开放聊天无法辅助解决真实工作场景中的复杂决策任务。例如在疾病诊断方面,医生会根据患者的收入和医保情况制定个性化诊疗方案。要胜任此类工作,大模型需要丰富的专业知识、合理的角色定位、病情病势研判能力、复杂约束取舍能力、不完全信息下的推断能力等,大模型要从聊天能手变成医学专业助手仍需经历漫长的优化过程。
医疗关系到公众的生命健康,对错误需要零容忍,应用任何人工智能技术都要有系统性的解决方案才能达到医学严苛的准确性与精度要求。而生成式大模型本质上是概率模型,仍有产生错误的可能。例如,胃复安的主要成分是甲氧氯普胺,但 ChatGPT 回答的是天然气孔草酮。这看似严谨的回答存在基本事实错误,在应用时需要付诸极大的代价判断信息真伪,增加了应用成本。幻觉问题是大模型落地垂域应用不可避免的问题。
对于以上医疗大模型目前存在的普遍问题,肖仰华认为原因有 3 点:首先,大模型先天能力不足,训练语料、轮次有限都会导致学习不充分、知识有限、推理受限等问题;其次实际任务往往太复杂,大模型对复杂指令理解能力有限,进而产生幻觉;最后,由于专业领域知识相对薄弱、难获取,大模型对于某些专业知识的掌握能力有限,因此生成错误答案。
如何才能解决大模型在医疗健康领域现存的问题?刘加林提出,应对数据进行审查和清洗,为大模型提供更加广泛和多样化的训练数据,涵盖不同人口群体和疾病情况,以减少偏见的影响,确保大模型的输出结果是公正和准确的。此外,为了保护患者的隐私和数据安全,需要采取严格的数据安全措施,如数据加密、访问控制和匿名化等。同时,为了提高其可信度和可接受性,需要研究算法的透明性和可解释性,包括开发解释性的模型架构、提供决策依据的解释,以及记录和审查大模型与患者之间的交互过程。
为了克服上述问题和风险,政府部门、学协会、研究机构和医疗机构等需要针对实际问题制定相关政策和监管措施,确保大模型在临床实践中的合理和安全应用。同时,还需要加强研究,提高大模型的性能和可靠性,以确保其在医疗领域的广泛应用能够带来真正的益处,并最大限度地减少风险。
为此,由中国信息通信研究院牵头,国家卫生健康委医疗服务指导管理中心以及多家医院、技术公司共同研究起草的四项标准于 2023 年 9 月发布。这四项标准分别是《医疗健康行业大模型应用技术要求 第 1 部分:医院侧医疗服务》《医疗健康行业大模型应用技术要求 第 2 部分:患者侧医疗服务》《医疗健康行业大模型合成服务治理规范 第 1 部分:数据处理》《医疗健康行业大模型安全管理能力要求 第 1 部分:应用安全》。
这些标准旨在对医疗健康行业大模型应用服务能力进行全方位、多角度的综合评定,通过构建全面多层的测试问题集,探查医疗健康行业大模型的知识丰富度和临床沟通能力等。根据中国信息通信研究院制定的'医疗健康行业大模型系列标准框架',下一步还将陆续发布多项标准,以促进大模型在医疗健康行业的技术标准、能力建设、涵盖范围和安全要求等。
对于 2024 年的发展方向,中国信通院云大所数字健康部副主任冯天宜表示,一方面,大模型在医疗场景应用,还需兼顾安全性与专业性,可以通过数据清洗、标注和验证等对规范数据质量提出量化要求以控制数据质量,及时开展算法检测和修正确保模型决策透明、可解释、可追溯等手段应对内容虚假和错误的问题;另一方面,大模型的计算需要大量的算力作为支撑,但医院在算力部署等方面仍存在短板,因此轻量化、本地化部署的大模型将成为重要发展方向。
目前,已有厂商已经解决了大模型在医疗机构私有化部署的问题。例如惠每科技与英特尔联合开发了基于 CPU 的大模型推理技术,使惠每医疗大模型可与医院部署的 CDSS 无缝集成,无需重新对接或购买 GPU 服务器,帮助医院低成本地使用大模型。目前惠每医疗大模型已经具备鉴别诊断和病历自动生成能力,未来在 CDSS 提供高质量医疗数据的基础上,其可在更多诊疗环节展现能力。
私有化部署虽然解决了数据安全问题,但也带来了运维复杂度的提升。医院 IT 部门通常缺乏维护大规模 AI 模型的经验,因此模型轻量化、推理加速技术至关重要。未来的技术路线将集中在模型压缩、量化以及边缘计算能力的结合上。同时,随着多模态技术的发展,医疗大模型将不再局限于文本处理,而是能够结合 CT、MRI 等影像数据进行综合分析,这将进一步提升诊断的精准度。
此外,建立完善的反馈机制也是关键。在实际应用中,医生对模型输出的修正意见应被收集并用于模型的持续迭代优化(Human-in-the-loop),从而形成良性循环。只有当技术成熟度、法规合规性以及临床需求三者达到平衡时,医疗大模型才能真正实现规模化落地,惠及广大患者。
综上所述,2024 年将是医疗大模型从概念验证走向实际应用的关键一年。通过强化数据治理、遵循行业标准以及推进本地化部署,行业有望克服当前的瓶颈,实现更安全、更高效的智能化医疗服务。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online