医学领域数据多样、问题复杂,是大模型最值得投入的应用方向之一。

临床:降低门槛与减负
ChatGPT 在美国执业医师考试中及格了。有人拿它对患者问题的回答和医生在社交媒体上的回答比较,发现它的答案在信息量和共情上反而更好。谷歌的 Med-PaLM2 离执业医生水平更近一步,可以处理医学图像、电子病历、基因组等多模态数据,让优质医疗资源有望触达更多人。
在日常工作中,大模型能减轻医生的文书负担。比如出院记录,医生只需输入要点,模型几秒生成正式版本。如果把它接入医疗工作流,通话记录、文档、表格、PPT 的整合处理都能自动化,医生能把更多精力放到病人身上。
科研:从文献摘要到蛋白质预测
大模型在科研上的作用不只是润色论文。你可以让它阅读论文并总结关键点,改写实验描述以匹配不同期刊风格。用专业语料微调后,它甚至能加快同行评审的初筛速度。
更直接的应用在生物信息学:蛋白质序列是文本,基因结构也是文本。AlphaFold 用语言模型从氨基酸序列预测三维结构,ProGen 能按需生成特定功能的蛋白质序列,TSSNote-CyaPromBERT 可以发现细菌 DNA 里的启动子区域。对数据稀缺的罕见病研究,用大模型生成合成数据来扩充样本,也是值得探索的方向。
教育:个性化教学工具
GPT-4 和 Med-PaLM2 能通过高难度医学考试,这意味着它们有能力辅导那些还没通过的学生。比如设定'苏格拉底导师模式',模型会层层递进抛出问题,引导学生自行推导解决方案。老师可以查看对话记录,发现学生的薄弱点并调整教学。
可汗学院已经在尝试用 GPT-4 做学习助手,在线语言学习平台 Duolingo 也接入了 GPT-4 来增强互动。面向医学领域微调的模型,未来在医学教育中会扮演更重要的角色。
几个值得关注的医学大模型
BioBERT
BioBERT 并非最大,但胜在专注生物医学文本。基于 Transformer,它用 PubMed 摘要和全文文章训练,能理解医学文献里的特定术语和表述。
GatorTron
GatorTron 是第一个由学术医疗机构自己开发的大模型,数据来自佛罗里达大学的脱敏电子病历、PubMed 文章和维基百科,总语料超 90 亿词。电子病历覆盖 2011–2021 年 126 个临床部门、约 5000 万次就诊,横跨住院、门诊和急诊。
BioMedLM
斯坦福大学开发的 BioMedLM 走轻量路线,直接对标 GPT-4、Med-PaLM2 这些大模型的私有化部署问题。参数量更小,但性能不弱,而且对数据隐私和成本更友好。
ClinicalGPT
北京邮电大学发布的 ClinicalGPT 专为中文临床场景优化。训练用了 cMedQA2(12 万问题、22.6 万答案)、MD-EHR(来自多中心大型医院的 10 万份电子病历,涵盖呼吸、消化等科室)和 MEDQA-MCMLE(3.4 万道中文选择题)等数据集。
这些模型各有侧重,但都可见医学大模型正在从实验室走向真实医疗场景。

