医疗大模型,巨头们的新赛场
说起近两年最热门的话题,那一定非大模型莫属了。伴随着 ChatGPT 的强势出圈,全球范围内掀起了一波人工智能热潮,国内外的诸多企业都开足马力,推出了自己的大模型产品。而 AI 大模型产品的不断问世,也上演了一番'百模大战'的盛况。
医疗大模型成为 AI 落地的重要场景,百度、腾讯等互联网大厂及微脉、卫宁健康等行业玩家纷纷布局。大模型能提升医疗效率、优化患者体验并加速数字化转型。然而,医疗数据隐私、容错率低及处理难度大仍是主要挑战。厂商需持续打磨产品,跨越技术门槛,推动行业智能化发展。同时,开发者可通过基础理解、API 开发、架构实践及私有化部署四个阶段系统学习,切入该领域。

说起近两年最热门的话题,那一定非大模型莫属了。伴随着 ChatGPT 的强势出圈,全球范围内掀起了一波人工智能热潮,国内外的诸多企业都开足马力,推出了自己的大模型产品。而 AI 大模型产品的不断问世,也上演了一番'百模大战'的盛况。
随着越来越多 AI 大模型产品的相继推出,AI 大模型的落地应用也逐渐提上了日程,成为了各行各业的重点关注方向。值得注意的是,除了通用大模型之外,针对细分行业的垂直大模型数量也日渐增多,医疗场景更是受到各方关注的重点领域。事实上,自 2023 年以来,已经有诸多头部企业都在加码医疗大模型领域,而这也意味着大模型正在逐渐深入医疗行业。
近两年,AI 大模型的热度居高不下,各行各业都在积极拥抱 AI 大模型,希望 AI 大模型能够为行业带来新的变化,医疗行业也不例外。AI 大模型这股风已然吹到了医疗行业,一系列与医疗相关的大模型产品和应用正在相继涌现出来。
比如,京东健康正式发布了面向医疗健康行业的大模型'京医千询';百度正式发布国内首个'产业级'医疗大模型'灵医大模型';医联正式发布了自主研发的医疗大语言模型 MedGPT;卫宁健康则是发布了医疗领域大模型'WiNGPT'。在各路玩家相继布局医疗大模型背后,也自有其逻辑。
AI 大模型的引入,有助于提升医疗效率,降低成本。AI 大模型是深度学习模型,这也就意味着 AI 大模型具备很强的学习能力,能够对海量数据进行分析和处理,并进行推理和预测。正因如此,医疗大模型能够对医疗数据进行分析和整理,并根据医疗信息进行相应的诊断,辅助医生进行诊断,而这可以在一定程度上促进医护工作者医疗效率的提高。比如,医疗大模型就能够将医生口述转化为带有对话语言的结构化笔记,极大地节省了医生手写病历的时间,提升了工作效率。
AI 大模型产品的推出,有助于进一步提升患者的就诊体验,为其提供全方位医疗服务。不同于其他需求,用户的就医需求是长期存在的,但受各类因素影响,患者往往面临着多种难题,比如候诊时间长、找不到相应科室等等,就医过程中所遇到各种突发问题,也影响了患者的就医体验。而医疗大模型的出现,则有望解决患者在就医过程中所遇到的痛点问题,为患者带去更加高效、优质的就医体验。比如,在诊前环节,医疗大模型就能够根据患者的就医需求,为其推荐相应的科室,解决了患者不知道该挂哪个科室的问题。
除此之外,AI 大模型的出现与应用,也能够在一定程度上助推医疗行业数字化转型加速。众所周知,数字化转型早已成为了各行业企业的重点发力方向之一,医疗行业也不例外。然而,不同于其他行业,医疗行业具备极大的特殊性和严肃性,再加上各地的基础设施建设情况不同、新旧系统共存,医疗行业存在着明显的'信息孤岛'现象,而这也是医疗行业数字化转型速度缓慢的重要原因所在。AI 大模型在医疗领域拥有广阔的应用场景,随着 AI 大模型和医疗结合程度的加深,或将有助于推动医疗行业朝着更加数字化、智能化的方向发展。
在这波 AI 大模型浪潮中,跑在最前面的无疑是互联网大厂,以百度、阿里、腾讯为代表的互联网大厂都相继推出了自家的 AI 大模型产品,比如,百度的'文心一言'大模型、阿里的'通义千问'大模型、腾讯的'混元'大模型。由于医疗行业被视为 AI 大模型落地的最佳领域之一,医疗行业也掀起了一波大模型热潮,许多互联网大厂也推出了自己的医疗大模型产品。比如,百度发布了'灵医大模型'、腾讯则是推出了'腾讯医疗大模型'。而互联网大厂之所以能够率先推出面向医疗行业的大模型产品,与其长时间的积累不无关系。
一方面,百度、腾讯都已经推出了自研的通用大模型产品,有研发大模型产品的经验,这些经验能够为其专用的医疗大模型产品的推出提供借鉴和参考。长期以来,以百度、腾讯为代表的互联网大厂都格外关注人工智能领域,并且在该领域持续深耕,积累了深厚的技术实力,而这些都为其推出 AI 大模型产品打下了坚实基础,也助推了其垂直大模型产品的出现。
比如,百度、腾讯等互联网大厂就在自研的通用大模型的基础上,引入专业的医学数据,对大模型进行训练和微调,最终推出面向医疗行业的专用大模型产品。具体来看,腾讯的医疗大模型就是基于腾讯全链路自研混元大模型研发的;百度的'灵医'大模型的技术底座同样来自于此前的文心一言大模型。
另一方面,百度、腾讯等互联网大厂在医疗健康领域有所布局,有行业数据的积累。一直以来,互联网大厂都在积极拓展业务版图,其中医疗健康领域就是其重点布局的领域之一。以百度为例,百度不仅推出了深耕医疗领域的 AI 医疗品牌'灵医智惠',还打造了能够提供健康科普、在线问诊等服务的一站式健康管理平台'百度健康'。
正因如此,百度、腾讯等互联网大厂积累下来了大量医疗数据,这些数据积累使其推出专业的医疗大模型产品成为可能。据了解,在模型训练过程中,百度大健康事业群(HCG)先后投入了自有积累的超 1000 万优质医疗问答数据、超 2000 万多语种医学专业知识、超 2 亿用户每日医疗类搜索数据、超 5 亿权威健康科普内容。无独有偶,腾讯的医疗大模型加入了超过 285 万医疗实体、1250 万医学关系、超 98% 医学知识的知识图谱和医学文献。
医疗大模型热度正高,除了互联网大厂频频布局之外,自然也少不了本行业玩家的参与,互联网医疗企业同样是落子不断。具体来看,全病程管理平台微脉正式发布了其自主研发的健康管理领域大语言模型应用——CareGPT;卫宁健康则是正式推出了医疗领域大模型——WiNGPT。在互联网医疗企业积极拥抱 AI 大模型背后,也并非毫无缘由。
一来,微脉、卫宁健康拥有丰富的医疗行业经验,以及海量的医疗数据,能为其训练医疗大模型奠定基础。数据对于 AI 大模型的重要性可想而知,AI 大模型的能力之所以能够不断进化和提升,离不开数据的支撑。尤其是对行业大模型来说,行业数据更是格外重要。而无论是微脉,还是卫宁健康,都长期深耕于医疗健康领域,有着专业的医疗知识库。得益于此,微脉、卫宁健康都积累下来了海量的、高质量的医疗数据,这些数据无疑是大模型产品的优质训练数据集,能够帮助二者训练出精准度更高、可靠性更强的医疗大模型产品。
据了解,微脉的 CareGPT 在训练阶段就以循证医学为基础,使用了目前最新版本临床医学指南、疾病诊疗模型、专家共识等超 10 亿的医学文本数据,以及百万条微脉个案管理数据,形成专科专病管理的医疗健康知识库,并投入超过 100 位个案管理师参与 RLHF 监督调试训练。另一组数据显示,在 2023 年 5 月,WiNGPT 训练的数据量已达到 9720 项药品知识、7200 余项疾病知识、2800 余项检查检验知识、1100 余份指南文档,总训练 Token 数达 37 亿。
二来,微脉、卫宁健康的业务与医疗大模型有着天然的契合度,更容易实现医疗大模型的落地与应用,有望助推其业务的进一步发展。除了大模型产品的推出之外,后续的落地应用同样是相当重要的一环。由于微脉、卫宁健康本身就是互联网医疗企业,其业务开展也都围绕着医疗健康方面,医疗大模型与其业务有着很高的契合度,更容易实现落地。
比如,CareGPT 就能对患者聊天内容进行分析,可以帮助患者自主进行初步的身体状况筛查,实现分诊导诊的智能化辅助,提升患者管理的效率。随着医疗大模型产品能力的不断进化,并且逐渐应用到具体场景中,医疗大模型也能够为互联网医疗企业业务赋能,有望为其带来新的业务增长点。
得益于人工智能技术的蓬勃发展,以及相关技术在医疗场景的逐渐应用,AI 医疗正在逐渐成为现实,医疗大模型的出现更是有望为医疗行业注入新的发展动力。当前,AI 大模型浪潮席卷而来,无论是互联网大厂,还是互联网医疗企业,都不愿意错失这个机会,纷纷乘浪而上。只是,必须要说的是,医疗大模型虽蕴含着机遇,但同样有着门槛。
不同于其他行业,医疗行业有着很强的严肃性和专业性,可以说是不容有失,这也就意味着医疗大模型产品的容错率极低,这就对厂商们提出了更高的要求。为了避免此类情况的发生,发力于此的厂商们必须保持审慎的态度,不断打磨产品本身,以提升大模型产品的能力。特别是在临床决策支持系统中,幻觉(Hallucination)问题可能导致误诊风险,因此需要引入 RAG(检索增强生成)等技术来确保回答的可追溯性和准确性。
众所周知,由于医疗数据往往涉及患者本身,因此具备很高的私密性,但大模型能力的训练又需要大量数据为支撑,对研发医疗大模型的厂商来说,数据的获得有着比较高的难度。不仅如此,由于数据标准不一,医疗行业的数据处理同样难度较高,需要医疗大模型厂商多下功夫。此外,数据脱敏、合规性审查(如 HIPAA、GDPR 及国内相关法规)也是模型落地前必须跨越的关卡。
就目前情况来看,医疗大模型产品的诞生或许能够为医疗行业带来发展新机遇,帮助企业降本增效、为患者带来更加优质的就医体验,但由于医疗大模型尚处于刚刚开始发展的阶段,难关同样有很多,需要厂商们去跨越。总而言之,医疗大模型产品的推出并不意味着结束,反而是新的起点,无论是互联网大厂,还是互联网医疗企业,都不能掉以轻心,这场竞赛仍持续进行中。
大模型时代,火爆出圈的 LLM 大模型让程序员们开始重新评估自己的本领。抢你饭碗的不是 AI,而是会利用 AI 的人。继科大讯飞、阿里、华为等巨头公司发布 AI 产品后,很多中小企业也陆续进场。如今大厂老板们,也更倾向于会 AI 的人,普通程序员,还有应对的机会吗?与其焦虑,不如成为掌握 AI 工具的技术人,毕竟 AI 时代,谁先尝试,谁就能占得先机。
但是 LLM 相关的内容很多,现在网上的老课程老教材关于 LLM 又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。针对所有自学遇到困难的同学们,这里为大家系统梳理大模型学习脉络,建议的学习路径如下:
目标:了解 AI 大模型的基本概念、发展历程和核心原理。 内容:
目标:掌握 AI 大模型 API 的使用和开发,以及相关的编程技能。 内容:
目标:深入理解 AI 大模型的应用架构,并能够进行私有化部署。 内容:
目标:掌握多种 AI 大模型的私有化部署,包括多模态和特定领域模型。 内容:
通过上述路径的系统学习,开发者可以逐步构建起从理论到实践的完整知识体系,从而更好地参与到医疗大模型乃至整个 AI 行业的建设中来。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online