跳到主要内容 AI 大模型赋能中医药产业发展分析 | 极客日志
Python AI 算法
AI 大模型赋能中医药产业发展分析 本文分析了 AI 大模型在中医药产业中的应用现状与发展前景。文章详细阐述了 AI 在中医望闻问切智能诊断、个性化治疗及新药研发中的具体作用,对比了数智本草、岐黄问道、仲景、海河岐伯等多个已公开的中医药大模型的技术特点与应用场景。同时,探讨了中医药大模型面临的标准化难、高质量数据缺乏及信任困境等商业化挑战,并提出了推进知识体系现代化、优化数据流通、加速落地应用等建议。最后盘点了包括讯飞星火、盘古、华佗等在内的十五款代表性中医药大模型,展示了中医药数字化和智能化转型的最新成果。
狂少 发布于 2025/2/6 更新于 2026/4/20 1 浏览以大模型为代表的人工智能技术正在加速改变世界,成为引领新一轮科技革命和产业变革的关键驱动。近年来,在数据、算法和算力等关键要素的快速迭代下,AI 大模型迅速发展,应用领域不断拓宽,正在与中医诊疗、中药研发等深度融合,带来了众多创新与突破。中医药模型如同一位博学的古代名医,穿越时空,与现代科技携手,共同守护着人类的健康。
一、AI 大模型助力中医药'守正创新'
(一)智能诊断 AI 大模型在中医'望闻问切'四个诊断环节发力,推动中医现代化水平提升。
望诊智能辅助诊断 :多集中于'面诊''舌诊'领域。一是运用图像识别技术收集面部色泽、皮肤润泽度、是否有斑点或其他皮肤变化等信息,经大模型输出辅助诊断信息;二是分析舌色、舌体、舌苔等舌象特征,为临床医生提供更为全面的舌诊信息。
闻诊智能辅助诊断 :融合了声音、气息等多维度评价指标。首先可透过患者声音判读患者各脏腑器官的健康状况,而且会根据患者呼吸深浅、快慢、节律等,推断出患者的气血状况和可能存在的病症。
问诊服务 :为生成式人工智能(AIGC)技术,患者只需提供自身的症状,中医大模型就会给出中医证型、治疗方法、处方与用药。
智能切诊/脉诊设备 :通过 AI 核心算法,运用中医诊疗思路和辩证逻辑对之前收集的数百万/千万的临床脉象数据进行整合,对患者实现一分钟内精准采脉并提供个性化诊疗方案。
[图:基于岐黄问道·中医大模型的大经中医智能舌面诊仪]
(二)中医治疗 AI 大模型通过深入分析并融合中医传统理论、中药药理、中药配伍及临床应用等信息,可实现经典处方推荐、中医养生指导等功能。在方剂推荐方面,中医药大模型能够基于患者输入的'疾病-症状-体征'信息,输出辨证结果、治则治法和中药方剂。并可根据体质辨识的结果,结合个人的年龄、性别、生活习惯等,从饮食调养、情志调摄、起居调摄、运动养生、针灸按摩等方面进行个性化的养生方案制定。
(三)新药研发 AI 大模型为中药新药创新研发提供了无限可能。长期以来,中药因其原料质量的不稳定性、药效成分的复杂性、毒副作用的不确定性、作用机制的不明确性,导致传统的药物研发方式进行中药新药创新存在瓶颈。同时,又由于中药缺乏符合中医药特色的临床证据与科学验证,也制约了自身的临床应用与推广。而 AI 大模型可以对海量的中医药数据进行处理和分析,并从复杂数据中识别模式和规律,快速筛选大量中药有效成分,识别出具有治疗潜力的活性成分,并对药物配方进行优化,完成中药新药的创新研发。
二、中医药大模型对比分析'各具特色' 自人工智能浪潮席卷中医药行业以来,相关的中医药大模型如春笋般涌现。
数智本草大模型 :由天士力医药集团与华为云在盘古大模型的基础上联合开发,其对'1000+'古籍进行翻译,录入了'9 万 +'方剂、'4 万 +'中成药,并翻阅'4000 万 +'中医药文献,分析研究'300 万 +'天然产物,着眼于中医药理论证据的挖掘和总结,在守正的基础上进行创新,不仅可实现'从病到方'和'从方到病',更在中医药研发等诸多场景进行了尝试。
岐黄问道·大模型 :由南京大经中医研发,该模型涉及知病、知症、养生三个子模型,一是根据患者确诊的疾病给出药方,二是根据主诉症状和伴随症状、体征信息给出中药处方,三是瞄准中医养生调理方向,可给出包括但不限于食疗、茶饮、推拿以及艾灸等个性化的养生建议等。
博奥晶方和水木分子 :也在联手攻坚中医药大模型,双方将基于博奥在中医药原创研发数据上的积累优势和水木分子的千亿参数多模态生物医药对话大模型底座 ChatDD-FM,在中医药精准诊疗、中药创新药、药食同源食品、植物化妆品等四个应用场景展开探索。
三、中医药大模型商业化进程'任重道远'
(一)中医药标准化难题牵绊产业发展 中医药大模型的发展面临着标准化和规范化的挑战,包括中医术语、药材质量、配方标准和治疗效果评估等多个方面。不同地域、不同流派的中医术语存在差异,标准体系的缺乏严重影响大模型语料的结构化以及相应数据收集及训练。建立统一的术语标准和数据采集规范是首要任务。
(二)高质量核心数据缺乏限制模型准确率 目前医疗大模型多是由公开的医疗数据信息训练而成,大量的患者就医及临床数据多掌握在医院手中,由于数据涉及患者隐私,医院难以向大模型企业公布,导致中医药大模型训练数据不足,准确率不高。此外,非结构化数据的清洗和标注成本高昂,进一步限制了高质量数据集的构建。
(三)医疗大模型等新兴事物面临信任困境 新型科技产品从走向大众视野到广泛应用不能一蹴而就,需要用户习惯的不断养成,医疗大模型涉及关乎国计民生的健康行业,尤为如此。一端是医生对医疗大模型持保守态度,担心其影响自己的专业判断;另一端是患者对缺乏面对面交流的在线医疗服务持怀疑态度,这些都需要一定时间去适应。建立透明的决策解释机制和误诊追责体系至关重要。
四、总结与建议 为促进中医药大模型普及应用,针对行业存在的共性问题,提出如下建议。
(一)推进中医药知识体系现代化进程 利用大数据、人工智能等新一代信息技术,加强名老中医学术经验、老药工传统技艺、经典药方分析等活态传承。建立中医药实用的标准体系,统一中医不同地方派系名词术语标准、道地药材采集标准、传统炮制过程标准等,为中医药大模型训练所需的海量结构化数据收集提供标准环境。
(二)优化中医药相关数据可信流通过程 通过隐私计算、数据脱敏和区块链加密等技术创新手段,加强中医药数据隐私保护,强化数据追踪与溯源能力,有效破解数据流通中的信任瓶颈。通过数据确权、数据共享等机制创新政策,遵照'原始数据不出域,数据可用不可见'的原则,推动中医药大模型与高质量数据的碰撞融合,激活中医药优质数据资源,提高大模型的准确率。
(三)多维度发力加速中医药大模型落地应用 基于中医药特色开发中医药领域垂类模型,加速训练迭代,促进模型能级提升,提高大模型可接受程度。推广大模型使用成功案例,明确模型现阶段使用定位,辅助医生进行诊疗决策。探索建立中医药大模型误诊错诊追责机制,解决患者使用的后顾之忧和不信任危机。
五、已公开中医药大语言模型盘点 中医药是中国传统科学的瑰宝,传承创新发展中医药是新时代中国特色社会主义事业的重要内容。现如今,为推动中医药的现代化、智能化发展,多个中医药大模型已经问世。随着大语言模型技术的蓬勃发展,中医药学迎来了数字化和智能化转型的新机遇。
1. 仲景 首个中医药大语言模型——'仲景',是受古代中医学巨匠张仲景深邃智慧启迪,专为传统中医领域打造的预训练大语言模型。由复旦大学张文强教授、王壟博士后等人共同指导。此项目开源了针对 Qwen1.5-1.8B-Chat 模型的微调权重,在一张 Tesla T4 显卡即可实现高速推理。通过在专有医疗数据集上进行多次迭代训练确保模型在中医药领域具备较强理解和生成能力。此外,'仲景'借鉴人类记忆知识的过程,采用专业表格,借助大语言模型的语言表征能力,严格设置特定的 prompt 模板,使得模型基于中医妇科方药表格数据生成包括患者治疗故事、诊断分析、诊断治疗预期结果、处方功用、互动故事、患者治疗故事、叙事医学、舌脉象、诊疗方案制定、批判性思维、随访、处方、药物用量、个例研究、真实世界问题、病因病机等 15 个场景,以促进模型对中医方药数据及诊断思维逻辑的推理能力。
2. 海河·岐伯 2024 年 1 月,天大智图(天津)科技有限公司的中医药大语言模型——'海河·岐伯'大模型开放内测。'海河·岐伯'大模型的命名源于'医术之祖'——《皇帝内经》,该大模型系统以中医典籍为核心,抽取四库全书医家类资料、传统中医文献与权威中医药学资料的文本素材,以中医药领域的基本概念、知识、理论、疾病、药物、方剂等为节点,形成完整的知识图谱。'海河·岐伯'通过大模型真实还原古医书中记载的崎伯问诊场景,为现代中医药学提供了新一代大语言模型。
3. 数智岐黄 2024 年 3 月,华东师范大学举办的'AI 赋能下的未来药学产学研发展论坛'大会上发布了'数智岐黄'中医药大模型。该模型是由华东师范大学、上海中医药大学、华理工大学、海军军医大学等多家单位及全国重点实验室联合开发。'数智岐黄'中医药大模型以《黄帝内经》《伤寒杂病论》等中医典籍及 1000 多本古籍和中医药文献为核心数据基础,以高质量中医药知识图谱为知识库,涵盖超过 8 万种方剂、超过 2000 种症候、超过 9000 种中药材、超过 4 万种中药成分、超过 1.8 万种靶点、超过 2000 种疾病,采用预训练和微调并结合检索增强生成和插件调用等技术,通过方剂推荐、中药性质解读、症候辅助诊断,实现中医药领域知识智能问答、健康咨询、中医药知识图谱动态交互三大核心功能,助力中医药创新研究和人才培养、临床辅助诊疗和中医养生保健,推动中医药文化传承创新发展。
4. 数智本草 在 2024 年 5 月召开的数智赋能大健康产业新质生产力暨第四中医药国际发展论坛上,天士力医药发布了《数智中药——现代中药的数智化发展白皮书》,紧接着重磅推出了聚焦中药产业创新研发的'数智本草'大模型。'数智本草'大模型,是基于华为澎湃算力与向量库等先进工具,由天士力与华为云在华为盘古大语言模型和盘古药物分子大模型的基础上联合开发的中医药语言大模型和计算大模型。目前大模型集守正(1000 种以上古籍及翻译,9 万首以上方剂,4 万个以上中成药等)、创新(4000 万份以上文献摘要,300 万种以上天然产物,2 万个以上靶基因通路信息等)、产业化(10 万个以上临床方案,16 万个以上中药专利以及药典政策指南等)三大类海量数据。'数智本草'语言大模型,拥有 380 亿参数量,基于中医药海量文本数据预训练,结合向量库检索强化,以及中药研发多场景的微调,能够更好地帮助研究者完成中医药理论证据的挖掘和总结。
5. TCMLLM TCMLLM 由北京交通大学计算机与信息技术学院医学智能团队开发的中医药大语言模型项目,旨在通过大模型方式实现中医临床辅助诊疗(病证诊断、处方推荐等)中医药知识问答等任务,推动中医知识问答、临床辅助诊疗等领域的快速发展。目前针对中医临床智能诊疗问题中的处方推荐任务,发布了中医处方推荐指令微调大模型 TCMLLM-PR。研发团队整合了 8 个数据来源,涵盖 4 本中医经典教科书《中医内科学》、《中医外科学》、《中医妇科学》和《中医儿科学》、2020 版中国药典、中医临床经典医案数据、以及多个三甲医院的涵盖肺病、中风病、糖尿病、肝病、脾胃病等多病种的临床病历数据,构建了包含 68k 数据条目(共 10M token)的处方推荐指令微调数据集,并使用此数据集,在 ChatGLM 大模型上进行大规模指令微调,最终得到了中医处方推荐大模型 TCMLLM-PR。
6. ShenNong-TCM-LLM ShenNong-TCM 由华东师范大学团队完成,旨在推动 LLM 在中医药领域的发展和落地,提升 LLM 的在中医药方面的知识与回答医学咨询的能力,同时推动大模型赋能中医药传承。该项目在 2023 年 6 月开源了中文中医药大模型——ShenNong-TCM,模型是以 LlaMA 为底座,采用 LoRA (rank=16) 微调得到。ShenNong-TCM 以中医药知识图谱为基础,采用以实体为中心的自指令方法 entity-centric self-instruct,调用 ChatGPT 得到 11w+ 的围绕中医药的指令数据。
7. Huang-Di 黄帝源自中医古籍《黄帝内经》,由南京大学信息管理学院及郑州大学人工智能学院合作完成。在 Ziya-LLaMA-13B-V1 基线模型的基础上加入中医教材数据:收集'十三五'规划所有中医教材共 22 本;在线中医网站数据:爬取中医世家、民间医学网等在线中医网站及知识库。训练出一个具有中医知识理解力的预训练语言模型(pre-trained model),之后在此基础上通过海量的中医古籍指令对话数据及通用指令数据进行有监督微调(SFT),使得模型具备中医古籍知识问答能力。
8. 本草智库 2024 年 4 月 12 日,由成都中医药大学、北京百度网讯科技有限公司、太极集团有限公司、天府中药城等单位联合开发的全球首个中药全产业链大模型——本草智库在第二届'千种本草基因组计划'研讨会上发布。本草智库大模型基于中国工程院院士、成都中医药大学首席教授陈士林团队本草基因组学的研究成果构建。本草智库汇集了 1500 万条中药材基原物种基因信息、3000 余万条中药成分与靶点互作信息、400 余万个化合物等中药研究底层核心数据,形成了覆盖中药全产业链的 2000 余万个实体和超 20 亿个关系对知识图谱,让中药材有了专属'基因身份证'。该模型以千亿级参数规模文心大模型为支撑,通过指令微调和检索增强生成技术,具备中药知识提取与生成、中药垂直领域解决方案输出、中药产业一站式数字化服务三大功能,实现了中药研究底层核心数据与中药全产业链关键环节有机结合。这一模型有助于提升中药基础研究和产业整体效率及质量水平,可为中药全产业链各关键环节提供精准决策支持,从而优化生产流程,提高产品质量,确保药品安全。
9. 盘古大模型 华为中医药大模型于 2024 年 1 月 23 日正式亮相。浙江九为健康科技股份有限公司与华为云计算技术有限公司在华为深圳总部签署了中医药大模型全面深化合作协议,共同推出了这一创新性的中医药大模型。该模型的出现标志着传统中医药与现代科技的深度融合,为中医药领域的研究、开发和应用提供了新的思路和方法。盘古中医药大模型是一个基于深度学习技术的大规模预训练模型,专门针对中医药领域进行设计和优化。该模型利用海量的中医药数据进行训练,能够深入理解中医药的语言和文化,为中医药的研究、开发和应用提供了强大的支持。在数据方面,盘古中医药大模型融合了中医经典文献、中药方剂、药材信息、临床案例等多种类型的数据,形成了一个庞大而全面的中医药知识库。这些数据不仅涵盖了中医药的各个方面,还经过了精心的清洗和标注,确保了数据的质量和准确性。在技术方面,盘古中医药大模型采用了深度学习中的 Transformer 架构,这是一种具有强大特征提取和上下文理解能力的神经网络结构。通过大规模的预训练,该模型能够自动学习到中医药领域的复杂知识和模式,为后续的应用提供了坚实的基础。在应用方面,盘古中医药大模型展现出了广阔的前景和潜力。首先,在中药方剂推荐方面,该模型能够根据患者的症状和体质,智能推荐个性化的中药方剂,提高了中医治疗的精准度和效果。其次,在药材质量控制方面,该模型能够通过对药材的性状、产地、采收时间等信息的分析,辅助鉴别药材的真伪和优劣,确保了药材的质量和安全。此外,在病症辅助诊断、新药研发以及健康管理等方面,华为中医药大模型也都能够发挥重要的作用。
10. 华佗中医药大模型 亳州,中国药都,华佗是东汉末年的杰出医学家,其故乡正是现在的亳州市,此次亳州与华为公司合作建设华佗中医药大模型。亳州市与华为公司强强联合,充分利用华为算力、算法优势,亳州中医药政策、区域、资源、数据优势,打造首个中医药产业大模型——华佗中医药大模型。根据《华佗中医药大模型建设方案》,亳州市将构建全球首个中医药产业大模型,落实国家人工智能 + 行业战略目标,赋能中医药行业提质增效。建设华佗中医药大模型创新中心,打造世界中医药之都、全国中医药产业高地、中医药进入国际市场的'桥头堡'。《华佗中医药大模型建设方案》明确:以华佗中医药大模型创新中心、产业交易平台、产业数据平台、产业大模型服务平台等'一中心三平台'构建华佗中医药产业大模型,整合中医药产业资源。围绕生产、贸易、服务、管理,以新产业、新模式、新动能为核心完善产业布局,汇聚亳州中医药数据,明确中药、中医价值场景和需求,持续发展'人工智能 +'融合新业态,推动亳州中医药产业的创新和升级。
11. 岐黄问道中医药大模型 2023 年 7 月 28 日下午,由国内数智中医行业的领军企业南京大经中医药信息技术有限公司研发的'岐黄问道·大模型'在南京江北新区产业技术研创园隆重发布。来自医疗界、技术界、投资界、中医药与大健康产业界以及包括新华社、人民日报在内的新闻界的约 100 位嘉宾出席了发布会。岐黄问道大模型是一个基于中医知识和数据的人工智能模型,由大经中医研发和发布。它可以根据用户提供的疾病、症状、体征等信息,给出中医的诊断和治疗方案,包括中药、食疗、茶饮、推拿、艾灸等多维度的养生调理建议。它的目的是实现中医临床诊疗和健康养生的智能化,传承和发展中医药文化。岐黄问道大模型包括三个方向的子模型:基于已确诊疾病的临床诊疗大模型;仅仅基于症状、体征的临床诊疗大模型;中医养生调理大模型。岐黄问道大模型是国内首个以中医为核心的垂直领域大模型,也是年轻人养生的第一个大模型。它有助于中医药数智化发展,也有助于普及中医药知识和服务,提高人们的健康水平和生活质量。
12. 讯飞星火中医药大模型 2024 年 6 月 27 日,科大讯飞正式对外发布讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。随着新版本的发布,讯飞星火 V4.0 七大核心能力全面升级,在 8 个国际主流测试集中排名第一,整体超越 GPT-4 Turbo,领先国内大模型。现场刘庆峰分享的数据显示,在海量知识问答、复杂语言理解、专业文书生成、诊断治疗推荐、多轮交互以及多模态交互等方面,讯飞星火医疗核心能力全面超过 GPT-4 Turbo 和 GPT-4o。刘庆峰称,当前,星火 APP 下载量已经达到了 1.31 亿,涌现出一批用户喜爱的应用助手。在星火大模型的加持下,部分场景下的智能硬件销量同比增长 70%+,月均使用时次数超过 4000 万。另外,星火 V4.0 大模型是基于全国首个国产万卡算力集群「飞星一号」训练而成,意味着完全自主可控。
13. 聪宝素问大模型 2023 年 8 月 12 日,全国首个公开发布的中医 GPT—'聪宝素问',在第九届中国中医药信息大会上正式上线 2.0 版本。'聪宝素问 2.0'由聪宝科技创始人顾高生发布,中国中医药信息学会会长、国家中医药管理局原副局长吴刚,中国中医药信息学会副会长兼执行秘书长朱佳卿,华润数科华润云事业部行业生态部专家邓通参与发布仪式。而中医奠基之作《黄帝内经》的成书体裁,与 GPT 有着惊人的相似之处:整本书是以问题为牵引,通过黄帝和岐伯的对话来解析中医。黄帝就是'提示词工程师',与岐伯'连续对话',产生'生成式内容'。《黄帝内经》由《素问》《灵枢》两卷组成,起名为'聪宝素问',印证了这段跨越千年的机缘。目前,'素问 GPT'已正式进入临床应用阶段,可广泛应用于康养机构、药店诊所、文旅养生,药膳餐饮等众多领域,形成对应的服务解决方案。未来,'素问 GPT'还将开放更多应用场景,并提供新场景的订制服务。
14. 天河灵枢大模型 2024 年 4 月 10 日,在第三届中医药高质量发展大会暨新时代中医药高质量发展战略研讨会上,由国家超级计算天津中心联合现代中医药海河实验室及天津中医药大学、天津大学、信创海河实验室等团队合作研发的'天河灵枢大模型'装置正式发布。'天河灵枢大模型'的命名来源于中国传统医学著作《灵枢》,与《素问》九卷合称《黄帝内经》。'天河灵枢大模型'是基于中医经典名著和针灸临床循证证据库以及中医循证知识图谱等专业数据,这是一款面向中医针灸领域的专业大模型。'天河灵枢大模型'学习了上百本中医经典,经过上万篇循证证据训练,具备深厚的中医理论知识,可作为中医智慧助手为用户提供精准且专业的解答。无论是对中医理论的深入探讨,还是对健康问题的细致剖析,'天河灵枢大模型'均能迅速给出详尽且深入的回应。当用户寻求针灸治疗建议时,'天河灵枢大模型'能够迅速分析用户的病情,提出包括针刺、艾灸、按压等多种针灸治疗方法的个性化建议。
15. 中医药横琴大模型 2023 年 12 月 28 日,中医药广东省实验室第一届学术委员会第一次会议暨首届横琴中医药科技创新大会在横琴粤澳深度合作区举行。会上,正式启动了中医药横琴大模型和中药新药智能自动化融合创新平台。据介绍,中医药横琴大模型汇集海量中医药数据,包含 100 亿字符的中医知识文本以及中医院的数字化病例,依托高可信中医诊疗知识库,辅助医生精准诊疗,提供个性化治疗方案。中药新药智能自动化融合创新平台通过工程化开发,基于机器人与自动化技术实现中药成分获取、结构表征、生物活性测定等全实验流程一站式解决方案。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
curl 转代码 解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online