医疗大模型：数据与知识双轮驱动的医学推理与临床决策支持 | 极客日志

PythonAI算法

医疗大模型：数据与知识双轮驱动的医学推理与临床决策支持

启真医学大模型项目，采用数据与知识双轮驱动的技术路线，通过构建包含真实医患问答、药品及疾病知识的指令数据集进行指令微调。文章详细阐述了模型训练细节、快速使用方法及效果对比。评测结果显示，QiZhen 系列模型在药品适应症、疾病临床表现等任务上，相比 ChatGLM 和 ChatGPT 在准确率上有显著提升，有效减少了医疗幻觉问题，展示了大模型在医疗推理、医患问答及临床决策支持方面的应用潜力。

性能调优发布于 2025/2/6更新于 2026/7/1231 浏览

医疗大模型：数据与知识双轮驱动实现医学推理、医患问答、病历自动生成与临床决策

1. 指令数据集构建

目前大多数开源的 ChatLLM 项目使用的是其他模型（如 ChatGPT）生成的指令数据，其不可避免的存在数据幻想的问题，数据幻想问题将严重影响 LLM 在实际场景中的应用和拓展。因此，本项目为了提高医疗领域的知识问答的准确性，使用如下方式构造指令数据集：

启真医学知识库收录的真实医患知识问答数据（疾病、药品、检查检验、手术、预后、食物等），共计 560K 条指令数据；
药品知识数据：在启真医学知识库的药品文本知识基础上，通过对半结构化数据设置特定的问题模板（如："{药品}的适应病症是什么？"）构造指令数据集，共计 180K 条指令数据；
疾病知识数据：在启真医学知识库的疾病文本知识基础上，通过对半结构化数据设置特定的问题模板（如："{疾病}的典型症状是什么？"）构造指令数据集，共计 298K 条指令数据。

1.1 训练细节

QiZhen-Chinese-LLaMA-7B-Checkpoint-3500：本项目基于进行指令微调，该项目在 7 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 3500 steps（训练 23h50min）；
QiZhen-Chinese-LLaMA-7B-Checkpoint-6000：本项目基于进行指令微调，该项目在 7 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 6000 steps（训练 40h56min）；
QiZhen-ChatGLM-6B-Checkpoint-2500：本项目基于进行指令微调，该项目在 7 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 2500 steps（训练 16h20min）；
QiZhen-CaMA-13B-Checkpoint-3600：本项目基于进行指令微调，该项目在 7 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 3600 steps（训练 37h37min）；
QiZhen-CaMA-13B-Checkpoint-6000：本项目基于进行指令微调，该项目在 7 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 6000 steps（训练 54h30min）；
QiZhen-CaMA-13B-Checkpoint-12400：本项目基于进行指令微调，该项目在 6 张 A800(80G) 上进行训练，本次开源的是 LoRA 权重为训练过程中的第 12400 steps（训练 114h46min）。

1.2 模型下载

模型	指令数据集	Base Model	LoRA 下载
QiZhen-Chinese-LLaMA-7B-Checkpoint-3500	740K	Chinese-LLaMA-Plus-7B	-
QiZhen-Chinese-LLaMA-7B-Checkpoint-6000	740K	Chinese-LLaMA-Plus-7B	-
QiZhen-ChatGLM-6B-Checkpoint-2500	740K	ChatGLM-6B	-

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

pip install -r requirements.txt

sh scripts/merge_llama_plus.sh

python gradio_chinese_llama_demo.py

pip install -r requirements.txt

python gradio_chatglm_demo.py

pip install -r requirements.txt

python gradio_cama_demo.py

模型	标准 1	标准 2	标准 3
ChatGLM	39.36%	23.16%	14.74%
ChatGPT	47.87%	30.85%	15.96%
QiZhen-Chinese-LLaMA-7B-Checkpoint-3500	77.66%	55.32%	40.00%
QiZhen-Chinese-LLaMA-7B-Checkpoint-6000	90.43%	73.40%	65.96%
QiZhen-CaMA-13B-Checkpoint-3600	82.29%	60.62%	47.92%
QiZhen-CaMA-13B-Checkpoint-6000	90.43%	80.85%	72.34%
QiZhen-CaMA-13B-Checkpoint-12400	91.49%	82.98%	72.34%

模型	临床表现标准 1	临床表现标准 2	临床表现标准 3	检查检验标准 1	检查检验标准 2	检查检验标准 3	治疗药物标准 1	治疗药物标准 2	治疗药物标准 3
chatglm	90.00%	6.00%	3.00%	93.00%	11.00%	6.00%	60.00%	10.00%	5.00%
chatgpt	94.00%	11.00%	4.00%	97.00%	8.00%	5.00%	62.00%	11.00%	4.00%
QiZhen-CaMA-13B-Checkpoint-12400	95.00%	15.00%	7.00%	97.00%	20.00%	7.00%	75.00%	36.00%	23.00%

医疗大模型：数据与知识双轮驱动的医学推理与临床决策支持

医疗大模型：数据与知识双轮驱动实现医学推理、医患问答、病历自动生成与临床决策

1. 指令数据集构建

1.1 训练细节

1.2 模型下载

更多推荐文章

相关免费在线工具

2. 模型快速使用

2.1 QiZhen-Chinese-LLaMA-7B

2.2 QiZhen-ChatGLM-6B

2.3 QiZhen-CaMA-13B-Checkpoint-3600

3. 效果展示

3.1 模型效果对比

测试 1

测试 2

测试 3

测试 4

3.2 实验评测

3.2.1 药品适应症评测

3.2.2 疾病评测

4. 总结与展望

更多推荐文章

相关免费在线工具

医疗大模型：数据与知识双轮驱动的医学推理与临床决策支持

医疗大模型：数据与知识双轮驱动实现医学推理、医患问答、病历自动生成与临床决策

1. 指令数据集构建

1.1 训练细节

1.2 模型下载

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 模型快速使用

2.1 QiZhen-Chinese-LLaMA-7B

2.2 QiZhen-ChatGLM-6B

2.3 QiZhen-CaMA-13B-Checkpoint-3600

3. 效果展示

3.1 模型效果对比

测试 1

测试 2

测试 3

测试 4

3.2 实验评测

3.2.1 药品适应症评测

3.2.2 疾病评测

4. 总结与展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具