引言
垂直领域大语言模型(Vertical LLMs)是指针对特定行业或场景进行预训练或指令微调的模型。相比通用模型,它们在专业术语理解、任务执行精度及合规性方面表现更优。以下整理了医疗、法律、金融、教育等关键领域的开源模型及评测基准。
一、医疗领域大模型
1. DoctorGLM
基于 ChatGLM-6B 的卓越中文问诊模型,融合海量中文医疗对话数据集进行精准微调,采用 LoRA、P-tuningv2 等技术实现高效部署。 项目地址:https://github.com/xionghonglin/DoctorGLM 论文地址:https://arxiv.org/abs/2304.01097
2. BenTsao (本草)
开源多款经过中文医学指令微调的大语言模型,涵盖 LLaMA、Alpaca-Chinese、Bloom 等,以医学知识图谱和文献为基础,结合 ChatGPT API 打造,提升医疗问答准确性。 项目地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese 论文地址:https://arxiv.org/abs/2304.06975
3. Med-ChatGLM
基于中文医学指令微调,对 ChatGLM-6B 深度优化,微调数据与 BenTsao 一脉相承,确保医疗领域卓越表现。 项目地址:https://github.com/SCIR-HI/Med-ChatGLM
4. BianQue (扁鹊)
推出生活空间健康大模型,整合开源中文医疗问答数据集及自建健康对话大数据,构建千万级 BianQueCorpus,基于 ChatGLM-6B 初始化。 项目地址:https://github.com/scutcyr/BianQue
5. HuatuoGPT (华佗)
推出医疗大模型 HuatuoGPT,包含基于 Baichuan-7B 训练的 HuatuoGPT-7B 与基于 Ziya-LLaMA-13B-Pretrain-v1 的 HuatuoGPT-13B,提供全方位医疗智能服务。 项目地址:https://github.com/FreedomIntelligence/HuatuoGPT 论文地址:https://arxiv.org/abs/2305.15075
6. QiZhenGPT
运用启真医学知识库构建中文医学指令数据集,在 Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B 等模型上调整指令,提升中文医疗环境实用效果。 项目地址:https://github.com/CMKRG/QiZhenGPT
7. ChatMed
发布中文医疗大模型 ChatMed-Consult,以超过 50 万条中文医疗在线问诊数据及 ChatGPT 回复为训练基石,基于 LlaMA-7b 通过 LoRA 技术微调。 项目地址:https://github.com/michael-wzhu/ChatMed


