AI 大模型在金融、医疗、法律等垂直领域的创新应用与突破
本文系统梳理了 AI 大模型在医疗、心理健康、法律、金融、教育及交通等多个垂直行业的应用现状。内容涵盖 DoctorGLM、HuatuoGPT、ChatLaw、FinGPT 等代表性开源模型的技术特点与项目地址,同时介绍了 PromptCBLUE、LEXTREME、FinEval 等行业评测基准。文章旨在展示大模型如何通过指令微调与领域知识融合,解决各行业的专业痛点,并为开发者提供技术选型参考。

本文系统梳理了 AI 大模型在医疗、心理健康、法律、金融、教育及交通等多个垂直行业的应用现状。内容涵盖 DoctorGLM、HuatuoGPT、ChatLaw、FinGPT 等代表性开源模型的技术特点与项目地址,同时介绍了 PromptCBLUE、LEXTREME、FinEval 等行业评测基准。文章旨在展示大模型如何通过指令微调与领域知识融合,解决各行业的专业痛点,并为开发者提供技术选型参考。

随着人工智能技术的飞速发展,通用大语言模型(LLM)正逐步向垂直领域深化。通过海量专业数据的微调与指令优化,大模型在医疗、法律、金融、教育等行业展现出显著的应用价值。本文梳理了当前开源社区中具有代表性的行业大模型及其评测基准,旨在为相关技术研究与落地提供参考。
医疗领域对准确性要求极高,以下模型基于中文医疗对话数据集及医学知识图谱进行了深度优化。
基于 ChatGLM-6B 的卓越中文问诊模型,融合了海量中文医疗对话数据集进行精准微调,采用 LoRA、P-tuningv2 等前沿技术实现高效部署。
该项目集大成者,开源了多款经过中文医学指令微调的大语言模型,涵盖 LLaMA、Alpaca-Chinese、Bloom 等。皆以医学知识图谱和医学文献为基础,结合 ChatGPT API 精心打造,实现了中文医学指令微调数据集的精准训练,极大提升了医疗领域问答的准确性与实用性。
该项目同样基于中文医学指令微调,对 ChatGLM-6B 模型进行了深度优化,微调数据与 BenTsao 项目一脉相承,确保了模型在医疗领域的卓越表现。
该项目开创性地推出了生活空间健康大模型,深度整合了当前开源的中文医疗问答数据集,结合自建的生活空间健康对话大数据,构建了千万级别的扁鹊健康大数据 BianQueCorpus,基于此精心打造了 ChatGLM-6B 为初始化的 BianQue 模型,全面提升了模型在医疗与健康领域的应用价值。
该项目鼎力推出医疗大模型 HuatuoGPT,其中包括了基于 Baichuan-7B 训练的 HuatuoGPT-7B 与基于 Ziya-LLaMA-13B-Pretrain-v1 的 HuatuoGPT-13B,旨在提供全方位、高标准的医疗智能服务。
该项目通过启真医学知识库的精妙运用,构建了独具匠心的中文医学指令数据集,进一步在 Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B 等尖端模型上精心调整指令,显著提升了模型在中文医疗环境中的实用效果。
该项目创新性地发布了中文医疗大模型 ChatMed-Consult,以 ChatMed_Consult_Dataset 中超过 50 万的中文医疗在线问诊数据及 ChatGPT 的精准回复作为训练基石,基于 LlaMA-7b 并通过 LoRA 技术进行了细致微调。
该项目推出了中文中医药领域的杰出模型 ShenNong-TCM-LLM,以中医药知识图谱为基础,运用实体为核心的自指令方法,通过 ChatGPT 生成了丰富的 2.6 万 + 中医药指令数据集 ChatMed_TCM_Dataset,再基于 LlaMA 底座,借助 LoRA 技术进行了精准微调。
该项目开创了中文多模态医学数据集与模型的先河,尤其在医学影像诊断与多轮交互对话中展现出卓越的潜能。
该项目隆重推出了医疗大模型 MedicalGPT,集成了增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和 DPO(直接偏好优化)等前沿技术。
该项目推出了中文医疗大模型 Sunsimiao,该模型以 baichuan-7B 和 ChatGLM-6B 为坚实底座,在数十万条高质量的中文医疗数据中进行了精心微调。
该项目推出了医疗大模型 CareLlama,并汇集了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,旨在为医疗 LLM 的快速发展注入强劲动力。
该项目由复旦大学发布,针对医疗健康对话式场景精心设计了医疗领域大模型与数据集。模型通过 DISC-Med-SFT 数据集在 Baichuan-13B-Base 基础上进行指令微调,有效匹配了医疗场景下的人类偏好,缩小了通用语言模型输出与真实世界医疗对话之间的差距。
本项目公开了前沿的医疗大模型 PMC-LLaMA,其中包含 MedLLaMA_13B 预训练版本与 PMC_LLaMA_13B 指令微调版本,为医疗领域带来了革新的技术突破。
ChatDoctor,一款基于 LLaMA 训练的医疗大模型,其开源特性让更多人能够领略医疗科技的魅力。
MING,一个基于 bloomz-7b 指令微调而成的医疗大模型,其卓越的性能在医疗问答、智能问诊等方面得到了充分体现。
IvyGPT,一款医疗大模型,经过高质量的医学问答数据监督微调和人类反馈强化学习训练,展现了出色的智能医疗处理能力。
本项目开源了中文医疗大模型 PULSE,该模型采用约 4,000,000 个中文医学与通用领域指令微调数据进行优化,支持广泛的医疗领域自然语言处理任务,包括健康教育、医师考试问题解答、报告解读、医疗记录结构化以及模拟诊断和治疗等。
HuangDI,一款中医大模型,其独特之处在于融合了中医教材、网站数据与 Ziya-LLaMA-13B-V1 基座模型,打造出具有深厚中医知识理解力的预训练模型,并通过海量中医古籍指令对话数据与通用指令数据进行微调,实现中医古籍知识问答的精准能力。
ZhongJing,一个旨在传承中医精髓与现代技术相结合的中医大模型。该项目不仅弘扬了中医的博大精深,还通过现代技术创新,为医学领域提供了可信赖和专业的工具,是中医与 AI 融合的杰出代表。
该项目旨在通过大型模型技术,实现中医临床辅助诊疗(包括病证诊断、处方推荐等)以及中医药知识问答等多项任务,引领中医知识问答与临床辅助诊疗等领域的飞跃性进步。当前,我们已针对中医临床智能诊疗中的处方推荐问题,发布了 TCMLLM-PR 这一中医处方推荐大模型。该模型通过整合真实世界的临床病历、医学典籍与中医教科书等海量数据,精心构建了包含 68k 数据条目的处方推荐指令微调数据集,并在 ChatGLM 大模型上进行深度优化与微调。
该项目致力于开源多模态生物医学大模型,涵盖了 BioMedGPT 这一多模态生物医药大模型、DrugFM 和 MolFM 等多模态小分子基础模型,以及 CellLM 等细胞表示学习模型。
心理健康领域需要更强的共情能力与长文本理解能力,以下模型专注于心理支持与咨询。
该项目致力于开源中文心理健康支持对话大模型与数据集。该模型基于 ChatGLM-6B LoRA 16-bit 指令进行了细致的微调。同时,我们通过 ChatGPT 技术将真实的心理互助 QA 改写为多轮的心理健康支持多轮对话,构建了含有 56k 个多轮对话的丰富数据集。该数据集的主题、词汇和篇章语义丰富多样,特别适用于长程多轮对话的应用场景。
该项目开源了心理健康大模型 SoulChat(灵心)。该模型源于 ChatGLM-6B 的深厚底蕴,经过百万规模心理咨询领域的中文长文本指令与多轮共情对话数据的精心微调,得以诞生。它不仅仅是一个模型,更是人们心灵的守护者,静静倾听,深情理解。
这一项目致力于开源心理大模型 MindChat。经过人工精心清洗的约 20 万条高质量多轮心理对话数据,涵盖了工作、家庭、学习、生活、社交、安全等多个层面,为模型的训练提供了丰富的素材。MindChat 期望从心理咨询、心理评估、心理诊断、心理治疗四个维度,为人们带来心灵的慰藉与解脱,提升整体的心理健康水平。
在儿童情感陪伴领域,QiaoBan 这一儿童情感对话大模型应运而生。它基于开源通用大模型,融合了通用域人机对话、单轮指令数据以及专为儿童设计的情感陪伴对话数据,经过精心微调,最终形成了这款专为儿童量身打造的情感陪伴大模型。
法律领域强调逻辑推理与法条准确性,以下模型针对司法场景进行了专项优化。
这一中文法律通用模型源自 ChatGLM-6B 与 LoRA 16-bit 指令的精心融合。数据集方面,项目团队不仅利用了现有的法律问答数据集,更通过 self-Instruct 技术,基于法条和真实案例构建了高质量的法律文本问答数据,大幅提升了模型在法律领域的表现,确保了回答的专业性和可靠性。
LaWGPT 系列模型在通用中文基座模型的基础上,增添了法律领域的专有词表和大规模中文法律语料,极大地增强了模型在法律领域的基础语义理解能力。结合法律领域对话问答数据集、中国司法考试数据集的指令精调,LaWGPT 对法律内容的理解和执行能力得到了显著提升。
LexiLaw,这一中文法律大模型,以 ChatGLM-6B 为架构基础,经过法律领域数据的精心微调,使得其在法律咨询与支持方面展现出卓越的性能和专业性。无论是法律从业者、学生还是普通用户,LexiLaw 都能为他们提供准确、可靠的法律咨询服务。
这一项目开源了法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型 Lawyer LLaMA。LLaMA 经过大规模法律语料库的预训练,深入系统地学习了中国的法律知识体系。在此基石之上,我们借助 ChatGPT 的智慧,搜集了一系列针对中国国家统一法律职业资格考试客观题的分析和法律咨询的回答,并通过对这些宝贵数据的指令微调,使模型具备了将法律知识灵活应用于各种具体场景的能力。
HanFei-1.0 作为国内首个全参数训练的法律大模型,拥有高达 7b 的参数量,其功能涵盖法律问答、多轮对话、文章撰写、检索等多元化需求。
北京大学开源的法律大模型系列——ChatLaw,依托海量的法律新闻、论坛、法条、司法解释、法律咨询、法考题及判决文书等原始文本,构建了丰富的对话数据。ChatLaw-13B 和 ChatLaw-33B 便是基于姜子牙 -13B、Anima-33B 的卓越训练成果。同时,ChatLaw-Text2Vec 更是利用 93 万条判决案例,基于 BERT 训练出相似度匹配模型,精准匹配用户提问与对应法条。
我们开源了基于 GLM-10B 模型的中文司法领域大模型 Law-GLM-10B,经过 30GB 中文法律数据的指令微调,展现出卓越的司法领域应用能力。
由浙江大学、阿里巴巴达摩院及华院计算携手打造的法律大模型,该模型基于 Baichuan-7B 进行了法律领域数据的深度预训练与指令微调,并独具匠心地设计了知识增强的推理流程。
该项目基于丰富的中文法学语料库,精心训练了一系列法律领域的语言模型,包括 AI Judge(可解释的法律判决预测模型)和 AI Lawyer(智能法律咨询模型)。
该模型汇聚了法律领域的智慧,致力于司法领域的深度应用与探索。以 ChatGLM 为基石,构建了一个中文司法大模型,依托海量的中文无监督司法语料与精准的有监督司法微调数据。这款模型功能丰富,涵盖法条检索、案例分析、三段论推理判决以及司法对话等。
金融领域关注数据准确性与风险控制,以下模型针对金融语料进行了深度定制。
该项目不仅开源了中文金融领域语料库 BBT-FinCorpus,还推出了知识增强型大模型 BBT-FinT5 及评测基准 CFLEB,展现了其在金融领域的深厚积累。
该项目凭借对公开和爬取的中文金融领域问答数据的深入挖掘,构建了独特的指令数据集,并对 LLaMA 系模型进行了精准指令微调,显著提升了模型在金融领域的问答效果。
作为国内首个开源的千亿级中文对话大模型,轩辕更是针对中文金融领域进行了深度优化。它基于 BLOOM-176B 进行了针对性预训练与微调,既能处理通用领域问题,又能提供全面且准确的金融信息与建议。
本项目公开了金融领域的指令微调数据集 FIT,以及大型模型 FinMA 与评估基准 FLARE,为金融领域注入了智能化新动力。
本项目贡献了多个金融领域的大模型,涵盖 ChatGLM2-6B+LoRA 和 LLaMA2-7B+LoRA 等,并汇集了金融新闻、社交媒体、财报等多维度中英文训练数据。
本项目倾力打造了金融大模型 FLANG,为金融行业的智能化发展再添新翼。
FinEval,一个专注于金融知识的评测基准,汇聚了 4,661 道高质量多项选择题,覆盖金融、经济、会计、证书等多个领域,涉及 34 个不同学术科目。
教育领域注重个性化学习与资源管理,以下模型服务于教学全流程。
该项目引领了国际中文教育领域的潮流,通过开源大模型,汇集了 500 余册国际中文教育教材与教辅书、汉语水平考试试题以及汉语学习者词典等资源,构建了国际中文教育资源库。精心设计的 88000 条高质量问答数据集,让模型在国际中文教育场景中灵活应用知识。
该项目在教育垂直领域展现出了卓越的对话能力,其大模型融合了多样化的教育资源,并通过指令微调、价值观对齐等方法,为教育场景下的出题、作业批改、情感支持等提供了全面支持。它服务于教师、学生和家长,致力于实现智能化、个性化的教育。
除上述核心领域外,大模型技术也在自媒体、电商、政务、地理、交通、安全及科研等领域取得进展。
当前,垂直行业大模型已成为人工智能落地的重要方向。通过特定领域数据的持续迭代与评估基准的完善,模型在专业性、安全性及实用性上不断逼近人类专家水平。然而,面对幻觉问题、数据隐私保护及算力成本等挑战,未来仍需学术界与产业界共同努力,推动大模型技术在更多关键行业中实现安全、可控、高效的规模化应用。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online