北大法律大模型 ChatLaw 技术解析
随着语言大模型不断向垂直行业领域拓展,北京大学团队发布的法律大模型 ChatLaw 近期引起了广泛关注。该模型旨在解决当前法律服务供需失衡的问题,通过对话方式为普通人提供普惠的法律服务。
北大团队发布法律垂直大模型 ChatLaw,旨在解决法律服务供需失衡问题。模型包含 13B、33B 及 Text2Vec 三个版本,基于 Ziya-LLaMA 和 Anima 等基座微调。采用 LoRA 降低训练成本,结合 BERT 与 Faiss 实现法条匹配,并通过 ELO 机制评估法律选择题能力。项目开源,支持文件上传与法律文书生成,致力于提供普惠法律服务。

随着语言大模型不断向垂直行业领域拓展,北京大学团队发布的法律大模型 ChatLaw 近期引起了广泛关注。该模型旨在解决当前法律服务供需失衡的问题,通过对话方式为普通人提供普惠的法律服务。
目前,ChatLaw 主要包含三个版本,分别针对不同的应用场景和性能需求:
这是学术 Demo 版,基于姜子牙 Ziya-LLaMA-13B-v1 训练而来。该版本在中文各项表现上良好,适合基础问答。但由于参数规模限制,在处理逻辑复杂的法律问答时效果可能不佳,需要更大参数的模型来支持。
同样为学术 Demo 版,基于 Anima-33B 训练而来。相比 13B 版本,其逻辑推理能力大幅提升。不过,由于 Anima 基座模型的中文语料相对较少,问答时常会出现英文数据混入的情况,需进一步优化。
这是一个基于 BERT 训练的相似度匹配模型。它使用了 93 万条判决案例组成的数据集,能够将用户提问信息与对应的法条进行精准匹配,作为检索增强生成(RAG)的关键组件。
根据官方演示,ChatLaw 支持多种交互方式:
该项目在 GitHub 上的 Star 量已达到 1.1k,显示出社区对其开源价值的认可。
ChatLaw 的数据主要由论坛讨论、新闻资讯、法律法规、司法解释、法律咨询记录、法考题目及判决文书组成。数据经过清洗和数据增强后构造为对话数据。通过与北大国际法学院及知名律师事务所合作,确保知识库的及时更新和专业性。
数据示例包括:
为了训练 ChatLaw,研究团队在 Ziya-LLaMA-13B 的基础上使用低秩自适应(Low-Rank Adaptation, LoRA)进行了微调。LoRA 技术通过在预训练权重旁添加可训练的低秩分解矩阵,显著降低了显存占用和训练成本,同时保持了模型的性能。
此外,研究引入了 self-suggestion 角色机制,旨在缓解大模型常见的幻觉问题。训练过程在多个 A100 GPU 上进行,并借助 DeepSpeed 框架进一步优化了分布式训练效率。
在检索阶段,研究团队经历了从传统方法到向量检索的演进:
这种混合架构将通识模型、专业模型和知识库融为一体,并在推理时对模型生成内容进行约束,确保生成的法律法规准确无误。
研究收集了十余年的国家司法考试题目,整理出包含 2000 个问题及其标准答案的测试数据集,用于衡量模型处理法律选择题的能力。
由于各模型在绝对准确率上普遍偏低,单纯比较准确率意义有限。因此,研究借鉴英雄联盟的 ELO 匹配机制,构建了模型对抗的 ELO 评分系统,以更有效地评估模型在法律领域的相对表现。
通过对实验结果的分析,得出以下结论:
除了北大团队,业界也在积极布局法律垂直大模型。例如,幂律智能联合智谱 AI 发布了千亿参数级法律垂直大模型 PowerLawGLM,该模型针对中文法律场景的应用效果展现出了独特优势。这表明法律大模型已成为 AI 落地的重要方向之一。
目前,由于项目火爆,服务器曾出现崩溃情况,算力已达上限。团队正在修复中。对于开发者而言,感兴趣的读者可以在 GitHub 上部署测试版模型进行本地测试。
尽管 ChatLaw 取得了显著进展,但仍面临一些挑战:
ChatLaw 展示了大模型在垂直法律领域的巨大潜力。通过结合 LoRA 微调、向量检索和对抗评估机制,该模型在提供法律咨询、文书生成等方面展现了实用价值。随着技术的迭代和数据的积累,法律大模型有望成为普通人和法律从业者的重要辅助工具。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online