蚂蚁 KAG 开源 AI 知识库框架原理与安装使用教程
最近发现了一款国产开源 AI 知识库框架:KAG(Knowledge Augmented Generation)知识增强生成。
KAG是蚂蚁集团、浙江大学等多方组织联合推出的一款专业领域知识增强服务框架。专门用于构建垂直领域的知识库,在电子政务等场景达到了较高的准确率,电子医疗问答也有出色表现。
什么是 KAG
KAG 是一个基于OpenSPG引擎和大型语言模型(LLM)的推理问答框架,旨在通过结合知识图谱和向量检索的优势,提供更加严谨的决策支持和信息检索服务。
KAG 通过四个关键方面来增强 LLM 和知识图谱:
- 对 LLM 友好的知识表示;
- 知识图谱与原文片段之间的互索引;
- 逻辑形式引导的混合推理引擎;
- 以及与语义推理的知识对齐。
简单来说,KAG 就是通过创新技术,更好的融合了知识图谱和向量检索诞生的一个知识库框架,并可以通过 LLM 逻辑推理结合知识图谱本身的推理去完成信息的检索。当知识图谱无法提供足够的信息时,KAG 会利用向量检索来找到相关的文本片段作为补充。
整体架构
KAG 框架由知识构建 (kg-builder) 和问题求解 (kg-solver) 两大模块组成。其中 kg-builder 针对 LLM 优化了知识表示方式,支持灵活的知识构建和双向索引;kg-solver 则通过混合推理引擎,集成了检索、图谱推理、语言推理和数值计算等多种求解能力。
KAG 和 RAG 对比
| 特性 | RAG | KAG |
|---|---|---|
| 知识表示 | 主要依赖向量相似度进行检索,无法很好地处理需要多跳推理的问题。 | 采用对 LLM 友好的知识表示,兼容无模式和有模式约束的知识,支持图结构知识与文本知识的互索引结构。 |
| 推理能力 | 对知识的逻辑关系不敏感,难以处理需要复杂推理的专业问题。 | 引入了逻辑符号引导的混合推理引擎,能够进行复杂的逻辑推理和多跳事实问答。 |
| 性能 | 在多跳任务和跨段落任务中表现不佳,生成的文本缺乏连贯性和逻辑性。 | 在多跳任务和跨段落任务中表现优异,显著提升了推理准确性和信息覆盖度。 |
| 应用场景 | 适用于一般的文本生成和检索任务,但在专业领域如法律、医学和科学等需要复杂推理的场景中表现不佳。 | 特别适用于需要复杂推理和多跳事实问答的专业领域,如金融、医疗、法律等。 |
KAG 安装、使用、演示
环境要求
官方给出的硬件要求:
- CPU ≥ 8 cores
- RAM ≥ 32 GB
- Disk ≥ 100 GB
虽然要求较高,但在本地 Windows 电脑上(如 16G 内存)也能正常使用。
安装步骤
首先需要安装docker-desktop。不清楚如何安装的朋友可参考官方文档。
- 打开 D 盘,创建一个文件夹
KAG。 - 在 KAG 文件夹内创建一个文件,文件名:。


