浙大与蚂蚁集团 KAG 框架：知识增强生成技术解析

综述由AI生成KAG 框架结合知识图谱与大语言模型，解决传统 RAG 在多跳推理和复杂逻辑处理中的不足。通过 LLM 友好的知识表示、互索引系统、语义分块及逻辑形式引导的混合推理引擎，优化数据摄取与查询阶段。在蚂蚁集团的电子政务和电子健康项目中，KAG 显著提升了问答系统的精度和召回率，展现了专业领域应用效能。

编程诗人发布于 2025/2/7更新于 2026/6/328 浏览

1. KAG 简介

浙江大学与蚂蚁集团推出的知识增强生成（KAG）框架，旨在解决传统检索增强生成（RAG）方法在多跳推理和复杂逻辑处理中的不足。KAG 通过结合知识图谱（KGs）和创新技术，显著提升了大语言模型在专业领域问答中的准确性和效率。

KAG 框架的五大创新亮点：

LLM 友好的知识表示：通过层次化的知识组织，使大语言模型更适应专业领域的知识处理。
知识图谱与文本块互索引：提高了数据检索的精确度和效率，增强了知识的整合能力。
逻辑形式引导推理：结合语言推理与符号推理，支持复杂的多轮推理和问题求解。
知识对齐与语义推理：通过语义推理对齐不同层次的知识，提升了推理的准确性。
模型能力增强：优化大语言模型的推理能力，提升了专业领域问答系统的整体表现。

在蚂蚁集团，KAG 成功应用于电子政务和电子健康项目。在电子政务中，KAG 开发了一个高效的政府服务问答系统；在电子健康中，KAG 提升了医疗问答系统的准确度，尤其在医学指标解读和推荐方面，展现了强大的推理能力。

2. KAG 与常见 RAG 优化方法的比较

KAG 框架在多跳推理和复杂查询处理上明显优于传统的 RAG 方法。为了更好地理解 KAG 的优势，以下是与常见几种 RAG 优化方法的对比：

Light RAG 和 Graph RAG：这两种方法通过使用知识图谱保持实体间的逻辑连接，解决了传统 RAG 方法在处理实体之间关系时丧失逻辑连贯性的问题。它们通常通过简单的知识图谱索引来进行检索，较为依赖基础的相似性匹配。
KAG：相比于 Light RAG 和 Graph RAG，KAG 不仅仅保留了知识图谱中的实体关系，还引入了多跳问答和推理能力。KAG 框架的核心优势在于其通过逻辑形式推理引擎，将复杂问题分解为多个子问题，通过多次检索和推理逐步构建答案。KAG 能够在不同的推理层面上进行跨模态的信息处理，使得多步推理问题得到有效解决。

简而言之，KAG 不仅仅保持了知识图谱的优势，还通过更为复杂的推理流程，提升了 LLM 在处理复杂问题时的能力。

3. KAG 在数据摄取和数据查询阶段的优化

KAG 在数据摄取 (Data Ingestion) 和数据查询 (Data Querying) 两个阶段进行了诸多优化，以确保大语言模型能更准确、高效地响应复杂查询。以下是其在这两个阶段的创新：

数据摄取阶段的优化

LLM 友好的知识表示：KAG 使用 LLMFriSPG 框架，这是一种为 LLM 定制的知识表示方式，它将知识组织成层次结构，包括数据、信息和知识。该框架支持无模式的信息提取，以及模式约束的专业知识构建，有效解决了不同领域知识的表示问题。
互索引系统：KAG 建立了知识图谱和原始文本块之间的互索引系统，保证了知识图谱和文本块的统一表示、推理和检索。这种互索引方式使得 KAG 能够高效地从知识图谱中获取有价值的信息，同时增强了推理的深度和精度。
语义分块：为了更好地适应 LLM 的输入要求，KAG 将文档划分为语义一致的语义块，每个块都包含 ID、摘要、主要文本等字段，并且维护原文档与分块之间的双向关系。这种分块方式使得每个语义块都能保持独立的上下文和主题一致性。
信息提取与知识图谱构建：KAG 通过信息提取（例如实体、事件、关系等）构建了 KGfr（知识图谱框架），并通过互索引将这些提取的知识和文本块关联起来。通过这种方式，KAG 能够更精确地进行知识的索引和推理。

数据查询阶段的优化

逻辑形式引导的混合推理引擎：KAG 使用逻辑形式引导的混合推理引擎，通过将自然语言问题转化为符号化的推理问题，实现了多种推理方式的组合，如文本检索、知识图谱推理、语言推理和数值计算。这种多元化的推理方式使得 KAG 能够更加精确地处理复杂的查询。
多轮解题机制：在面对复杂问题时，KAG 能够通过多轮推理机制反思和存储中间结果，确保问题得到有效解决。如果一个问题无法一次解决，系统会在全局记忆中存储结果，并生成补充性问题以进一步推理。
语义推理与知识对齐：KAG 利用语义推理和知识对齐技术，通过对知识图谱中不同粒度的知识进行语义对齐，降低噪声，提高图谱的连通性和准确性。这使得 KAG 在处理需要深度理解的查询时，能够利用语义推理弥补知识图谱中的空白。

Methods	SampleNum	Precision	Recall
NaiveRAG	492	66.5	52.6
KAG	492	91.6	71.8

浙大与蚂蚁集团 KAG 框架：知识增强生成技术解析

1. KAG 简介

2. KAG 与常见 RAG 优化方法的比较

3. KAG 在数据摄取和数据查询阶段的优化

数据摄取阶段的优化

数据查询阶段的优化

4. KAG 在蚂蚁集团的电子政务及电子健康项目上的应用

更多推荐文章

相关免费在线工具

4.1 KAG 在电子政务中的应用

4.2 KAG 在电子健康中的应用

5. 快速上手

5.1 环境与依赖项安装

5.2 使用步骤

6. 总结

更多推荐文章

相关免费在线工具

浙大与蚂蚁集团 KAG 框架：知识增强生成技术解析

1. KAG 简介

2. KAG 与常见 RAG 优化方法的比较

3. KAG 在数据摄取和数据查询阶段的优化

数据摄取阶段的优化

数据查询阶段的优化

4. KAG 在蚂蚁集团的电子政务及电子健康项目上的应用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4.1 KAG 在电子政务中的应用

4.2 KAG 在电子健康中的应用

5. 快速上手

5.1 环境与依赖项安装

5.2 使用步骤

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具