1. KAG 简介
浙江大学与蚂蚁集团推出的知识增强生成(KAG)框架,旨在解决传统检索增强生成(RAG)方法在多跳推理和复杂逻辑处理中的不足。KAG 通过结合知识图谱(KGs)和创新技术,显著提升了大语言模型在专业领域问答中的准确性和效率。
KAG 框架的五大创新亮点:
- LLM 友好的知识表示:通过层次化的知识组织,使大语言模型更适应专业领域的知识处理。
- 知识图谱与文本块互索引:提高了数据检索的精确度和效率,增强了知识的整合能力。
- 逻辑形式引导推理:结合语言推理与符号推理,支持复杂的多轮推理和问题求解。
- 知识对齐与语义推理:通过语义推理对齐不同层次的知识,提升了推理的准确性。
- 模型能力增强:优化大语言模型的推理能力,提升了专业领域问答系统的整体表现。
在蚂蚁集团,KAG 成功应用于电子政务和电子健康项目。在电子政务中,KAG 开发了一个高效的政府服务问答系统;在电子健康中,KAG 提升了医疗问答系统的准确度,尤其在医学指标解读和推荐方面,展现了强大的推理能力。
2. KAG 与常见 RAG 优化方法的比较
KAG 框架在多跳推理和复杂查询处理上明显优于传统的 RAG 方法。为了更好地理解 KAG 的优势,以下是与常见几种 RAG 优化方法的对比:
- Light RAG 和 Graph RAG:这两种方法通过使用知识图谱保持实体间的逻辑连接,解决了传统 RAG 方法在处理实体之间关系时丧失逻辑连贯性的问题。它们通常通过简单的知识图谱索引来进行检索,较为依赖基础的相似性匹配。
- KAG:相比于 Light RAG 和 Graph RAG,KAG 不仅仅保留了知识图谱中的实体关系,还引入了多跳问答和推理能力。KAG 框架的核心优势在于其通过逻辑形式推理引擎,将复杂问题分解为多个子问题,通过多次检索和推理逐步构建答案。KAG 能够在不同的推理层面上进行跨模态的信息处理,使得多步推理问题得到有效解决。
简而言之,KAG 不仅仅保持了知识图谱的优势,还通过更为复杂的推理流程,提升了 LLM 在处理复杂问题时的能力。
3. KAG 在数据摄取和数据查询阶段的优化
KAG 在数据摄取 (Data Ingestion) 和数据查询 (Data Querying) 两个阶段进行了诸多优化,以确保大语言模型能更准确、高效地响应复杂查询。以下是其在这两个阶段的创新:
数据摄取阶段的优化
- LLM 友好的知识表示:KAG 使用 LLMFriSPG 框架,这是一种为 LLM 定制的知识表示方式,它将知识组织成层次结构,包括数据、信息和知识。该框架支持无模式的信息提取,以及模式约束的专业知识构建,有效解决了不同领域知识的表示问题。
- 互索引系统:KAG 建立了知识图谱和原始文本块之间的互索引系统,保证了知识图谱和文本块的统一表示、推理和检索。这种互索引方式使得 KAG 能够高效地从知识图谱中获取有价值的信息,同时增强了推理的深度和精度。
- 语义分块:为了更好地适应 LLM 的输入要求,KAG 将文档划分为语义一致的语义块,每个块都包含 ID、摘要、主要文本等字段,并且维护原文档与分块之间的双向关系。这种分块方式使得每个语义块都能保持独立的上下文和主题一致性。
- 信息提取与知识图谱构建:KAG 通过信息提取(例如实体、事件、关系等)构建了 KGfr(知识图谱框架),并通过互索引将这些提取的知识和文本块关联起来。通过这种方式,KAG 能够更精确地进行知识的索引和推理。
数据查询阶段的优化
- 逻辑形式引导的混合推理引擎:KAG 使用逻辑形式引导的混合推理引擎,通过将自然语言问题转化为符号化的推理问题,实现了多种推理方式的组合,如文本检索、知识图谱推理、语言推理和数值计算。这种多元化的推理方式使得 KAG 能够更加精确地处理复杂的查询。
- 多轮解题机制:在面对复杂问题时,KAG 能够通过多轮推理机制反思和存储中间结果,确保问题得到有效解决。如果一个问题无法一次解决,系统会在全局记忆中存储结果,并生成补充性问题以进一步推理。
- 语义推理与知识对齐:KAG 利用语义推理和知识对齐技术,通过对知识图谱中不同粒度的知识进行语义对齐,降低噪声,提高图谱的连通性和准确性。这使得 KAG 在处理需要深度理解的查询时,能够利用语义推理弥补知识图谱中的空白。


