统一大型语言模型和知识图谱：研究路线图与未来方向

综述了大型语言模型（LLMs）与知识图谱（KGs）的统一研究。针对 LLMs 幻觉、缺乏可解释性及 KGs 构建难、动态性差的问题，提出了三个统一框架：KG 增强的 LLMs、LLM 增强的 KGs 以及协同的 LLM+KGs。文章回顾了各框架下的现有工作，分类总结了预训练增强、推理增强、可解释性分析、嵌入、完成、构建等任务，并指出了错觉检测、知识编辑、多模态融合等未来研究方向，为两种技术的互补结合提供了指导。

霸天发布于 2025/2/6更新于 2026/7/2137 浏览

以 ChatGPT 为代表的大模型，是全新一代知识表示和调用方式，相比以往知识图谱的方式，更加高效智能可扩展等，开启通用人工智能之门。但符号化的知识图谱过时了吗？并非如此，知识图谱和大模型可以进行很好的结合，互相促进，提升知识利用的效果。

图 1: 大模型时代：知识图谱过时了吗？

大型语言模型（LLMs），如 ChatGPT 和 GPT4，由于其新兴能力和通用性，正在自然语言处理和人工智能领域掀起新浪潮。然而，LLMs 是黑箱模型，常常难以捕获和获取事实知识。相比之下，知识图谱（KGs），例如维基百科和华普，是结构化知识模型，明确存储丰富的事实知识。知识图谱可以通过提供外部知识以推理和解释，从而增强 LLMs。同时，知识图谱难以构建并且具有不断演变的特性，这对知识图谱中生成新事实和表示未见知识的现有方法提出了挑战。因此，将 LLMs 和知识图谱统一起来并同时利用它们的优势是互补的。在这篇文章中，我们提出了一个前瞻性的 LLMs 和知识图谱统一的路线图。我们的路线图包括三个总体框架，即 1) 知识图谱增强的 LLMs，它在 LLMs 的预训练和推理阶段，或为了增强对 LLMs 所学知识的理解，将知识图谱纳入其中；2) LLM 增强的知识图谱，利用 LLMs 进行不同的知识图谱任务，如嵌入，完成，构建，图到文本生成和问答；以及 3)协同的 LLMs + 知识图谱，在其中 LLMs 和知识图谱扮演着平等的角色，并以互利的方式工作，以增强 LLMs 和知识图谱对由数据和知识驱动的双向推理。我们在路线图中回顾和总结了这三个框架内的现有努力，并指出了它们的未来研究方向。

1. 引言

图 2: 引言示意图

大型语言模型（LLMs）（例如，BERT [1]，RoBERTA [2] 和 T5 [3]），在大规模语料库上预训练，已经在各种自然语言处理（NLP）任务中展现出了优异的表现，如问题回答 [4]，机器翻译 [5] 和文本生成 [6]。最近，模型规模的急剧增加进一步赋予了 LLMs 新兴的能力 [7]，为将 LLMs 作为人工通用智能（AGI）的应用铺平了道路。像 ChatGPT 和 PaLM2 这样的高级 LLMs，拥有数十亿的参数，在许多复杂的实际任务中展现出了巨大的潜力，如教育 [8]，代码生成 [9] 和推荐 [10]。

尽管 LLMs 在许多应用中取得了成功，但它们因缺乏事实知识而受到批评。具体来说，LLMs 记住了训练语料库中包含的事实和知识 [14]。然而，进一步的研究揭示，LLMs 无法回忆起事实，而且经常会产生幻觉，生成事实上不正确的声明 [15]，[28]。例如，当被问到'爱因斯坦在什么时候发现了重力？'时，LLMs 可能会说'爱因斯坦在 1687 年发现了重力'，这与艾萨克·牛顿制定了引力理论的事实相矛盾。这个问题严重损害了 LLMs 的可信度。

作为黑箱模型，LLMs 也因其缺乏可解释性而受到批评。LLMs 隐含地在它们的参数中表示知识。解释或验证 LLMs 获取的知识很困难。此外，LLMs 通过概率模型执行推理，这是一个不确定的过程 [16]。LLMs 用于得出预测或决策的特定模式和功能对人类来说并不直接可访问或可解释 [17]。尽管一些 LLMs 通过应用思维链 [29] 来解释它们的预测，但它们的推理解释也受到了幻觉问题的影响 [30]。这严重影响了 LLMs 在高风险场景中的应用，如医疗诊断和法律判断。例如，在一个医疗诊断场景中，LLMs 可能会错误地诊断疾病，并提供与医学常识相矛盾的解释。这引发了另一个问题，即在一般语料库上训练的 LLMs 可能无法很好地泛化到特定领域或新知识，因为缺乏领域特定的知识或新的训练数据 [18]。

为解决上述问题，一个可能的解决方案是将知识图谱（KGs）融入到 LLMs 中。知识图谱（KGs），以三元组（头实体，关系，尾实体）的方式存储大量事实，是一种结构化且决定性的知识表示方式（例如，Wikidata [20]，YAGO [31]，和 NELL [32]）。KGs 对于各种应用至关重要，因为它们提供了准确的显式知识 [19]。此外，它们因其象征性推理能力 [22] 而著名，该能力可以生成可解释的结果。KGs 也可以随着新知识的不断加入而积极演化 [24]。此外，专家可以构建特定领域的 KGs，以提供精确且可靠的特定领域知识 [23]。然而，KGs 难以构建 [33]，而当前在 KGs 中的方法 [25]，[27]，[34] 在处理真实世界 KGs 的不完整和动态变化性质方面是不足够的。这些方法未能有效地模拟未见实体和表示新事实。此外，它们经常忽视 KGs 中的丰富文本信息。此外，KGs 中的现有方法通常针对特定的 KGs 或任务定制，不够通用。因此，利用 LLMs 来解决 KGs 面临的挑战也是必要的。我们分别在图 1 中总结了 LLMs 和 KGs 的优缺点。