K-RagRec：知识图谱检索增强生成在 LLM 推荐中的应用

摘要

原文翻译

推荐系统在我们的日常生活中变得越来越重要，有助于缓解各类面向用户的在线服务中的信息过载问题。大语言模型（LLMs）的出现取得了显著成就，展现出其推动下一代推荐系统发展的潜力。尽管取得了这些进展，基于大语言模型的推荐系统仍面临源于其模型架构的固有局限性，尤其是幻觉问题（生成虚假信息）以及缺乏最新知识和领域特定知识的问题。近年来，检索增强生成（RAG）技术受到了广泛关注，它通过利用外部知识源来增强大语言模型的理解和生成能力，从而解决这些局限性。然而，传统的 RAG 方法往往会引入噪声，并且忽略了知识中的结构化关系，这限制了它们在基于大语言模型推荐系统中的效果。为了解决这些问题，我们提出从知识图谱中检索高质量、最新的结构化信息，以增强推荐效果。具体而言，我们设计了一个检索增强框架，名为 K-RagRec，该框架通过整合外部知识图谱的结构化信息，助力推荐生成过程。我们进行了大量实验，验证了所提方法的有效性。

核心解读

摘要就是论文的'浓缩版故事'，核心逻辑：
1. 背景：推荐系统很重要，大语言模型能做推荐，但有两个大问题——'瞎编（幻觉）'和'知识老/不全（缺最新/领域知识）'。
2. 现有方案的不足：传统 RAG 能补知识，但会带'杂音（噪声）'，还不懂知识图谱里的'关系'。
3. 我们的方案：搞个叫 K-RagRec 的框架，专门从知识图谱里拿'结构化的好信息'，帮大模型做推荐。
4. 结果：实验证明我们的方法有用。

1. 引言

第一段

推荐系统作为一种旨在帮助人们在日常生活中做决策的技术，在各个领域的影响力日益增强（Kenthapadi 等人，2017; He 等人，2020; Fan 等人，2019），例如在线购物、工作匹配和社交媒体。近年来，大语言模型（LLMs）取得了重大突破，进一步推动了各个领域的发展（Fan 等人，2024b; Zhao 等人，2024; Wu 等人，2023a）。特别是随着大语言模型的成功，推荐系统迎来了快速发展（Geng 等人，2022; Bao 等人，2023; Qu 等人，2024）。通过在海量数据上训练，大语言模型（例如 GPT-4（Achiam 等人，2023）和 LLaMA（Touvron 等人，2023））能够获取广泛的知识，并展现出卓越的语言理解能力。这种能力使基于大语言模型的推荐系统能够通过细致理解相关属性（例如用户画像、物品描述、历史交互记录）来捕捉用户偏好，从而实现更准确的推荐。因此，基于大语言模型的推荐系统已成为推荐技术的一种新范式（Zhao 等人，2024）。

解读

核心：铺垫'大语言模型做推荐'的合理性和优势。
逻辑链：
1. 推荐系统的应用场景（购物、找工作、社交）→ 很重要。
2. 大语言模型很牛（训练数据多、理解能力强）→ 能看懂用户画像、物品描述。
3. 结论：大语言模型推荐是新趋势（新范式）。

文章配图

第二段

然而，尽管基于大语言模型的推荐系统具有强大的语言理解和泛化能力，它们仍面临重大挑战，包括幻觉问题以及缺乏最新知识和领域特定知识（Luo 等人，2023）。具体而言，一个关键问题是，由于大语言模型的固有局限性，基于大语言模型的推荐系统可能会生成完全虚构的推荐结果。例如，如图 1（a）所示，一个基于大语言模型的推荐系统可能会向看过《教父》（The Godfather）的用户推荐一部不存在的电影《Godmother》。此外，大语言模型通常缺乏最新知识，这使其无法及时推荐最新的电影或产品。如图 1（b）所示，由于训练数据仅更新到 2022 年 12 月，基于大语言模型的推荐系统无法推荐 2022 年 12 月之后的新电影。再者，大语言模型往往缺乏领域特定知识，因为在大语言模型的训练阶段，面向推荐任务的语料库非常有限（Geng 等人，2022）。因此，大语言模型可能难以满足推荐任务的细致需求。为了缓解这些问题，一个潜在的解决方案是用最新的和领域特定的知识频繁微调大语言模型。然而，大语言模型的海量参数使得这一过程计算成本高昂且耗时，严重阻碍了其在现实世界中的实际应用。

解读

核心：指出'大语言模型做推荐'的 3 个致命问题 + 现有解决方案的不足。
3 个问题拆解（结合图 1）：
1. 幻觉（图 1a）：推荐不存在的东西。
2. 知识过时（图 1b）：模型训练数据截止到 2022 年 12 月。
3. 缺领域知识：模型不知道'它和《沙丘 2》都是硬科幻片，目标受众重合'。
现有方案的坑：'频繁微调'—— 但大模型有几百亿参数，微调一次要花几十万、几天时间，根本不现实。