摘要
推荐系统日益成为缓解信息过载的关键技术,而大语言模型(LLM)的兴起为其带来了新的发展机遇。尽管 LLM 展现出强大的语言理解能力,但在推荐场景中仍面临幻觉生成、知识滞后及领域知识匮乏等固有局限。传统的检索增强生成(RAG)技术虽能引入外部知识,但往往因噪声干扰和忽略结构化关系而效果受限。为此,我们提出了 K-RagRec 框架,通过从知识图谱中检索高质量的结构化信息来增强推荐生成过程,实验验证了该方法的有效性。
1. 引言
推荐系统在在线购物、工作匹配等领域扮演着重要角色。大语言模型凭借海量数据训练出的泛化能力,能够深入理解用户画像与物品描述,被视为推荐技术的新范式。然而,LLM 在推荐任务中存在三个致命弱点:一是幻觉问题,可能生成虚构的物品;二是知识过时,无法推荐训练截止后的新内容;三是缺乏领域特定知识,难以满足精细化的推荐需求。虽然频繁微调可以缓解这些问题,但高昂的计算成本使其难以落地。
检索增强生成(RAG)提供了一种无需微调的解决方案,通过外部知识库补充信息。但传统 RAG 依赖文档段落,容易引入噪声且无法利用实体间的结构化关系。知识图谱提供了事实性、可编辑的结构化表示,是更优的知识来源。不过,直接利用知识图谱也面临挑战:简单检索一阶邻居会忽略高阶关联;无差别检索降低效率;序列化文本编码则丢失了结构优势。因此,探索更具表达力的结构化数据表示至关重要。
2. 方法论概述
K-RagRec 框架包含五个核心组件,旨在从物品知识图谱中检索可靠知识以增强 LLM 推荐:
2.1 多跳领域知识子图索引
为解决检索深度不足的问题,我们引入了预训练语言模型(如 SentenceBert)对节点和边进行语义编码,并利用图神经网络(GNN)聚合实体邻居信息。这不仅能捕捉一阶邻居,还能通过多跳(Hop)机制获取二阶甚至更高阶的邻域效应。例如,对于电影《沙丘 2》,不仅检索其导演和类型,还能关联到同导演的其他作品或同类型的经典影片。这些子图表示被存储在知识向量数据库中,形成灵活的索引系统。
2.2 流行度选择性检索策略
针对检索效率低下的问题,我们设计了基于物品流行度的筛选机制。根据幂律分布,大部分交互集中在少数热门物品上,而冷启动物品往往缺乏足够数据。因此,仅对流行度低于阈值的冷门物品进行检索,热门物品则直接利用 LLM 内部知识。这一策略显著减少了检索时间,同时避免了冗余计算。
2.3 知识子图检索与重排序
检索阶段,使用与索引相同的 PLM 将查询转换为向量,在知识向量数据库中查找最相似的 Top-K 个子图。考虑到长上下文可能导致信息过载,我们进一步执行重排序操作。以推荐提示词为查询,对检索到的子图集合进行相似度计算,仅保留相关性最高的 Top-N 个子图输入给 LLM,确保关键信息优先。
2.4 知识增强推荐
为了让 LLM 有效利用结构信息,我们整合了 GNN 编码器和投影器(MLP)。GNN 提取子图的结构特征,MLP 将其映射到 LLM 的语义空间,生成软提示词(Soft Prompt)。这种方式既保留了图结构的丰富性,又避免了长文本输入带来的性能损耗。训练过程中,LLM 参数保持冻结,仅优化 GNN 和投影器的参数,大幅降低了计算成本。
3. 实验与分析
我们在 MovieLens-1M、MovieLens-20M 和 Amazon Book 三个真实数据集上进行了评估,基线模型涵盖了仅推理、提示词调优及 LoRA 微调等多种方法。结果显示,K-RagRec 在所有数据集上均优于次优基线,特别是在 Llama-2-7B 骨干模型上平均提升了 41.6%。消融实验表明,移除 GNN 编码器会导致准确率大幅下降,证明了结构编码的重要性。此外,效率评估显示,得益于选择性检索策略,K-RagRec 的推理时间仅比无检索模式慢约 0.1 秒,远快于其他 RAG 方法。
4. 结论与展望
K-RagRec 通过结合知识图谱的结构化检索与大语言模型的生成能力,有效解决了推荐系统中的幻觉与知识滞后问题。未来工作将致力于扩展至更大规模的模型,探索更多样化的知识图谱源,并尝试利用强化学习动态调整检索策略,以适应更复杂的用户兴趣变化。
![图 1] ![图 2] ![图 3] ![图 4] ![图 5] ![图 6]

