基于大型语言模型的学术知识图谱问答方法解析

基于大型语言模型的学术知识图谱问答

在学术领域，知识图谱问答（KGQA）一直是个难点。由于学术数据集的稀缺性，通用 KGQA 方案往往难以直接迁移。这篇论文介绍了一种利用大型语言模型（LLM）以少量训练样本完成文献自然语言问答的新方法。

现有的学术 KGQA 模型通常分为检索 - 推理框架和语义分析框架两类。本文提出的方案结合了两者优势，核心流程如下：

这种设计让模型通过'看例子'来学习如何构造查询，而不是依赖大量的监督微调。

在 Scholarly-QALD-23 的挑战基准 SciQA 上，该系统取得了 99.0% 的 F1 分数，表现相当亮眼。不过，实际应用中仍存在一些值得注意的问题：

总的来说，这是一次将 LLM 的泛化能力成功应用于垂直领域知识图谱查询的有效尝试。对于需要处理稀疏数据的研究场景，这种基于 Prompt 的生成式方法提供了新的解决路径。

参考原文：https://arxiv.org/abs/2311.09841.pdf