2026最强实战：用《三国演义》把 KAG（知识增强生成）跑通：LLM抽取知识图谱→Neo4j入库→召回评测→图谱问答闭环（附完整测试代码）

Ne0inhk

22 Mar 2026 — 7 min read

Git 仓库： langchain4j-spring-agent/langchain4j-spring-ai/langchain4j-spring-ai-seg-flow

相关文章：三国演义向量检索实战：RAG 混合切分 + Qdrant + BGE（Recall@5=0.8 全流程）
相关文章：RAG 增强与向量基础篇：继续搭建“模型 + 向量 + 会话 + 工具”协同底座
相关文章：零成本打造本地多引擎大模型与向量服务：Xinference 全栈部署 + 性能调优实战

这篇文章不是“概念科普”，而是一套可以直接跑起来的 KAG（Knowledge-Augmented Generation）工程闭环：用大模型从小说文本中抽取 知识图谱 JSON一键导入 Neo4j用评测集做 Recall@5 召回评测（LLM 参与生成 Cypher + 判定命中）最后把同一套链路用于 KAG 图谱问答（LLM 生成 Cypher → 查图 → 再让 LLM 组织答案）

你可以把它当成：做 KAG / GraphRAG / KGQA 的最小可落地 MVP。

1. 为什么要做 KAG？我遇到的痛点

做 RAG 时，我踩过一个典型坑：

向量召回对“典故/情节类问题”并不稳定：
- 你搜“温酒斩华雄”，但原文可能写成“其酒尚温”、人物可能是“云长/关公”，词面变化导致召回波动。
如果分块策略偏大（窗口 512/overlap 80），章节内细粒度信息容易被稀释；如果分块过小，语义又不完整。

而知识图谱擅长的恰好是：

实体/事件/关系 的结构化表示（谁在什么事件中做了什么）
“章回定位”类问题可以走更确定的路径：
- 通过 Event/Character -> APPEARS_IN -> Chapter 精准落到具体章回

所以我最终选择：

RAG 负责“文本证据”与“长上下文生成”
KG 负责“结构化召回、强约束定位”，二者组合形成 KAG。

2. 本文工程结构：5 个测试类 + 1 个评测集

这套闭环全部以 JUnit 测试类的形式提供，方便你在工程里反复迭代。

2.1 评测集

doc/eval/sanguo-kg-eval.json

数据结构：

query：问题
answers[]：标准答案集合
- chapterTitle：期望命中的章回标题
- accept[]：可接受关键词（用于判定命中）

2.2 抽取： `LlmKgExtractTest`

输入：doc/aigc_chunk_store_to_graph.csv
输出：doc/kg_extract_result.json

做的事：

逐行读取 CSV（每行本质是一段“章回文本”）
调用 LLM 抽取：
- Character/Location/Event/Item
- 关系 relations[{type, head, tail}]（这里已要求 LLM 输出中文关系短语）
附带写入章回元信息：documentName/chapterTitle/chapterIndex/text

2.3 入库： `KgNeo4jImportTest`

输入：doc/kg_extract_result.json
输出：Neo4j 图数据库

核心写入逻辑：

创建 (:Chapter {chapterKey}) 作为“章回锚点”
创建实体节点：(:Character|:Event|:Location|:Item {name})
把实体与章回相连：

(n)-[:APPEARS_IN]->(c:Chapter)

APPEARS_IN 的含义：实体/事件出现在某章回。这个关系非常关键，它把“结构化实体世界”挂回到“可以回答问题的章回证据”。

2.4 schema 获取： `Neo4jSchemaIntrospectTest`

LLM 要生成靠谱的 Cypher，必须知道你图谱里：

有哪些 label
有哪些关系类型
每个 label 的关键属性是什么

所以我用 CALL db.labels() / CALL db.relationshipTypes() 做了 schema 探测。

2.5 召回评测： `SanguoKgRecallEvalTest`

核心：把“问题→图谱查询→命中判定”做成评测流程。

链路：

读取评测集
探测 Neo4j schema
对每个 query：
- LLM 抽取意图/关键词（intent/keywords/constraints）
- LLM 生成 Cypher（返回 {cypher, params}）
- 对 Cypher 做预检：EXPLAIN <cypher>
  - 若失败，把错误信息回灌给 LLM 做“修复”，再预检
- 执行查询拿 TopK
- 再让 LLM 判定是否命中标准答案（hit/ reason）
汇总 Recall@5

2.6 KAG 问答： `KagGraphLLMQATest`

这是“评测链路”的应用版：

同样先拿 schema
LLM → Cypher → 查询 → LLM 组织最终答案

这一步的意义：评测不是终点，你最终要的是“线上问答可用”。所以必须把评测链路的关键能力（schema+Cypher生成+预检/修复）迁移到问答链路里。

3. 环境准备（Neo4j + LLM）

3.1 Neo4j

默认连接：

bolt://localhost:7687
用户名：neo4j
密码：测试代码里是 secretgraph（请按你的环境调整）

3.2 LLM（OpenAI 兼容接口）

当前测试类默认使用：

https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
模型：qwen-plus

注意：

建议把 Key 放到环境变量里，不要提交到仓库。

4. 一键跑通闭环：推荐执行顺序

按这个顺序跑，最稳：

LlmKgExtractTest：从 CSV 抽取出 doc/kg_extract_result.json
KgNeo4jImportTest：清空 Neo4j → 写入 Chapter/Entity/Relations
Neo4jSchemaIntrospectTest：确认图谱结构是否如预期
SanguoKgRecallEvalTest：跑 Recall@5
KagGraphLLMQATest：用任意问题做 KAG 问答

5. 两个最关键的工程经验（决定你是不是能跑通）

5.1 让 LLM 生成 Cypher，必须先喂“真实 schema”

很多人 Cypher 生成失败，根本原因是：

你让 LLM 写 (:Chunk) / HAS_CHUNK，但你的图谱里可能压根没有
或者属性叫 chapterTitle 还是 title，LLM 猜错就全挂

所以 schema introspection 是必做项。

5.2 LLM 生成的 Cypher 必须预检 + 自动修复

LLM 写 Cypher 很容易出现：

聚合/ORDER BY 语法错误
用错 APOC
参数类型不匹配

解决方法：

预检：EXPLAIN cypher
若失败：把错误信息 + 原 cypher 回灌给 LLM → 让它修复
最多重试 1~2 次

这就是为什么 SanguoKgRecallEvalTest 的链路可复用到 KagGraphLLMQATest。

6. 召回评测怎么看？为什么能指导 KAG？

doc/eval/sanguo-kg-eval.json 的问题基本都是“章回定位”类：

桃园结义是哪一回？
温酒斩华雄出自哪一回？
草船借箭是哪一回？

这种任务对 KAG 很友好：

你只要能把问题映射成图谱查询
找到对应 Chapter 的 title / index / text
LLM 再基于 text 给出最终回答

评测指标：

Recall@5：标准答案是否出现在 Top5 返回结果里

它能直接反映：

你的图谱建模是否有效（有没有正确挂到 Chapter）
你的 Cypher 生成策略是否靠谱（关键词拆分、AND/OR 降级）
你的命中判定是否稳定（accept 关键词、标题模糊匹配）

7. 下一步：从“章回定位”升级到真正 KAG（复杂问题）

本文的闭环是 KAG MVP，但已经为复杂问答铺好路：

先做“证据召回”（KG → Chapter/Text）
再做“证据生成”（LLM summarization / reasoning）

你后面可以继续扩展：

多跳查询：人物 → 事件 → 地点 → 章回
关系约束：如只看 敌对/同盟/父子
图谱 + 向量混合检索：KG 决定范围，RAG 提供长证据

8. 常见坑位排雷（我踩过的都写了）

LLM 响应解析：一定要从 OpenAI 兼容结构里取 choices[0].message.content，否则你会把 error 当 content 用。
关系 type 中文化：如果 relation type 输出英文，Neo4j relationshipTypes 会爆炸增长，后续召回更难。
Chapter 元数据必须写进 KG JSON：否则你只有实体，没有“章回锚点”，无法做章回召回评测。

9. 你可以直接复用的 3 段核心 Prompt（建议收藏）

9.1 抽取 KG（实体+关系）

要求：关系 type 用中文短语；实体尽量原文；输出 JSON。

9.2 生成 Cypher（带 schema）

要求：

拆分/扩展关键词
避免高频人名作为严格 AND
返回 title/idx/doc/text
LIMIT 5

9.3 命中判定（评测）

输入：query + answers + topK
输出：{hit, reason}

10. 结语：为什么我说这是“最小可落地 KAG”

很多 KAG 文章停留在概念图，但真正工程上，最难的是：

图谱 schema 不统一
查询不可控
LLM 生成 Cypher 经常报错
没评测就没迭代方向

本文这套 JUnit 流程解决的恰恰是这些“落地问题”。

如果你也在做：

GraphRAG / KGQA / KAG
Neo4j + 大模型
召回评测体系

这套闭环可以直接作为你的工程起点。

附：本文提到的关键文件

doc/eval/sanguo-kg-eval.json
doc/kg_extract_result.json
src/test/java/com/soft/nda/segment/LlmKgExtractTest.java
src/test/java/com/soft/nda/segment/KgNeo4jImportTest.java
src/test/java/com/soft/nda/segment/Neo4jSchemaIntrospectTest.java
src/test/java/com/soft/nda/segment/SanguoKgRecallEvalTest.java
src/test/java/com/soft/nda/segment/KagGraphLLMQATest.java

2026最强实战：用《三国演义》把 KAG（知识增强生成）跑通：LLM抽取知识图谱→Neo4j入库→召回评测→图谱问答闭环（附完整测试代码）

Ne0inhk

1. 为什么要做 KAG？我遇到的痛点

2. 本文工程结构：5 个测试类 + 1 个评测集

2.1 评测集

2.2 抽取： `LlmKgExtractTest`

2.3 入库： `KgNeo4jImportTest`

2.4 schema 获取： `Neo4jSchemaIntrospectTest`

2.5 召回评测： `SanguoKgRecallEvalTest`

2.6 KAG 问答： `KagGraphLLMQATest`

3. 环境准备（Neo4j + LLM）

3.1 Neo4j

3.2 LLM（OpenAI 兼容接口）

4. 一键跑通闭环：推荐执行顺序

5. 两个最关键的工程经验（决定你是不是能跑通）

5.1 让 LLM 生成 Cypher，必须先喂“真实 schema”

5.2 LLM 生成的 Cypher 必须预检 + 自动修复

6. 召回评测怎么看？为什么能指导 KAG？

7. 下一步：从“章回定位”升级到真正 KAG（复杂问题）

8. 常见坑位排雷（我踩过的都写了）

9. 你可以直接复用的 3 段核心 Prompt（建议收藏）

9.1 抽取 KG（实体+关系）

9.2 生成 Cypher（带 schema）

9.3 命中判定（评测）

10. 结语：为什么我说这是“最小可落地 KAG”

附：本文提到的关键文件

Read more

【PX4+ROS完全指南】从零实现无人机Offboard控制：模式解析与实战

无人机遥感航拍巡检数据集无人机遥感图像识别无人机视角山区泥石流和滑坡图像识别数据集-数据集第10067期

【论文阅读】世界模型发展脉络整理---Understanding World or Predicting Future? A Comprehensive Survey of World Models

Formality：原语(primitive)的概念

1. 为什么要做 KAG？我遇到的痛点

2. 本文工程结构：5 个测试类 + 1 个评测集

2.1 评测集

2.2 抽取： LlmKgExtractTest

2.3 入库： KgNeo4jImportTest

2.4 schema 获取： Neo4jSchemaIntrospectTest

2.5 召回评测： SanguoKgRecallEvalTest

2.6 KAG 问答： KagGraphLLMQATest

3. 环境准备（Neo4j + LLM）

3.1 Neo4j

3.2 LLM（OpenAI 兼容接口）

4. 一键跑通闭环：推荐执行顺序

5. 两个最关键的工程经验（决定你是不是能跑通）

5.1 让 LLM 生成 Cypher，必须先喂“真实 schema”

5.2 LLM 生成的 Cypher 必须预检 + 自动修复

6. 召回评测怎么看？为什么能指导 KAG？

7. 下一步：从“章回定位”升级到真正 KAG（复杂问题）

8. 常见坑位排雷（我踩过的都写了）

9. 你可以直接复用的 3 段核心 Prompt（建议收藏）

9.1 抽取 KG（实体+关系）

9.2 生成 Cypher（带 schema）

9.3 命中判定（评测）

10. 结语：为什么我说这是“最小可落地 KAG”

附：本文提到的关键文件

Read more

【PX4+ROS完全指南】从零实现无人机Offboard控制：模式解析与实战

无人机遥感航拍巡检数据集 无人机遥感图像识别 无人机视角山区泥石流和滑坡图像识别数据集-数据集第10067期

【论文阅读】世界模型发展脉络整理---Understanding World or Predicting Future? A Comprehensive Survey of World Models

Formality：原语(primitive)的概念

2.2 抽取： `LlmKgExtractTest`

2.3 入库： `KgNeo4jImportTest`

2.4 schema 获取： `Neo4jSchemaIntrospectTest`

2.5 召回评测： `SanguoKgRecallEvalTest`

2.6 KAG 问答： `KagGraphLLMQATest`

无人机遥感航拍巡检数据集无人机遥感图像识别无人机视角山区泥石流和滑坡图像识别数据集-数据集第10067期