使用 Neo4j GraphRAG Python 包构建 RAG 与知识图谱应用

如果你已经探索过使用 Neo4j 来实现 GraphRAG，你可能已经了解它在提升生成模型输出质量方面的潜力。传统上，这需要深入掌握 Neo4j 和 Cypher（Neo4j 的查询语言）。在本文中，我们将介绍一种更简单的方式，简化 Neo4j 与检索增强生成（RAG）应用的集成，使开发者更容易使用，那就是：适用于 Python 的官方 Neo4j GraphRAG 包（neo4j-graphrag）。

该 Python 包为您提供了管理 RAG 过程中的检索与生成任务的高效工具。本文将展示如何使用该包执行检索任务，并简要介绍其生成功能，帮助您构建完整的端到端 RAG 流程。

什么是 GraphRAG？

neo4j-graphrag 包简化了图检索增强生成（GraphRAG）。在 Neo4j，将图数据库与向量搜索结合起来代表了 RAG 的下一步发展方向。通过利用图结构中的关系信息，GraphRAG 能够提供比传统向量搜索更丰富的上下文，从而显著提升大语言模型（LLM）回答的准确性和可解释性。

Neo4j GraphRAG 架构图

与传统 RAG 的区别

传统的 RAG 通常仅依赖向量相似度检索文档片段，容易丢失实体间的关联信息。GraphRAG 则通过遍历图结构，能够发现间接相关的节点，例如在电影推荐场景中，不仅找到相似情节的电影，还能找到同一导演或演员的其他作品，从而提供更全面的回答依据。

安装与设置

首先，连接到一个预配置的 Neo4j 演示数据库，该数据库模拟了一个电影推荐知识图谱。您可以使用用户名和密码 "recommendations" 访问 https://demo.neo4jlabs.com:7473/browser/。这一设置提供了一个现实场景，向量嵌入数据已作为 Neo4j 数据库的一部分。

验证数据环境

使用 Cypher 命令可视化数据：

MATCH (n) RETURN n LIMIT 25;

Neo4j Browser 节点视图

观察每个节点右侧详情中的 plotEmbedding 属性。我们将在演示中使用这些嵌入执行向量搜索。您可以通过以下 Cypher 命令检查是否存在 moviePlotsEmbedding 向量索引：

SHOW INDEXES YIELD * WHERE type='VECTOR';

配置 Python 环境

在您的 Python 环境中，建议先创建虚拟环境以保持依赖隔离。安装 neo4j-graphrag 包及其他依赖包：

pip install neo4j-graphrag neo4j openai

接着，使用 Neo4j Python 驱动程序连接到数据库。确保您已设置 OpenAI API 密钥：

import os
os.environ[] =

使用 Neo4j GraphRAG Python 包构建 RAG 与知识图谱应用