基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例 | 极客日志

PythonAI算法

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

综述由AI生成微软开源的 GraphRAG 项目，这是一种基于知识图谱的检索增强生成方法。文章详细阐述了 GraphRAG 的核心原理，即通过 LLM 从非结构化文本中提取实体和关系构建图谱。内容涵盖环境搭建、项目初始化、配置文件详解、索引构建流程以及常见问题的解决方案。通过《红楼梦》案例演示了局部检索和全局检索的具体用法，对比了其与纯文本检索的差异。最后总结了 GraphRAG 的技术优势、局限性及适用场景，为开发者构建高质量知识图谱增强型 AI 应用提供了完整的技术指南。

孤勇者发布于 2025/2/7更新于 2026/6/119 浏览

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

在构建大模型（LLM）知识库检索增强生成（RAG）智能体时，传统的纯文本切片方法往往难以处理复杂的关系推理。微软开源的 GraphRAG 项目提供了一种新的思路：通过 LLM 提取实体和关系，构建知识图谱，再基于图谱结构进行检索。本文将详细介绍如何部署 GraphRAG，并以《红楼梦》为例展示其效果。

注意：GraphRAG 对 Token 消耗较大，且索引构建耗时较长，请确保有足够的计算资源。

1. GraphRAG 简介

1.1 核心概念

GraphRAG 是一种结构化、分层的检索增强生成方法。与使用纯文本片段的朴素语义搜索不同，GraphRAG 的处理流程包括从原始文本中提取知识图、构建社区层次结构、为这些社区生成摘要，然后在执行基于 RAG 的任务时利用这些结构。

简单来说，GraphRAG 是一个数据转换套件，旨在利用 LLM 从非结构化文本中提取有价值的结构化数据，进而构建成知识图谱。

图谱的核心概念包括：

节点（Node）：代表实体，如人物、地点、组织。
边（Edge）：代表关系，如'属于'、'位于'、'认识'。

1.2 官方资源

GitHub 项目地址：https://github.com/microsoft/graphrag
官方文档：https://microsoft.github.io/graphrag/

2. 安装与环境配置

2.1 环境准备

首先，确保已安装 Python 3.9+。建议在虚拟环境中操作。

python -m venv graphrag_env
source graphrag_env/bin/activate  # Windows: graphrag_env\Scripts\activate

2.2 安装 GraphRAG

pip install graphrag

2.3 初始化项目

创建项目文件夹并初始化：

mkdir graphrag_project
cd graphrag_project
python -m graphrag.index --init --root .

初始化成功后，目录结构如下：

graphrag_project/
├── .env                  # 环境变量配置
├── input                 # 存放知识库数据
├── prompts               # 提示词模板
│   ├── claim_extraction.txt
│   ├── community_report.txt
│   ├── entity_extraction.txt
│   └── summarize_descriptions.txt
└── settings.yaml         # 核心配置文件

2.4 配置文件说明

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

.env：填入大模型的 API Key。
```
OPENAI_API_KEY=your_api_key_here
```

settings.yaml：配置 LLM 和 Embedding 相关信息。

llm:
  api_type: "openai"
  model: "gpt-4-turbo"  # 或兼容 OpenAI 格式的模型
  temperature: 0
  max_tokens: 256
  request_timeout: 180.0

embedding:
  api_type: "openai"
  model: "text-embedding-3-small"
  deployment_name: null
  base_url: null
  api_key: ${env:OPENAI_API_KEY}

*注意：API 需兼容 OpenAI 格式。如需在 Gephi 等软件中查看图谱，可设置 graphml: true。

python -m graphrag.index --root .

pip install future

python -m graphrag.query --root . --method global "红楼梦的主题是什么？"

python -m graphrag.query --root . --method local "刘姥姥进大观园时带了谁？"

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

1. GraphRAG 简介

1.1 核心概念

1.2 官方资源

2. 安装与环境配置

2.1 环境准备

2.2 安装 GraphRAG

2.3 初始化项目

2.4 配置文件说明

更多推荐文章

相关免费在线工具

3. 构建索引

3.1 构建流程

3.2 常见问题与解决

4. 图谱可视化与分析

4.1 查看数据

4.2 导出 GraphML

5. 检索与问答

5.1 查询示例

全局检索

局部检索

5.2 性能优化建议

6. 技术总结与最佳实践

更多推荐文章

相关免费在线工具

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

基于 GraphRAG 打造知识图谱增强的 LLM：以解读《红楼梦》为例

1. GraphRAG 简介

1.1 核心概念

1.2 官方资源

2. 安装与环境配置

2.1 环境准备

2.2 安装 GraphRAG

2.3 初始化项目

2.4 配置文件说明

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 构建索引

3.1 构建流程

3.2 常见问题与解决

4. 图谱可视化与分析

4.1 查看数据

4.2 导出 GraphML

5. 检索与问答

5.1 查询示例

全局检索

局部检索

5.2 性能优化建议

6. 技术总结与最佳实践

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具