五分钟构建动态知识图谱：利用大模型提取实体关系与对话

利用知识图谱从大量文档、视频中提取信息，建立实体之间的关系，有利于加速信息处理，提取文档中的数据，以及发现实体之间潜在关系和规律。

随着 AI 大模型的快速发展，大模型和知识图谱的结合带来了更多可能性。本文将演示如何在 5 分钟内上传数据源，构建一个动态知识图谱，可用于提取实体关系，并且与数据对话。

这里使用的工具是 大模型知识图谱构建器（LLM Knowledge Graph Builder）。这是 Neo4j 生态系统中常用的 GraphRAG 工具之一，能够将非结构化数据转化为动态知识图谱，还可以通过自然语言查询数据并获得解释性见解。

什么是大模型知识图谱构建器

Neo4j 大模型知识图谱构建器是一款在线应用，无需编写代码和使用 Cypher 语言即可将非结构化文本转化为知识图谱，操作起来非常方便。

它利用机器学习模型将 PDF 文件、网页和 YouTube 视频等转化为包含实体及其关系的知识图谱。前端是基于 Needle Starter Kit 的 React 应用，后端是 Python FastAPI 应用。该应用使用了 Neo4j 为 LangChain 贡献的 llm-graph-transformer 模块。

该应用体验流畅，分为以下四个简单步骤：

导入数据：支持多种数据源，包括 PDF 文档、维基百科页面、YouTube 视频等。
识别实体：使用 AI 大模型识别并提取非结构化文本中的实体和关系。
构建图谱：将识别出的实体和关系转换为图谱格式，利用 Neo4j 的图谱功能。
使用图谱：提供直观的网页界面，用户可以方便地与应用互动，包括上传数据源、可视化生成的图谱以及与 RAG 代理交互。这一功能特别令人兴奋，因为它使用户能够直观地与数据互动，宛如与知识图谱对话，无需任何技术知识。

构建知识图谱界面

你可以在 Neo4j 官网使用应用程序，无需绑定支付信用卡和 AI 大模型密钥，使用过程无任何障碍。

如果你想在本地或自己的环境中运行该程序，可以访问 GitHub 仓库并按照以下步骤进行操作。

环境准备

在使用大模型知识图谱构建器之前，你需要创建一个新的 Neo4j 数据库。

你可以按照以下步骤使用免费的 AuraDB 数据库：

访问 https://console.neo4j.io 并登录或创建账户。
在 Instances 下创建一个新的 AuraDB Free 数据库。
下载凭证文件。
等待实例启动。

完成上述步骤后，Neo4j 数据库已经启动，并且有了凭证。点击右上角的 Connect to Neo4j，你打开大模型知识图谱构建器，将之前下载的凭证文件拖到连接对话框中，所有信息会自动填充。你也可以手动输入所有信息。

创建知识图谱

首先将非结构化数据导入，然后通过 AI 大模型识别关键实体及其关系。

你可以将 PDF 和其他文件拖到左侧的第一个输入区域。

第二个输入框允许你复制粘贴 YouTube 视频（暂不支持其他视频网站）链接。

第三个输入框则用于输入维基百科页面链接。

在这里，示例中上传了：

一家供应链公司内部的 PDF 文件，文档详细记录了他们的整个供应链策略和产品。
福布斯的新闻文章。
一个关于《企业可持续发展尽职调查指令》（CSDDD）的 YouTube 视频。
以及维基百科上的两篇文章。

你可以选择只上传 pdf 文档，视频或者维基百科页面。

上传文件时，应用程序会使用 LangChain 文档加载器，以及 YouTube 解析器将上传的文件存储为图中的文档节点。

所有文件上传完毕后，你会看到类似如下的界面：

文件上传界面

五分钟构建动态知识图谱：利用大模型提取实体关系与对话