【保姆级教程】从零入手：Python + Neo4j 构建你的第一个知识图谱

优质文章学习记录

07 Apr 2026 — 7 min read

摘要：大数据时代，数据之间的关系往往比数据本身更有价值。传统的 SQL 数据库在处理复杂关系（如社交网络、推荐系统、风控分析）时显得力不从心，而 知识图谱 和 图数据库 Neo4j 正是为此而生。本文将带你从 0 基础出发，理解知识图谱核心概念，安装 Neo4j 环境，并手把手教你用 Python 代码构建一个生动的人物关系图谱。拒绝枯燥理论，全是实战干货！

一、什么是知识图谱与 Neo4j？

在动手写代码之前，我们先用大白话把两个核心概念捋清楚。

1. 什么是知识图谱 (Knowledge Graph)？

不要被高大上的名字吓到。知识图谱本质上就是把世界上的事物（节点）和它们之间的联系（关系）画成一张巨大的网。

Excel 思维： 罗列数据。例如：张三，25岁；李四，30岁。
图谱思维： 链接数据。例如：（张三）--[朋友]-->（李四）。

它由三要素组成：

实体 (Entity/Node)： 比如“周杰伦”、“昆凌”。
关系 (Relationship)： 比如“夫妻”、“代言”。
属性 (Property)： 比如周杰伦的“年龄：40+”。

2. 什么是 Neo4j？

如果说 SQL 是关系型数据库的霸主，那么 Neo4j 就是图数据库（Graph Database）的王者。

特点： 原生支持图存储，查询关联数据速度极快（秒杀 MySQL）。
查询语言： 使用 Cypher 语言（类似 SQL，但更直观）。

一句话总结： 我们用 Python 处理数据，把数据喂给 Neo4j，最终形成可视化的知识图谱。

二、环境搭建：Neo4j Desktop 安装

对于初学者，我强烈推荐使用 Neo4j Desktop（桌面版），不仅免费，而且图形化界面非常友好，免去了复杂的命令行配置。

步骤 1：下载与安装

进入 Neo4j 官网下载中心。
填写基本信息后下载 Neo4j Desktop。
像安装普通软件一样安装并运行。

步骤 2：创建项目与数据库

打开 Neo4j Desktop，点击 "New Project"。
在右侧点击 "Add" -> "Local DBMS"。
关键设置： 设置一个密码（比如 123456），一定要记住！
点击 Create，然后点击 Start 启动数据库。

步骤 3：进入浏览器控制台

当状态灯变绿后，点击 Open 或者在浏览器输入 http://localhost:7474。

用户名：neo4j
密码：你刚才设置的（如 123456）

三、快速上手：Cypher 语言初体验

在用 Python 之前，我们先在 Neo4j 浏览器的输入框里敲一行代码，感受一下图的魅力。

输入以下命令并按回车（或点击播放按钮）：

Cypher

CREATE (p1:Person {name: '孙悟空', title: '齐天大圣'}) CREATE (p2:Person {name: '唐僧', title: '师傅'}) CREATE (p1)-[:PROTECT {role: '保镖'}]->(p2) RETURN p1, p2

你会看到屏幕上出现了两个圆圈（节点）和一条连线。这就是最简单的图谱！

四、实战：使用 Python 构建知识图谱

在实际工作中，我们不可能手动一条条敲 Cypher 命令，而是通过 Python 读取文件（CSV/Excel）并批量写入。

1. 安装 Python 驱动

打开终端或 CMD，运行：

Bash

pip install neo4j

2. 编写核心代码

下面我编写了一个通用的连接类，你可以直接复制使用。我们将构建一个简单的 “西游记人物关系图谱”。

新建一个 build_graph.py 文件：

Python

from neo4j import GraphDatabase class KnowledgeGraph: def __init__(self, uri, user, password): """ 连接 Neo4j 数据库 """ self.driver = GraphDatabase.driver(uri, auth=(user, password)) def close(self): """ 关闭连接 """ self.driver.close() def create_node_and_relationship(self, person1, relation, person2): """ 创建节点和关系 使用 MERGE 关键字，保证节点不被重复创建 """ with self.driver.session() as session: # Cypher 语句说明： # 1. 查找或创建名为 person1 的节点 # 2. 查找或创建名为 person2 的节点 # 3. 建立两者之间的关系" MERGE (p1:Character {name: $name1}) MERGE (p2:Character {name: $name2}) MERGE (p1)-[r:RELATION {type: $rel}]->(p2) RETURN p1, p2, r """ session.run(query, name1=person1, name2=person2, rel=relation) print(f"成功构建：{person1} --[{relation}]--> {person2}") def clear_data(self): """ (可选) 清空数据库，方便测试 """ with self.driver.session() as session: session.run("MATCH (n) DETACH DELETE n") print("数据库已清空！") # --- 主程序执行 --- if __name__ == "__main__": # 1. 配置数据库连接 (请修改你的密码) URI = "bolt://localhost:7687" USER = "neo4j" PASSWORD = "123456" # 替换为你自己的密码 # 2. 准备数据 (模拟从 Excel 读取的数据) data = [ ("唐僧", "师徒", "孙悟空"), ("唐僧", "师徒", "猪八戒"), ("唐僧", "师徒", "沙僧"), ("孙悟空", "师兄弟", "猪八戒"), ("孙悟空", "师兄弟", "沙僧"), ("孙悟空", "结拜兄弟", "牛魔王"), ("牛魔王", "夫妻", "铁扇公主"), ("铁扇公主", "母子", "红孩儿") ] # 3. 开始构建 kg = KnowledgeGraph(URI, USER, PASSWORD) try: # 先清空旧数据，防止重复 kg.clear_data() print("开始构建知识图谱...") for p1, rel, p2 in data: kg.create_node_and_relationship(p1, rel, p2) print("\n图谱构建完成！请去 Neo4j Browser 查看效果。") except Exception as e: print(f"发生错误: {e}") finally: kg.close()

3. 运行效果

运行上述脚本，控制台会输出：

Plaintext

数据库已清空！ 开始构建知识图谱... 成功构建：唐僧 --[师徒]--> 孙悟空 成功构建：唐僧 --[师徒]--> 猪八戒 ... 图谱构建完成！

五、见证奇迹的时刻：可视化展示

现在回到你的 Neo4j Browser (http://localhost:7474)。

在顶部输入框输入以下命令查询所有数据：

Cypher

MATCH (n) RETURN n

点击播放按钮。 你将看到一张错综复杂、可以拖拽的人物关系网！

你可以尝试：

点击“孙悟空”节点，改变它的颜色。
拖动节点，感受力导向图的物理效果。
鼠标悬停在连线上，查看关系类型。

六、总结与展望

恭喜你！你已经完成了从 0 到 1 的知识图谱构建。我们通过 Python 的 neo4j 库，成功将结构化的数据转化为了图谱。

本文学到了什么？

理解了图数据库与传统数据库的区别。
学会了安装 Neo4j Desktop。
掌握了 Python 连接 Neo4j 并批量写入数据的核心代码。

下一步可以做什么？ 构建图谱只是第一步。有了这个图谱，我们不仅可以“看”，还可以让 AI 去“理解”。在下一篇文章中，我将分享 《进阶篇：如何结合 BERT 模型与 Neo4j 实现智能问答系统 (KBQA)》，让 AI 能回答“孙悟空的结拜兄弟的老婆是谁？”这种复杂问题。

如果你觉得这篇文章对你有帮助，欢迎点赞、收藏、关注三连！有任何报错问题，请在评论区留言，我会第一时间解答！

从 0 到 1 玩转 ClaudeCode：Figma-MCP 前端代码 1:1 还原 UI 设计全流程

ClaudeCode 与 Figma-MCP 简介 ClaudeCode 是 Anthropic 推出的 AI 代码生成工具，擅长将设计稿转换为前端代码。Figma-MCP（Minimum Code Principle）指通过最小代码原则实现高保真 UI 还原，适用于 Vue/React 等现代框架。环境准备 Figma 设计稿检查 * 确保设计稿使用 Auto Layout 布局，标注间距、字体、颜色等设计 Token。 * 导出必要的 SVG/PNG 资源，检查图层命名规范（如 btn_primary）。开发环境配置 * 安装 Claude 插件或访问官方 Playground。初始化前端项目（示例为 Vue3 + TypeScript）

Qwen3-VL-WEBUI GPU配置：4090D最优算力方案详解

Qwen3-VL-WEBUI GPU配置：4090D最优算力方案详解 1. 引言随着多模态大模型在视觉理解、语言生成和跨模态推理能力上的飞速发展，阿里云推出的 Qwen3-VL 系列模型已成为当前最具竞争力的视觉-语言模型之一。其最新版本不仅在文本与图像融合理解上达到新高度，更在视频分析、GUI代理操作、长上下文建模等方面实现了突破性进展。对于开发者和研究者而言，如何高效部署并充分发挥 Qwen3-VL 的性能，成为落地应用的关键挑战。本文聚焦于 Qwen3-VL-WEBUI 的本地化部署实践，重点解析基于单张 NVIDIA RTX 4090D 显卡的最优算力配置方案，涵盖环境准备、资源调度、推理优化等核心环节，帮助用户以最低成本实现高性能多模态推理。本方案适用于希望在消费级硬件上运行 Qwen3-VL-4B-Instruct 模型的开发者，尤其适合个人研究、原型开发和轻量级产品集成场景。 2. Qwen3-VL-WEBUI 核心特性与架构解析 2.1 模型能力全景 Qwen3-VL 是 Qwen 系列中首个真正意义上的“视觉代理”（Visual Agent），

【年终总结】从非科班无实习到准字节前端：我始终相信，开发之外的事，才是破局关键

目录【年终总结】从非科班无实习到准字节前端：我始终相信，开发之外的事，才是破局关键一、求其外，善其内 1、坚持出发点正确的博文写作 2、博文更新对我心态的淬炼 3、社区交流对我视野的启发 4、向外拓展，反哺内修二、陷入前端则前端死，跳出前端则前端活 1、从不务正业到泛前端 2、从泛前端到大前端，从有形到无形三、秋招多少事四、结语作者：watermelo37 ZEEKLOG优质创作者、华为云云享专家、阿里云专家博主、腾讯云“创作之星”特邀作者、火山KOL、支付宝合作作者，全平台博客昵称watermelo37。一个假装是giser的coder，做不只专注于业务逻辑的前端工程师，Java、Docker、Python、LLM均有涉猎。 --------------------------------------------------------------------- 温柔地对待温柔的人，包容的三观就是最大的温柔。

Qwen3-32B显存溢出？量化压缩部署实战让资源节省40%

Qwen3-32B显存溢出？量化压缩部署实战让资源节省40% 你是不是也遇到过这种情况：好不容易找到一个性能强大的大模型，比如Qwen3-32B，结果一部署就发现显存不够用，直接报错“Out of Memory”？看着那动辄几十GB的显存需求，再看看自己有限的显卡资源，是不是感觉心都凉了半截？别急着放弃。今天我就来分享一个实战技巧——通过量化压缩技术，让你在有限的硬件资源上，也能流畅运行Qwen3-32B这样的“大块头”。经过实测，这个方法能让模型显存占用减少40%以上，而性能损失却微乎其微。 1. 为什么Qwen3-32B会“吃”掉那么多显存？在开始动手之前，我们先得搞清楚问题出在哪。Qwen3-32B是一个拥有320亿参数的庞然大物，它的“大”主要体现在两个方面： 1.1 参数规模带来的直接负担模型参数越多，需要存储的数据量就越大。Qwen3-32B的320亿参数，如果都用32位浮点数（FP32）来存储，光是参数本身就需要大约128GB的存储空间。这还没算上推理过程中需要的中间计算结果（激活值）和优化器状态。 1.2 推理过程中的内存开销模型在运行时，

一、 什么是知识图谱与 Neo4j？