使用 Python 将 CSV 数据导入 Neo4j 图数据库 | 极客日志

PythonAI算法

使用 Python 将 CSV 数据导入 Neo4j 图数据库

演示利用 Python 脚本结合 py2neo 库，将 CSV 格式的人物关系数据清洗并导入 Neo4j 图数据库的全过程。涵盖文件编码转换、环境依赖安装、图节点与关系的创建以及常见编码错误的排查方案，帮助开发者快速构建本地知识图谱原型。

心动瞬间发布于 2026/4/7更新于 2026/5/2211 浏览

使用 Python 将 CSV 数据导入 Neo4j 图数据库

本文演示了如何利用 Python 脚本结合 py2neo 库，将 CSV 格式的人物关系数据清洗并导入 Neo4j 图数据库的全过程。涵盖文件编码转换、环境依赖安装、图节点与关系的创建以及常见编码错误的排查方案。

一、数据准备

在开始之前，确保你的 CSV 文件编码正确。很多中文数据源默认是 GBK 或 ANSI，直接读取容易报错。

用记事本打开 CSV 文件。
选择'另存为'，编码格式务必选 UTF-8。
保存时确认覆盖原文件或重命名新文件。

这一步很关键，后续代码若出现 UnicodeDecodeError，通常是因为文件编码不匹配。

文章配图

二、环境搭建

1. 启动 Neo4j

本地运行 Neo4j 数据库，创建一个新的数据库实例，设置好用户名和密码（默认通常是 neo4j / password，建议修改）。

启动后进入 Browser 界面，输入以下 Cypher 语句验证连接是否成功且数据库为空：

match(n) return n;

如果返回空结果集，说明数据库已就绪。

文章配图

2. 配置 Python 项目

在 PyCharm 或其他 IDE 中创建新项目，检查解释器环境。需要安装以下核心依赖：

neo4j-python-driver: Neo4j 官方驱动
pandas: 处理 CSV 数据
py2neo: 简化图数据库操作的封装库

在 Terminal 中执行安装命令：

pip install neo4j-python-driver pandas py2neo

安装完成后，建议在 IDE 的 Settings -> Project Interpreter 中确认这些包已存在。

三、连接与测试

编写一个简单的连接测试脚本，确保 Python 能连通 Neo4j。注意替换为你实际设置的密码。

from py2neo import Graph

# 连接本地 Neo4j，端口默认为 7474
graph = Graph("bolt://localhost:7687", auth=("neo4j", "你的密码"))

# 简单查询验证
result = graph.run("MATCH (n) RETURN count(n)").data()
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import pandas as pd

# 读取 CSV 文件，注意 encoding 参数需与文件一致
invoice_data = pd.read_csv('your_data.csv', encoding='utf-8')

# 预处理：将所有元组存入列表
tuple_total = []
for index, row in invoice_data.iterrows():
    ties_total = [row['人物'], row['关系'], row['关系人物']]
    tuple_total.append(ties_total)

print(f"共解析 {len(tuple_total)} 条关系")

from py2neo import Node

people_list = list(set([row[0] for row in tuple_total] + [row[2] for row in tuple_total]))

def create_node(people):
    for name in people:
        # 定义标签为 '人物'，属性为 name
        node_1 = Node('人物', name=name)
        graph.create(node_1)

create_node(people_list)

from py2neo import Relationship, NodeMatcher

matcher = NodeMatcher(graph)

for i in range(len(tuple_total)):
    name_1 = matcher.match('人物', name=tuple_total[i][0]).first()
    name_2 = matcher.match('人物', name=tuple_total[i][2]).first()
    rel_type = tuple_total[i][1]
    
    if name_1 and name_2:
        relationship = Relationship(name_1, rel_type, name_2)
        graph.create(relationship)

使用 Python 将 CSV 数据导入 Neo4j 图数据库

使用 Python 将 CSV 数据导入 Neo4j 图数据库

一、数据准备

二、环境搭建

1. 启动 Neo4j

2. 配置 Python 项目

三、连接与测试

更多推荐文章

相关免费在线工具

四、核心导入逻辑

1. 加载与解析数据

2. 创建节点

3. 建立关系

五、常见问题排查

UnicodeDecodeError

更多推荐文章

相关免费在线工具

使用 Python 将 CSV 数据导入 Neo4j 图数据库

使用 Python 将 CSV 数据导入 Neo4j 图数据库

一、数据准备

二、环境搭建

1. 启动 Neo4j

2. 配置 Python 项目

三、连接与测试

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、核心导入逻辑

1. 加载与解析数据

2. 创建节点

3. 建立关系

五、常见问题排查

UnicodeDecodeError

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具