Pandas 数据合并与拼接：merge、join 与 concat 详解 | 极客日志

PythonAI

Pandas 数据合并与拼接：merge、join 与 concat 详解

Pandas 提供了 merge、join 和 concat 三种核心方法用于数据合并。merge 基于列进行连接，支持内、外、左、右连接；join 基于索引连接；concat 用于行或列的直接堆叠。详细解析了各方法的参数、使用场景及代码示例，帮助开发者高效处理 DataFrame 数据整合任务。

刀狂发布于 2025/2/6更新于 2026/7/2339 浏览

Pandas 数据合并与拼接详解

Pandas 提供了 merge、join 和 concat 三种核心方法用于数据的合并与拼接。merge 方法主要基于两个 DataFrame 的共同列进行合并；join 方法主要基于两个 DataFrame 的索引进行合并；concat 方法是对 Series 或 DataFrame 进行行拼接或列拼接。

1. Merge 方法

Pandas 的 merge 方法是基于共同列，将两个 DataFrame 连接起来。merge 方法的主要参数如下：

left/right：左/右位置的 DataFrame。
how：数据合并的方式。
- left：基于左 DataFrame 列的数据合并。
- right：基于右 DataFrame 列的数据合并。
- outer：基于列的数据外合并（取并集）。
- inner：基于列的数据内合并（取交集），默认为 'inner'。
on：用来合并的列名，这个参数需要保证两个 DataFrame 有相同的列名。
left_on/right_on：左/右 DataFrame 合并的列名，也可为索引，数组和列表。
left_index/right_index：是否以 index 作为数据合并的列名，True 表示是。
sort：根据 DataFrame 合并的 keys 排序，默认是。
suffixes：若有相同列且该列没有作为合并的列，可通过 suffixes 设置该列的后缀名，一般为元组和列表类型。

1.1 内连接 (Inner Join)

how='inner'，DataFrame 的链接方式为内连接，我们可以理解基于共同列的交集进行连接，参数 on 设置连接的共有列名。

import pandas as pd
import numpy as np

# 定义 df1
df1 = pd.DataFrame({ 
    'alpha':['A','B','B','C','D','E'],
    'feature1':[1,1,2,3,3,1],
    'feature2':['low','medium',,,,]})


df2 = pd.DataFrame({ 
    :[,,,],
    :[,,,],
    :[,,,],
    :np.array([,,,])})


df3 = pd.merge(df1, df2, how=, on=)
(df3)

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

# 基于共同列 alpha 的外连接
df4 = pd.merge(df1, df2, how='outer', on='alpha')
print(df4)

# 左连接
df_left = pd.merge(df1, df2, how='left', on='alpha')

# 右连接
df_right = pd.merge(df1, df2, how='right', on='alpha')

# 创建带有不同索引的 DataFrame
df_a = pd.DataFrame({'A': [1, 2]}, index=['x', 'y'])
df_b = pd.DataFrame({'B': [3, 4]}, index=['y', 'z'])

# 基于索引的 join (默认 left join)
df_join = df_a.join(df_b, how='outer')
print(df_join)

# 行拼接 (axis=0 默认)
df_concat_row = pd.concat([df1, df2], axis=0)

# 列拼接 (axis=1)
df_concat_col = pd.concat([df1, df2], axis=1)

Pandas 数据合并与拼接：merge、join 与 concat 详解

Pandas 数据合并与拼接详解

1. Merge 方法

1.1 内连接 (Inner Join)

更多推荐文章

相关免费在线工具

1.2 外连接 (Outer Join)

1.3 左连接与右连接

2. Join 方法

3. Concat 方法

3.1 行拼接

3.2 列拼接

4. 总结

更多推荐文章

相关免费在线工具

Pandas 数据合并与拼接：merge、join 与 concat 详解

Pandas 数据合并与拼接详解

1. Merge 方法

1.1 内连接 (Inner Join)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 外连接 (Outer Join)

1.3 左连接与右连接

2. Join 方法

3. Concat 方法

3.1 行拼接

3.2 列拼接

4. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具