Python pandas 数据透视表 pivot_table 详解与实战 | 极客日志

Python算法

Python pandas 数据透视表 pivot_table 详解与实战

介绍 pandas 库中 pivot_table 函数的使用方法，涵盖核心参数详解、多维度聚合操作、实战案例分析以及与 pivot 函数的区别。通过具体代码示例展示如何按地区、产品、时间等维度进行数据汇总、统计和缺失值处理，帮助读者快速掌握数据透视表的构建技巧，提升数据分析效率。

花里胡哨发布于 2026/3/25更新于 2026/7/2111K 浏览

Python pandas 数据透视表详解

在数据分析中，经常需要对数据进行多维度汇总、分组统计，例如按地区和产品类型统计销售额。pandas 的 pivot_table（数据透视表）能以直观的表格形式展示多维度聚合结果，比 groupby 更灵活，比手动拼接更高效。

一、什么是数据透视表？

数据透视表（Pivot Table）是一种交互式表格，可以动态地改变数据的布局，从多个维度对数据进行汇总、统计和分析。在 pandas 中，pivot_table 是实现这一功能的核心函数，其优势在于：

多维度聚合：同时按行（index）和列（columns）分组，结果更直观；
灵活的聚合方式：支持求和、均值、计数等多种聚合函数（aggfunc），还能同时应用多个函数；
自动处理缺失值：可通过 fill_value 填充空值，让结果更整洁；
支持总计：通过 margins 参数快速添加行/列总计，方便全局分析。

二、基础准备

1. 安装 pandas

pip install pandas

2. 导入库与准备数据

本文用一份模拟的销售数据作为示例，包含'日期、地区、产品、销售额、利润'5 个字段：

import pandas as pd
import numpy as np

# 生成示例数据（100 条销售记录）
np.random.seed(42)
dates = pd.date_range(start="2023-01-01", end="2023-12-31", periods=100)
regions = ["华东","华北","华南","西部"]
products = ["A 产品","B 产品","C 产品"]
data = {
    "日期": dates,
    "地区": np.random.choice(regions, size=100),
    "产品": np.random.choice(products, size=100),
    "销售额": np.random.randint(1000, 10000, size=100),
    "利润": np.random.randint(, , size=)
}
df = pd.DataFrame(data)
(df.head())

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

pd.pivot_table(
    data,          # 要分析的 DataFrame
    values=None,   # 要聚合的列
    index=None,    # 行分组依据
    columns=None,  # 列分组依据
    aggfunc='mean',# 聚合函数
    fill_value=None,# 填充缺失值
    margins=False, # 是否添加总计
    margins_name='All'# 总计的名称
)

pivot1 = pd.pivot_table(
    data=df,
    values="销售额",
    index="地区"
)
print(pivot1)

pivot2 = pd.pivot_table(
    data=df,
    values="销售额",
    index="地区",
    columns="产品",
    aggfunc="sum"
)
print(pivot2)

# 单一聚合函数
pivot3 = pd.pivot_table(
    data=df, values="利润", index="地区", columns="产品", aggfunc="max"
)

# 多个聚合函数
pivot4 = pd.pivot_table(
    data=df, values="销售额", index="地区", columns="产品", aggfunc=["sum","mean"]
)

pivot5 = pd.pivot_table(
    data=df, values="销售额", index="地区", columns="产品", 
    aggfunc="sum", fill_value=0
)

pivot6 = pd.pivot_table(
    data=df, values="销售额", index="地区", columns="产品", 
    aggfunc="sum", fill_value=0, margins=True, margins_name="总计"
)

df["月份"] = df["日期"].dt.month
pivot7 = pd.pivot_table(
    data=df, values="利润", index=["地区","月份"], columns="产品", 
    aggfunc="mean", fill_value=0, margins=True
)

df["季度"] = df["日期"].dt.quarter
pivot_case1 = pd.pivot_table(
    data=df, values=["销售额","利润"], index="季度", columns="地区", 
    aggfunc="sum", fill_value=0, margins=True
)
print(pivot_case1)

pivot_case2 = pd.pivot_table(
    data=df, values="销售额", index="产品", columns="地区", 
    aggfunc={"销售额":["count","mean"]}, fill_value=0
)
print(pivot_case2)

Python pandas 数据透视表 pivot_table 详解与实战

Python pandas 数据透视表详解

一、什么是数据透视表？

二、基础准备

1. 安装 pandas

2. 导入库与准备数据

更多推荐文章

相关免费在线工具

三、pivot_table 核心参数详解

1. 基础用法：`index` 与 `values`

2. `columns`：增加维度

3. `aggfunc`：指定聚合函数

4. `fill_value`：填充缺失值

5. `margins` 与 `margins_name`：添加总计

6. 多字段分组

四、实战案例

问题 1：各季度各地区的销售额与利润总和

问题 2：各产品在不同地区的销售次数与平均客单价

五、pivot_table vs pivot

六、常见问题及解决

1. 聚合后出现 NaN

2. 多层索引处理不便

3. 聚合函数选择错误

4. 数据类型导致聚合错误

七、总结

更多推荐文章

相关免费在线工具

Python pandas 数据透视表 pivot_table 详解与实战

Python pandas 数据透视表详解

一、什么是数据透视表？

二、基础准备

1. 安装 pandas

2. 导入库与准备数据

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、pivot_table 核心参数详解

1. 基础用法：index 与 values

2. columns：增加维度

3. aggfunc：指定聚合函数

4. fill_value：填充缺失值

5. margins 与 margins_name：添加总计

6. 多字段分组

四、实战案例

问题 1：各季度各地区的销售额与利润总和

问题 2：各产品在不同地区的销售次数与平均客单价

五、pivot_table vs pivot

六、常见问题及解决

1. 聚合后出现 NaN

2. 多层索引处理不便

3. 聚合函数选择错误

4. 数据类型导致聚合错误

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. 基础用法：`index` 与 `values`

2. `columns`：增加维度

3. `aggfunc`：指定聚合函数

4. `fill_value`：填充缺失值

5. `margins` 与 `margins_name`：添加总计