Python Pandas 核心数据结构与操作实战指南 | 极客日志

PythonAI

Python Pandas 核心数据结构与操作实战指南

Pandas 是 Python 数据分析的核心库，提供 Series 和 DataFrame 两种主要数据结构。涵盖从导入库、创建对象到索引定位（loc/iloc）、算术运算、统计分析及数据筛选等关键功能。重点解析 axis 参数在聚合操作中的含义，并通过实际案例演示如何高效处理二维表格数据，适合希望快速掌握 Pandas 基础操作的开发者参考。

萤火微光发布于 2026/3/15更新于 2026/7/2039 浏览

前言

Pandas 是基于 Python 构建的开源数据分析库，提供了强大的数据结构和运算功能。其核心在于两种数据结构：

Series：一维数组，类似 Numpy 的一维 array，但带有索引标签，可存储字符串、布尔值或数字等多种类型。
DataFrame：二维表格型结构，类似 SQL 表或 Excel 工作表。每列可以是不同数据类型，拥有列名和行索引，是 Pandas 处理数据的核心对象。

导入库

通常将 Pandas 简写为 pd 进行导入：

import pandas as pd

Series 基础操作

创建与索引

从 0 开始存储数据时，默认索引即为位置下标。可以通过 index 属性查看索引标签，使用 values 获取具体的数值内容。

注意区分**标签（Label）与下标（Position）**的区别。默认情况下，标签与下标一致，但我们可以自定义标签。一旦指定了非默认的标签，直接通过原下标访问可能会报错，此时需借助 iloc 和 loc 进行定位。

文章配图

loc 与 iloc 的使用

iloc：基于整数位置（Position）的索引，即计算机内部的默认下标。
loc：基于自定义标签（Label）的索引，由用户自主定义。

例如，当数组中位置 1 的值是 2，而我们定义的标签 1 对应的值是 5 时，iloc[1] 返回 2，而 loc[1] 返回 5。

文章配图

键值对与修改

Series 本质上是一维数据，其'键'对应数据的标签，'值'对应数据本身。类似于字典结构，支持通过标签修改数据。

例如，找到标签为'小张'的记录并修改其值为 95：

文章配图

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

# 选取考试 1 到考试 3 的数据
result = df.loc[:, "考试 1":"考试 3"]
# 应用 lambda 函数，排序后取 -2
second_max = result.apply(lambda x: np.sort(x)[-2])

Python Pandas 核心数据结构与操作实战指南

前言