Python Pandas 库超详细教程 | 极客日志

Python算法

Python Pandas 库超详细教程

Pandas 是基于 Python 的开源数据分析库，提供 Series 和 DataFrame 数据结构。涵盖库的导入、Series 与 DataFrame 的创建、索引操作（loc/iloc）、数据运算（加减乘除）、统计方法（describe/apply）、行列切片及筛选技巧。通过实际案例演示平均值计算与第二大值提取，帮助掌握基础数据处理流程。

邪神洛基发布于 2026/3/23更新于 2026/6/2127 浏览

Python Pandas 库超详细教程

前言

Pandas 是基于 Python 构建的开源数据分析库，提供了强大的数据结构和运算功能。

Series：一维数组，类似于 Numpy 中的一维 array，但具有索引标签，可以保存不同类型的数据，如字符串、布尔值、数字等。
DataFrame：二维表格型数据结构，与 SQL 表或 Excel 工作表类似，每列可以是不同的数据类型（如数值、字符串或日期），并且具有列名和行索引。DataFrame 是 Pandas 的核心数据结构，提供了丰富的数据操作方法。

接下来将逐步介绍其用法。

一、导入 Pandas 库

简写为 pd。

import pandas as pd

二、使用 Series，创建一维数组

从 0 开始存储。

文章配图

三、index 查看下标，values 查看下标的值

注意：不知道标签和下标的区别请看下文解释。

index 的输出类似于 range：
- start 代表起始标签；stop 代表结束标签（不会到这个值，到 n-1 值）；step 代表步长。
values：
- 直接查看下标的值，记得是从 0 开始的值。

文章配图

四、使用 index 指定标签

可以看到数组中 1 的标签不是默认值 0 了，而是标签 5。如果利用想输出下标 0，这时候会报错，我们要使用到 iloc 和 loc，详见第五节。

文章配图

五、iloc 和 loc 的使用

解释：

iloc 是原下标，也就是默认值，基于整数位置索引。
loc 是修改过的下标，我们把它叫作标签，标签是由我们自主给的，计算机并不会自己产生。

可以看到计算机的下标 1 的值是 2。可以看到我们给的标签 1 的值是 5。

文章配图

六、创建对象