Python Pandas 库核心用法详解 | 极客日志

PythonAI算法

Python Pandas 库核心用法详解

Pandas 是基于 Python 的开源数据分析库，提供 Series 和 DataFrame 等核心数据结构。内容涵盖库的导入、一维数组创建、索引查看、标签指定、loc 与 iloc 的区别与应用。此外包括键值对理解、数据修改筛选、算术运算、统计方法（最大值、平均值、describe）、apply 函数使用及二维数组操作。最后通过案例演示行列调换、切片提取、数据筛选及 drop 用法，解决平均值计算与第二大值提取问题。

链路追踪发布于 2026/3/24更新于 2026/6/1623 浏览

Python Pandas 库核心用法详解

前言

1、Python 的 Pandas 是一个基于 Python 构建的开源数据分析库，它提供了强大的数据结构和运算功能。

2、

Series：一维数组，类似于 Numpy 中的一维 array，但具有索引标签，可以保存不同类型的数据，如字符串、布尔值、数字等。
DataFrame：二维表格型数据结构，与 SQL 表或 Excel 工作表类似，每列可以是不同的数据类型（如数值、字符串或日期），并且具有列名和行索引。DataFrame 是 Pandas 的核心数据结构，提供了丰富的数据操作方法。

接下来我们将逐步介绍其用法。

一、导入 Pandas 库

简写为 pd。

import pandas as pd

二、使用 Series，创建一维数组

从 0 开始存储。

文章配图

三、index 查看下标，values 查看下标的值

1、index 的输出类似于 range：

start 代表起始标签；stop 代表结束标签（不会到这个值，到 n-1 值）；step 代表步长。

2、values：

直接查看下标的值，记得是从 0 开始的值。

文章配图

四、使用 index 指定标签

注意：可以看到数组中 1 的标签不是默认值 0 了，而是标签 5，如果利用想输出下标 0，这时候会报错，我们要使用到'iloc'和'loc'，请看第五节。

文章配图

五、iloc 和 loc 的使用

解释：

1、iloc 是原下标，也就是默认值，计算机的记忆。

2、loc 是修改过的下标，我们把它叫作标签，标签是由我们自主给的，计算机并不会自己产生。

可以看到计算机的下标 1 的值是 2。

可以看到我们给的标签 1 的值是 5。

文章配图

六、创建对象

1、这里的我们所理解的键其实就是数据的标签，大部分的人可能会理解为这里是一个字典或者一个数组，其实都不是，是一个一维数据。