前言
Pandas 是基于 Python 构建的开源数据分析库,提供了强大的数据结构和运算功能。
- Series:一维数组,类似于 Numpy 中的一维 array,但具有索引标签,可以保存不同类型的数据,如字符串、布尔值、数字等。
- DataFrame:二维表格型数据结构,与 SQL 表或 Excel 工作表类似,每列可以是不同的数据类型(如数值、字符串或日期),并且具有列名和行索引。DataFrame 是 Pandas 的核心数据结构,提供了丰富的数据操作方法。
接下来将逐步介绍其用法。
一、导入 Pandas 库
简写为 pd。
import pandas as pd
二、使用 Series,创建一维数组
从 0 开始存储。

三、index 查看下标,values 查看下标的值
注意:不知道标签和下标的区别请看下文解释。
- index 的输出类似于 range:
- start 代表起始标签;stop 代表结束标签(不会到这个值,到 n-1 值);step 代表步长。
- values:
- 直接查看下标的值,记得是从 0 开始的值。

四、使用 index 指定标签
可以看到数组中 1 的标签不是默认值 0 了,而是标签 5。如果利用想输出下标 0,这时候会报错,我们要使用到 iloc 和 loc,详见第五节。

五、iloc 和 loc 的使用
解释:
- iloc 是原下标,也就是默认值,基于整数位置索引。
- loc 是修改过的下标,我们把它叫作标签,标签是由我们自主给的,计算机并不会自己产生。
可以看到计算机的下标 1 的值是 2。 可以看到我们给的标签 1 的值是 5。












































