前言
Pandas 是基于 Python 构建的开源数据分析库,提供了强大的数据结构和运算功能。其核心在于两种数据结构:
- Series:一维数组,类似 Numpy 的一维 array,但带有索引标签,可存储字符串、布尔值或数字等多种类型。
- DataFrame:二维表格型结构,类似 SQL 表或 Excel 工作表。每列可以是不同数据类型,拥有列名和行索引,是 Pandas 处理数据的核心对象。
导入库
通常将 Pandas 简写为 pd 进行导入:
import pandas as pd
Series 基础操作
创建与索引
从 0 开始存储数据时,默认索引即为位置下标。可以通过 index 属性查看索引标签,使用 values 获取具体的数值内容。
注意区分**标签(Label)与下标(Position)**的区别。默认情况下,标签与下标一致,但我们可以自定义标签。一旦指定了非默认的标签,直接通过原下标访问可能会报错,此时需借助 iloc 和 loc 进行定位。

loc 与 iloc 的使用
- iloc:基于整数位置(Position)的索引,即计算机内部的默认下标。
- loc:基于自定义标签(Label)的索引,由用户自主定义。
例如,当数组中位置 1 的值是 2,而我们定义的标签 1 对应的值是 5 时,iloc[1] 返回 2,而 loc[1] 返回 5。

键值对与修改
Series 本质上是一维数据,其'键'对应数据的标签,'值'对应数据本身。类似于字典结构,支持通过标签修改数据。
例如,找到标签为'小张'的记录并修改其值为 95:

















