概述
Pandas 是 Python 数据分析的核心库,提供了强大的数据结构(Series 和 DataFrame)及运算功能。它类似于 SQL 表或 Excel 工作表,支持多种数据类型混合存储,是处理表格数据的首选工具。
环境准备
首先导入库并设置别名:
import pandas as pd
import numpy as np
Series 基础操作
Series 是一维数组,类似 Numpy 的 array,但带有索引标签,可存储字符串、布尔值或数字。
创建与查看
默认从 0 开始索引:

使用 index 获取标签序列,values 获取底层数值:

注意区分标签(Label)和下标(Position)。自定义标签后,默认位置访问会报错,此时需配合 loc 和 iloc 使用。
loc 与 iloc 的区别
- iloc:基于整数下标(计算机记忆),如
s.iloc[1]。 - loc:基于自定义标签(人类可读),如
s.loc['a']。

数据修改与筛选
通过 loc 可直接修改指定标签的值:

筛选时,逻辑运算符需用 & 代替 and:


























