Python Pandas 核心数据结构与操作实战指南
Pandas 是 Python 数据分析领域的基石,提供了高效的数据结构和运算功能。掌握它,意味着能轻松处理表格数据、进行统计分析及构建机器学习特征。
一、环境准备
首先导入库并设置别名,这是约定俗成的写法:
import pandas as pd
二、Series:一维带标签数组
Series 类似 NumPy 的一维数组,但多了索引标签(Index),可存储异构数据。
1. 创建与基础属性
默认从 0 开始索引。可以通过 index 查看标签,values 获取底层数值。

注意区分位置索引和标签。若自定义了标签(如 5, 6, 7),直接访问下标 0 会报错,此时需使用定位方法。

2. 定位方式:iloc 与 loc
这是新手最容易混淆的地方,务必分清:
- iloc:基于整数位置(Positional Index)。计算机视角的'第几个'。
- loc:基于标签(Label-based Indexing)。用户视角的'名字'。

3. 创建与修改
Series 本质是一维数据,键值对中的'键'即标签。
# 创建示例
s = pd.Series([90, 85, 95], index=['小张', '小李', '小王'])
# 修改数据:通过标签定位
s.loc['小张'] = 95

























