跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Python Pandas 库核心用法详解

综述由AI生成Pandas 是 Python 数据分析的核心库,提供 Series 和 DataFrame 数据结构。涵盖导入库、创建对象、索引操作(loc/iloc)、数据运算、筛选及常用统计方法。通过示例演示了如何高效处理二维表格数据。

ApiHolic发布于 2026/3/16更新于 2026/5/2214 浏览
Python Pandas 库核心用法详解

前言

Pandas 是基于 Python 构建的开源数据分析库,提供了强大的数据结构和运算功能。

  • Series:一维数组,类似于 Numpy 中的一维 array,但具有索引标签,可以保存不同类型的数据,如字符串、布尔值、数字等。
  • DataFrame:二维表格型数据结构,与 SQL 表或 Excel 工作表类似,每列可以是不同的数据类型(如数值、字符串或日期),并且具有列名和行索引。DataFrame 是 Pandas 的核心数据结构,提供了丰富的数据操作方法。

接下来我们将逐步介绍其用法。

一、导入 Pandas 库

简写为 pd。

import pandas as pd

二、使用 Series,创建一维数组

从 0 开始存储。

文章配图

三、index 查看下标,values 查看下标的值

  1. index 的输出类似于 range: start 代表起始标签;stop 代表结束标签(不会到这个值,到 n-1 值);step 代表步长。
  2. values: 直接查看下标的值,记得是从 0 开始的值。

文章配图

四、使用 index 指定标签

注意:可以看到数组中 1 的标签不是默认值 0 了,而是标签 5。如果利用想输出下标 0,这时候会报错,我们要使用到 "iloc" 和 "loc",请看第五节。

文章配图

五、iloc 和 loc 的使用

解释:

  1. iloc 是原下标,也就是默认值,计算机的记忆。
  2. loc 是修改过的下标,我们把它叫作标签,标签是由我们自主给的,计算机并不会自己产生。

可以看到计算机的下标 1 的值是 2。 可以看到我们给的标签 1 的值是 5。

文章配图

六、创建对象

  1. 这里的我们所理解的键其实就是数据的标签,大部分的人可能会理解为这里是一个字典或者一个数组,其实都不是,是一个一维数据。
  2. 什么是键?如果不知道,就需要回头学习 python 基础了。 键是字典的一个解释,前键后值,称为键值对,如下的:'键':值

文章配图

  1. 修改数据 使用 loc,找标签'小张'让他的值等于 95,可以看到被修改了。

文章配图

  1. 筛选数据 这里的 & 就是 python and 的意思。

文章配图

七、两个数据相加、相减、相乘、相除

1、相加——add

文章配图

可以看到需要链接 s1,如果没有 s1,那会导致数据相加错误,出现 NaN; 这个时候,我们应该使用 add: 在 s1 的基础上 add(s2, fill_value="如果出现没有值的情况,以 0 代替")

文章配图

2、相减——sub

文章配图

3、相乘——mul

文章配图

4、相除——div

文章配图

八、求最大值、最小值、求和值、平均值

文章配图

九、describe() —— 数据分析方法

文章配图

文章配图

十、apply() —— 定义函数判断数据

apply() 对数据批量处理。

文章配图

十一、DataFrame —— 创建二维数组

文章配图

十二、修改标签

标签名要统一,否则会报错;但是可以缺少,但数据也要缺少,一一对应。

文章配图

特别:标签会自动排序好。

文章配图

十三、查看标签(行属性)

文章配图

十四、查看列属性

文章配图

十五、查看数据

文章配图

十六、数据颠倒——行列调换

文章配图

十七、提取数据(列)

  1. 查看班级数据

文章配图

  1. 查看成绩数据

文章配图

  1. 查看学号和成绩,这里我们需要再加一个【】,如果不加会报错

文章配图

十八、提取数据(行)

注意:loc 和 iloc 的区别。

文章配图

十九、切片操作

1、标签切片

文章配图

2、下标切片

注意:3 是终止,并不会执行,如果想从红到丽,需要 [1:4]。

文章配图

3、行列切片——标签

文章配图

4、行列切片——下标

文章配图

二十、筛选——判断、提取数据

  1. 单单判断数据,输出布尔值

文章配图

  1. 判断完数据并提取数据,输出数据

文章配图

二十一、查看前几行数据——数据量庞大可使用

注意:如果 head() 不输入任何的值,那他的默认值为 5,输出前 5 行数据。

文章配图

二十二、drop 搭配 axis 用法

我们先导入要使用的数据。

文章配图

添加考试 4 的数据。

文章配图

drop:就是删除的意思。 axis:用来指定是行还是列。

可以看到删除了行的 002 和 004。

文章配图

可以看到删除了列的考试 2 和考试 4。

文章配图

二十三、两个数据相加

  1. student 的数据请看目录二十二。
  2. 先定义一个数据 bonus,让他们两个相加。
  3. 注意:运行一次相加一次;标签要一一对应,否则会导致数据错误。 相加完之后不会改变原数据,如果需要改变原数据,全部都是要重新赋值。

文章配图

实现重新赋值,以考试 4 为例。

文章配图

二十四、案例实操——求出平均值

mean(axis=1):求平均值每一行。 这里可能会导致理解冲突,上面解释 axis=0 代表行,axis=1 代表列,但是 mean(axis=1) 为什么代表的是行???请看下面的解释。

文章配图

可以理解为如果被包含,则方向相反。 行对列操作。 列对行操作。

文章配图

文章配图

文章配图

二十五、案例实操——筛选出第二大的数据

  1. loc[:,"考试 1":"考试 3"] 其实就是 loc["001":"006","考试 1":"考试 3"]。
  2. lambda x:定义匿名函数 x。
  3. np.sort(x):使用 numpy 库的 sort 方法,进行升序。
  4. np.sort(x)[-2]:升序完后提取倒数第二个值,也就是第二大的值,然后返回匿名函数 x。

文章配图

目录

  1. 前言
  2. 一、导入 Pandas 库
  3. 二、使用 Series,创建一维数组
  4. 三、index 查看下标,values 查看下标的值
  5. 四、使用 index 指定标签
  6. 五、iloc 和 loc 的使用
  7. 六、创建对象
  8. 七、两个数据相加、相减、相乘、相除
  9. 1、相加——add
  10. 2、相减——sub
  11. 3、相乘——mul
  12. 4、相除——div
  13. 八、求最大值、最小值、求和值、平均值
  14. 九、describe() —— 数据分析方法
  15. 十、apply() —— 定义函数判断数据
  16. 十一、DataFrame —— 创建二维数组
  17. 十二、修改标签
  18. 十三、查看标签(行属性)
  19. 十四、查看列属性
  20. 十五、查看数据
  21. 十六、数据颠倒——行列调换
  22. 十七、提取数据(列)
  23. 十八、提取数据(行)
  24. 十九、切片操作
  25. 1、标签切片
  26. 2、下标切片
  27. 3、行列切片——标签
  28. 4、行列切片——下标
  29. 二十、筛选——判断、提取数据
  30. 二十一、查看前几行数据——数据量庞大可使用
  31. 二十二、drop 搭配 axis 用法
  32. 二十三、两个数据相加
  33. 二十四、案例实操——求出平均值
  34. 二十五、案例实操——筛选出第二大的数据
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • DJI DroneID 信号解析工具与 SDR 分析指南
  • VS Code 远程连接时 Copilot Chat 图标不显示的解决方案
  • AI 中转 API 原理揭秘:为何价格远低于官方?
  • 设计支持万人并发抢购的秒杀系统架构方案
  • LogicFlow 前端流程图编辑框架入门与实战
  • Dify x 飞书:Lark Trigger 实现 AI 工作流自动化
  • WebGIS、无人机与 AI 融合:构建下一代智能巡检系统
  • AI 模型可解释性与安全防护的结合
  • KWDB 实战:SQL 构建物流车队轨迹监控与实时报警系统
  • MySQL 8.0 Windows 安装与配置实战指南
  • LLaMA-Factory 微调 Qwen3-VL 详细流程
  • Qwen3-VL 视觉语言模型快速部署与微调指南
  • QTTabBar 为 Windows 资源管理器添加标签页功能
  • 网页抓取(Web Scraping)技术指南:从原理到实战
  • Python 常用集成开发环境(IDE)功能对比与选择指南
  • RISC-V 处理器 FPGA 实现:高性能开源核心硬件部署实践
  • FPGA 高云 PLL 锁相环 IP 核配置与多时钟域设计
  • 机器学习:数据清洗与预处理(Python)
  • Qwen3Guard-Gen-WEB 企业级部署与权限控制指南
  • 使用 DeepSeek 辅助开发高性能贪吃蛇游戏

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online