Pandas 操作 Excel 的常用场景
Pandas 用来操作 Excel 很顺手,下面整理了 9 个常见操作,覆盖了日常工作中大部分场景。
读取与写入
先用字典创建一个 DataFrame,设置工号为索引,写入 Excel 再读出来。读回时索引会变成普通列,如果想保留索引,可以在 read_excel 时指定 index_col 参数。不过日常使用,知道基本的读写就够了。
import pandas as pd
# 通过字典形式构建 DataFrame
df = pd.DataFrame({
'工号': [1001, 1002, 1003],
'姓名': ['张三', '李四', '王五'],
'年龄': [28, 25, 30]
})
df = df.set_index('工号') # 自定义索引
df.to_excel('人事信息.xlsx') # 写入 excel
df = pd.read_excel('人事信息.xlsx') # 读取 excel
print(df)
# 输出结果:
# 工号 姓名 年龄
# 0 1001 张三 28
# 1 1002 李四 25
# 2 1003 王五 30
选择列
选择某一列很简单,直接用列名索引。
# 选择 Name 列数据
names = df['姓名']
print(names)
# 输出结果:
# 0 张三
# 1 李四
# 2 王五
选择行
用 loc 按标签索引选择行,iloc 按位置也可以。
# 选择第一行数据
first_row = df.loc[0]
print(first_row)
# 输出结果:
# 工号 1001


