简介
tablib 是一个 Python 数据处理库,旨在简化各种数据操作任务。它提供了一种轻松处理数据的方式,适用于数据科学家、分析师及开发人员。主要功能包括数据导入导出、转换、合并、拆分、筛选和排序等。
安装
使用 pip 安装 tablib:
pip install tablib
注意:导出为 Excel (.xlsx) 格式通常需要额外安装 openpyxl 依赖:
pip install openpyxl
核心概念
在 tablib 中,数据存储在 Dataset 对象中。Dataset 可以看作是一个二维表格,包含表头(headers)和多行数据(rows)。
创建数据集
import tablib
# 创建空数据集
data = tablib.Dataset()
# 设置表头
data.headers = ['Name', 'Age', 'Country']
# 添加单行数据
data.append(['Alice', 25, 'USA'])
data.append(['Bob', 30, 'Canada'])
# 批量添加数据
data.extend([
['Charlie', 22, 'UK'],
['David', 35, 'Germany']
])
print(data)
数据修改
# 插入数据到指定位置
data.insert(0, ['Eve', 28, 'France'])
# 删除指定索引的行
data.pop(0)
# 更新特定单元格
data[0][1] = 99
数据导入与导出
tablib 支持多种格式的序列化与反序列化。
CSV 格式
# 导出为 CSV
with (, ) f:
f.write(data.export())
loaded_data = tablib.Dataset().load(().read())


