Python 处理 Excel 文件详解 | 极客日志

Python

Python 处理 Excel 文件详解

Python 提供了 pandas 和 openpyxl 等库用于处理 Excel 文件。介绍如何安装依赖、读取指定 Sheet 数据、写入新文件以及修改现有单元格内容。通过示例代码展示了 DataFrame 转换、样式设置及异常处理机制，帮助开发者高效完成数据自动化任务。

活在当下发布于 2025/2/6更新于 2026/7/2136 浏览

Python 处理 Excel 文件详解

Excel 是一种常见的电子表格文件格式，广泛用于数据记录和处理。Python 提供了多个第三方库，可以方便地对 Excel 文件进行读写、数据操作和处理。本文将介绍如何使用 Python 对 Excel 文件进行处理，并提供相应的代码示例和详细说明。

一、安装第三方库

在开始之前，我们需要安装一些 Python 第三方库，用于对 Excel 文件进行处理。以下是常用的库：

pandas：用于数据分析和处理，支持读写 Excel 文件。
openpyxl：用于读写 .xlsx 格式的 Excel 文件。
xlrd：用于读取旧版 .xls 格式的 Excel 文件（注意：新版 pandas 默认不再支持 xlrd 读取 xlsx）。
xlwt：用于写入旧版 .xls 格式的 Excel 文件。

可以使用 pip 命令进行安装：

pip install pandas openpyxl xlrd xlwt

安装完成后，我们可以开始使用这些库来处理 Excel 文件。

二、读取 Excel 文件

首先，我们需要导入相应的库。使用以下代码导入 pandas 和 openpyxl：

import pandas as pd
import openpyxl

2.1 读取 Excel 文件到 DataFrame

使用 pandas 库可以将 Excel 文件读取到 DataFrame 对象中，方便进行数据分析和处理。以下是一个示例代码：

# 读取 Excel 文件
data = pd.read_excel("data.xlsx")

# 打印 DataFrame
print(data)

这段代码将 data.xlsx 文件读取到 data 变量中，并将其打印输出。你可以根据实际文件名和路径进行修改。

2.2 读取指定 Sheet 的 Excel 文件

如果 Excel 文件中包含多个 Sheet，你可以通过指定 Sheet 名称或索引来读取指定的 Sheet。以下是一个示例代码：

# 读取指定 Sheet 的 Excel 文件
data = pd.read_excel("data.xlsx", sheet_name="Sheet1")

# 打印 DataFrame
print(data)

这段代码将 data.xlsx 文件中名为 "Sheet1" 的 Sheet 读取到 data 变量中。你也可以使用索引，例如 sheet_name=0 表示第一个 Sheet。

2.3 读取特定行列范围

为了优化性能，你可以只读取需要的行和列：

# 读取前 5 行，第 0 列到第 2 列
data = pd.read_excel("data.xlsx", nrows=5, usecols="A:C")

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

# 创建数据
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'London', 'Paris']
}

# 创建 DataFrame
df = pd.DataFrame(data)

# 写入 Excel 文件
df.to_excel("output.xlsx", index=False, sheet_name="Data")

# 打开 Excel 文件
wb = openpyxl.load_workbook("data.xlsx")

# 获取指定 Sheet
sheet = wb["Sheet1"]

# 修改单元格数据
sheet["A1"] = "Updated Value"

# 添加新的 Sheet
new_sheet = wb.create_sheet("Sheet2")

# 保存修改后的 Excel 文件
wb.save("data_modified.xlsx")

from openpyxl.styles import Font, PatternFill, Border, Side

# 定义样式
font = Font(bold=True, color="FF0000")
fill = PatternFill(start_color="FFFF00", fill_type="solid")
border = Border(left=Side(style='thin'), right=Side(style='thin'))

# 应用样式
sheet['A1'].font = font
sheet['A1'].fill = fill
sheet['A1'].border = border

for row in wb.active.iter_rows(values_only=True):
    # 处理每一行数据
    print(row)

try:
    data = pd.read_excel("data.xlsx")
except FileNotFoundError:
    print("文件未找到，请检查路径")
except Exception as e:
    print(f"发生错误：{e}")

Python 处理 Excel 文件详解

Python 处理 Excel 文件详解

一、安装第三方库

二、读取 Excel 文件

2.1 读取 Excel 文件到 DataFrame

2.2 读取指定 Sheet 的 Excel 文件

2.3 读取特定行列范围

更多推荐文章

相关免费在线工具

三、写入 Excel 文件

四、修改 Excel 文件

4.1 设置单元格样式

五、高级技巧与异常处理

5.1 大数据量处理

5.2 异常捕获

六、总结

更多推荐文章

相关免费在线工具

Python 处理 Excel 文件详解

Python 处理 Excel 文件详解

一、安装第三方库

二、读取 Excel 文件

2.1 读取 Excel 文件到 DataFrame

2.2 读取指定 Sheet 的 Excel 文件

2.3 读取特定行列范围

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、写入 Excel 文件

四、修改 Excel 文件

4.1 设置单元格样式

五、高级技巧与异常处理

5.1 大数据量处理

5.2 异常捕获

六、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具