Python 操作 Word 文档入门与实战指南 | 极客日志

Python

Python 操作 Word 文档入门与实战指南

综述由AI生成使用 Python 通过 win32com 库操作 Microsoft Word 文档的方法。内容涵盖环境搭建、核心对象模型（Application、Document、Selection、Range、Font 等）的解析、开发调试技巧以及完整的公文格式化实战案例。文章重点讲解了如何通过 COM 接口实现文档创建、文本输入、样式设置、页面布局调整及页码管理，并提供了异常处理和资源释放的最佳实践，旨在帮助开发者利用 Python 实现高效的 Office 自动化办公任务。

观心发布于 2025/2/7更新于 2026/6/327 浏览

Python 操作 Word 文档入门与实战指南

本文主要讲解在 Windows 环境下使用 Python 操作 Microsoft Word 文档的思路、核心对象模型及实际应用场景。通过 win32com 库，我们可以直接调用 Word 的 COM 接口，实现自动化办公任务。

一、环境准备与基础配置

1. 安装依赖

使用 win32com 需要安装 pywin32 模块。

pip install pywin32

推荐使用 Python 的 IDLE 或 VS Code 进行交互开发，方便调试和实时查看效果。

2. 启动 Word 应用

在使用任何功能前，首先需要启动 Word 应用程序实例。

from win32com.client import Dispatch

# 创建 Word 应用程序对象
app = Dispatch('Word.Application')

# 默认情况下 Word 是隐藏的，设置为可见以便观察
app.Visible = True

运行上述代码后，会弹出一个空白的 Word 窗口。如果不需要看到界面（例如后台批量处理），可以将 app.Visible 设置为 False。

二、核心对象模型解析

Word 的对象模型基于 COM 架构，理解其层级关系是编写脚本的关键。

1. Application 对象：Word 应用

代表整个 Word 进程，包含菜单栏、工具栏、所有打开的文档等全局资源。

app = win32com.client.Dispatch('Word.Application')

2. Document 对象：文档

代表一个具体的 .docx 或 .doc 文件。一个 Application 可以包含多个 Document。

# 新建文档
doc = app.Documents.Add()

# 打开已有文档
doc = app.Documents.Open(r'C:\Users\Name\Desktop\test.docx')

3. Selection 对象：当前选区

Selection 代表当前窗口的活动选区。它可以是高亮区域，也可以是插入点光标。同一时间只能有一个 Selection。

获取：s = app.Selection

输入文本：

# Text 属性：替换选区内容
s.Text = 'Hello, World!'

# TypeText 方法：在光标后追加文本
s.TypeText('Hello, World!')

移动与选择：

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

# 选中整篇文档
s.WholeStory()

# 向左移动 1 个字符
s.MoveLeft(1)

# 删除选区内容
s.Delete()

获取：

r = doc.Range()          # 整个文档
r = s.Range()            # 当前选区对应的 Range
r = doc.Range(0, 10)     # 指定索引范围

特点：Range 没有 Selection 属性，但 Selection 有 Range 属性。Range 更适合用于精确控制特定段落或字符而不影响用户当前的视图焦点。

font = s.Font
font.Name = '仿宋'        # 中文字体
font.Size = 16           # 字号（磅）
font.Bold = True         # 加粗
font.Color = 0x0000FF    # 蓝色 (RGB 值需转换)

pf = s.ParagraphFormat
pf.Alignment = 0         # 0:左对齐，1:居中，2:右对齐
pf.LineSpacingRule = 0   # 0:单倍行距，1:1.5 倍，2:双倍
pf.LeftIndent = 21       # 左缩进（磅）

ps = doc.PageSetup
ps.TopMargin = 79        # 上边距（磅）
ps.BottomMargin = 79     # 下边距（磅）
ps.PageSize = 7          # 7: A4 纸

styles = doc.Styles
normal = styles(-1)      # -1 通常代表'正文'样式
normal.Font.Name = '仿宋'
normal.Font.Size = 16

from win32com.client import Dispatch
import sys

try:
    # 启动 Word
    app = Dispatch('Word.Application')
    app.Visible = False  # 后台运行
    
    # 打开文档
    doc_path = r'C:\Users\Name\Desktop\input.docx'
    doc = app.Documents.Open(doc_path)
    
    # --- 1. 页面设置 ---
    cm_to_points = 28.35  # 1 厘米约等于 28.35 磅
    
    # 版心设置（根据公文标准调整）
    doc.PageSetup.TopMargin = 3.3 * cm_to_points
    doc.PageSetup.BottomMargin = 3.3 * cm_to_points
    doc.PageSetup.LeftMargin = 2.8 * cm_to_points
    doc.PageSetup.RightMargin = 2.6 * cm_to_points
    
    # 网格设置（每行 28 字，每页 22 行）
    doc.PageSetup.LayoutMode = 1  # wdLayoutModeLineGrid
    doc.PageSetup.CharsLine = 28
    doc.PageSetup.LinesPage = 22
    
    # --- 2. 字体样式设置 ---
    # 设置'正文'样式为仿宋三号
    normal_style = doc.Styles(-1)
    normal_style.Font.Name = '仿宋'
    normal_style.Font.NameFarEast = '仿宋'
    normal_style.Font.NameAscii = '仿宋'
    normal_style.Font.Size = 16
    
    # --- 3. 页码设置 ---
    w = doc.Windows(1)
    w.View.SeekView = 4  # wdSeekCurrentPageHeader (进入页眉页脚视图)
    
    s = w.Selection
    s.WholeStory()       # 选中所有页眉页脚
    s.Delete()           # 清除原有页码
    
    # 添加新页码
    s.HeaderFooters.Add(4)  # wdHeaderFooterPrimary
    s.MoveRight(1, 2)       # 移动到右侧
    s.TypeText('— ')        # 添加一字线
    s.InsertAfter(' ')      # 空格
    
    # 设置页码格式
    s.HeaderFooters(1).PageNumbers.StartingNumber = 1
    s.HeaderFooters(1).PageNumbers.NumberStyle = 0  # 阿拉伯数字
    
    # 页码字体设置（四号宋体）
    s.Font.Name = '宋体'
    s.Font.Size = 14
    
    # 退出页眉页脚视图
    w.View.SeekView = 0
    
    # --- 4. 保存与关闭 ---
    output_path = r'C:\Users\Name\Desktop\output.docx'
    doc.SaveAs(output_path)
    doc.Close(False)
    app.Quit()
    
    print(f"处理完成，文件已保存至：{output_path}")
    
except Exception as e:
    print(f"发生错误：{str(e)}")
    if 'app' in locals():
        try:
            app.Quit()
        except:
            pass

Python 操作 Word 文档入门与实战指南

Python 操作 Word 文档入门与实战指南

一、环境准备与基础配置

1. 安装依赖

2. 启动 Word 应用

二、核心对象模型解析

1. Application 对象：Word 应用

2. Document 对象：文档

3. Selection 对象：当前选区

更多推荐文章

相关免费在线工具

4. Range 对象：连续区域

5. Font 对象：字体设置

6. ParagraphFormat 对象：段落格式

7. PageSetup 对象：页面设置

8. Styles 对象：样式集

三、开发与调试思路

四、进阶示例：格式化公文标准

五、常见问题与最佳实践

六、总结

更多推荐文章

相关免费在线工具

Python 操作 Word 文档入门与实战指南

Python 操作 Word 文档入门与实战指南

一、环境准备与基础配置

1. 安装依赖

2. 启动 Word 应用

二、核心对象模型解析

1. Application 对象：Word 应用

2. Document 对象：文档

3. Selection 对象：当前选区

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. Range 对象：连续区域

5. Font 对象：字体设置

6. ParagraphFormat 对象：段落格式

7. PageSetup 对象：页面设置

8. Styles 对象：样式集

三、开发与调试思路

四、进阶示例：格式化公文标准

五、常见问题与最佳实践

六、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具