Python 操作 Word 文档入门与实战指南
本文主要讲解在 Windows 环境下使用 Python 操作 Microsoft Word 文档的思路、核心对象模型及实际应用场景。通过 win32com 库,我们可以直接调用 Word 的 COM 接口,实现自动化办公任务。
一、环境准备与基础配置
1. 安装依赖
使用 win32com 需要安装 pywin32 模块。
pip install pywin32
推荐使用 Python 的 IDLE 或 VS Code 进行交互开发,方便调试和实时查看效果。
2. 启动 Word 应用
在使用任何功能前,首先需要启动 Word 应用程序实例。
from win32com.client import Dispatch
# 创建 Word 应用程序对象
app = Dispatch('Word.Application')
# 默认情况下 Word 是隐藏的,设置为可见以便观察
app.Visible = True
运行上述代码后,会弹出一个空白的 Word 窗口。如果不需要看到界面(例如后台批量处理),可以将 app.Visible 设置为 False。
二、核心对象模型解析
Word 的对象模型基于 COM 架构,理解其层级关系是编写脚本的关键。
1. Application 对象:Word 应用
代表整个 Word 进程,包含菜单栏、工具栏、所有打开的文档等全局资源。
app = win32com.client.Dispatch('Word.Application')
2. Document 对象:文档
代表一个具体的 .docx 或 .doc 文件。一个 Application 可以包含多个 Document。
# 新建文档
doc = app.Documents.Add()
# 打开已有文档
doc = app.Documents.Open(r'C:\Users\Name\Desktop\test.docx')
3. Selection 对象:当前选区
Selection 代表当前窗口的活动选区。它可以是高亮区域,也可以是插入点光标。同一时间只能有一个 Selection。
- 获取:
s = app.Selection - 输入文本:
# Text 属性:替换选区内容 s.Text = 'Hello, World!' # TypeText 方法:在光标后追加文本 s.TypeText('Hello, World!') - 移动与选择:


