跳到主要内容PyAutoGUI:Python 桌面自动化框架详解 | 极客日志Python
PyAutoGUI:Python 桌面自动化框架详解
本文详细介绍 PyAutoGUI 跨平台桌面自动化库。内容包括安装方法、鼠标操作(移动点击拖拽滚轮)、键盘输入与快捷键模拟、屏幕截图及图像识别定位技术。文章还阐述了故障安全机制以防止操作失控,并提供了基于记事本的完整自动化实战代码示例,适用于 Windows、macOS 和 Linux 系统的重复性任务处理。
城市逃兵2 浏览 一、PyAutoGUI 核心介绍
PyAutoGUI 是一款跨平台(支持 Windows、macOS、Linux)的 Python 桌面自动化库,能够模拟用户的鼠标移动、点击、滚轮操作和键盘输入,还支持屏幕截图、图像识别定位等功能,广泛用于重复性桌面操作自动化(如表单填写、软件操作、批量处理等)。
二、安装步骤
直接通过 pip 命令安装,命令简洁无复杂依赖:
pip install pyautogui
补充:若安装失败(如 macOS 需额外依赖),可参考官方文档适配系统环境,Windows 系统通常可直接安装成功。
三、核心功能详解
自动获取当前鼠标位置
pyautogui
time
:
:
x, y = pyautogui.position()
(x, y)
time.sleep()
KeyboardInterrupt:
()
import
import
try
while
True
print
1
except
print
'\nExit.'
(一)鼠标操作:模拟用户鼠标行为
PyAutoGUI 提供了完整的鼠标模拟接口,核心包括移动、点击、拖拽等,所有操作均基于屏幕坐标系统(屏幕左上角为原点 (0, 0),向右为 x 轴正方向,向下为 y 轴正方向)。
1. 鼠标移动
- 基础移动:将鼠标从当前位置移动到指定坐标 (x, y)
import pyautogui
pyautogui.moveTo(x=100, y=200, duration=0.5)
- 相对移动:基于当前鼠标位置,偏移指定像素(dx 为 x 轴偏移,dy 为 y 轴偏移)
pyautogui.moveRel(dx=50, dy=30, duration=0.3)
2. 鼠标点击
pyautogui.click(x=100, y=200, duration=0.2)
- 指定按键点击:支持左键(left)、右键(right)、中键(middle)
pyautogui.click(x=100, y=200, button='right', duration=0.2)
pyautogui.click(x=100, y=200, button='middle', duration=0.2)
pyautogui.doubleClick(x=100, y=200, duration=0.2)
pyautogui.tripleClick(x=100, y=200, duration=0.2)
3. 鼠标拖拽
模拟鼠标按住并拖动的行为,常用于文件拖拽、窗口调整等场景:
pyautogui.dragTo(x=300, y=400, duration=0.8, button='left')
pyautogui.dragRel(dx=100, dy=50, duration=0.5, button='left')
4. 鼠标滚轮
模拟滚轮滚动行为,clicks 参数指定滚动幅度(正数向上滚,负数向下滚):
pyautogui.scroll(clicks=-5, x=100, y=200)
pyautogui.scroll(clicks=3, x=100, y=200)
(二)键盘操作:模拟输入与快捷键
1. 普通文本输入
使用 typewrite() 方法输入字符串,支持指定输入间隔(模拟人工输入速度):
pyautogui.typewrite("Hello, PyAutoGUI!")
pyautogui.typewrite("Hello, PyAutoGUI!", interval=0.2)
2. 特殊按键输入
对于回车键、空格键、快捷键等特殊按键,需使用按键名称(封装在 PyAutoGUI 中),核心方法:
- press():单次按下并释放某个按键
- keyDown():按住某个按键不释放
- keyUp():释放按住的按键
pyautogui.press('enter')
pyautogui.keyDown('ctrl')
pyautogui.press('c')
pyautogui.keyUp('ctrl')
pyautogui.hotkey('ctrl', 'c')
pyautogui.hotkey('ctrl', 'v')
pyautogui.hotkey('ctrl', 'a')
常用特殊按键名称:enter(回车)、space(空格)、backspace(删除)、tab(制表符)、shift、ctrl、alt 等。
(三)屏幕与图像识别:定位目标元素
1. 屏幕基础信息获取
screen_width, screen_height = pyautogui.size()
print(f"屏幕分辨率:{screen_width} × {screen_height}")
mouse_x, mouse_y = pyautogui.position()
print(f"当前鼠标位置:({mouse_x}, {mouse_y})")
2. 图像定位:查找屏幕上的目标图像
PyAutoGUI 支持通过目标图像(如按钮截图、图标截图),自动查找其在屏幕上的坐标,核心方法 locateOnScreen()。
- 先截取目标元素的截图(保存为 PNG 格式,推荐使用截图工具精准截取)
- 使用 locateOnScreen() 查找图像位置,返回目标区域的坐标和尺寸
- 通过 center() 方法获取目标区域的中心坐标(便于点击等操作)
import pyautogui
import time
time.sleep(3)
try:
target_location = pyautogui.locateOnScreen('image.png', confidence=0.8)
if target_location:
target_center = pyautogui.center(target_location)
print(f"目标图像位置:{target_location},中心坐标:{target_center}")
pyautogui.click(target_center.x, target_center.y, duration=0.2)
else:
print("未找到目标图像")
except Exception as e:
print(f"查找失败:{e}")
注意:使用 confidence 参数时,需额外安装 opencv-python:pip install opencv-python
3. 屏幕截图
pyautogui.screenshot('full_screen.png')
pyautogui.screenshot('partial_screen.png', region=(100, 100, 300, 200))
(四)安全机制:防止自动化失控
PyAutoGUI 提供了关键的安全保护机制,避免自动化操作失控(如鼠标移到屏幕边缘无法找回、无限循环操作等):
1. 故障安全触发
默认开启:当鼠标移动到屏幕左上角(坐标 (0, 0))时,会立即抛出 FailSafeException 异常,终止所有自动化操作:
try:
while True:
pyautogui.moveRel(10, 0, duration=0.1)
except pyautogui.FailSafeException:
print("故障安全机制触发,程序终止")
2. 操作延迟
通过 PAUSE 属性设置所有 PyAutoGUI 操作的默认间隔时间(秒),便于观察操作过程,也可防止操作过快导致程序异常:
四、实战示例:简单自动化操作
import pyautogui
import time
pyautogui.PAUSE = 0.5
pyautogui.FAILSAFE = True
print("5 秒后开始操作,请打开记事本...")
time.sleep(5)
pyautogui.typewrite("Python 自动化 - PyAutoGUI 实战", interval=0.1)
pyautogui.press('enter')
pyautogui.typewrite("这是一个简单的自动化演示", interval=0.1)
pyautogui.hotkey('ctrl', 'a')
pyautogui.hotkey('ctrl', 'c')
pyautogui.alert("自动化操作完成!")
微信扫一扫,关注极客日志
微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
相关免费在线工具
- curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
- Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
- Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
- Markdown 转 HTML
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML 转 Markdown 互为补充。 在线工具,Markdown 转 HTML在线工具,online
- HTML 转 Markdown
将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML 转 Markdown在线工具,online
- JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。 在线工具,JSON 压缩在线工具,online