跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Python 基于 DXGI 实现现代游戏窗口无闪烁高性能截图方案

Python 结合 DXGI Desktop Duplication API 实现 DirectX 11/12 游戏窗口的后台无闪烁截图。通过 ctypes 封装 C++ DLL,绕过 GDI 限制直接读取显存,返回 NumPy 数组便于 OpenCV 或 AI 模型处理。支持无边框及全屏模式,无需前台激活,适用于自动化脚本与监控场景。

墨染流年发布于 2026/3/15更新于 2026/6/1322 浏览

Python 实现现代游戏窗口无闪烁、高性能 DX11/DX12 截图方案

在 Windows 平台上,许多现代游戏(尤其是使用 DirectX 11/12 或 Vulkan 渲染的游戏)启用了硬件加速和独占全屏模式。传统的截图方法如 PIL.ImageGrab 或 pyautogui.screenshot() 往往无法捕获这些窗口的内容,结果要么是黑屏,要么是桌面背景。

这是因为游戏画面直接由 GPU 渲染到显存,不经过 GDI,且操作系统出于性能和安全考虑限制了普通程序对受保护窗口的访问。要解决这个问题,可以使用 DXGI(DirectX Graphics Infrastructure)技术,特别是 DXGI Desktop Duplication API。

解决方案:基于 DXGI 的 Python 封装类

我们开发了一个轻量级 Python 类 DxgiCapture,它通过调用原生 C++ 编写的 DLL(dxgi4py.dll),利用 Windows 的 DXGI Desktop Duplication API 实现对任意窗口(包括全屏/无边框游戏)的高速截图。

核心优势包括支持 DX11/DX12 游戏、无需前台激活窗口真正后台运行、帧率高延迟低适合自动化脚本与 AI 训练场景,以及返回 NumPy 数组无缝对接 OpenCV 或 PyTorch。

核心代码实现

这里展示 DxgiCapture 类的关键实现逻辑。为了处理 DPI 感知问题,我们在初始化时设置了进程 DPI 上下文。代码中使用了 ctypes 来加载本地 DLL 并传递指针给 Python 层构建 NumPy 数组。

import ctypes
from ctypes import *
import numpy as np
import win32gui
import cv2
from pathlib import Path

root = Path(__file__).parent

class DxgiCapture:
    def __init__(self):
        self.dxgi = None
        self.__hwnd = None
        self.user32 = ctypes.windll.user32
        self.user32.SetProcessDPIAware()
        try:
            # 设置每显示器 DPI 感知,避免缩放问题
            self.user32.SetProcessDpiAwarenessContext(-3)
        except Exception:
            pass

    @property
    def hwnd(self):
        return self.__hwnd

    @hwnd.setter
    def hwnd(self, hwnd):
        if not hwnd or self.hwnd == hwnd:
            return
        self.__hwnd = hwnd
        self.dxgi = self.create_dxgi(hwnd)

    def __del__(self):
        if self.dxgi:
            self.dxgi.destroy()

    def __call__(self, hwnd):
        self.hwnd = hwnd
        shotLeft, shotTop, width, height = self.getWindowRect()
        shot = np.ndarray((height, width, 4), dtype=np.uint8)
        shotPointer = shot.ctypes.data_as(POINTER(c_ubyte))
        buffer = self.dxgi.grab(shotPointer, shotLeft, shotTop, width, height)
        image = np.ctypeslib.as_array(buffer, shape=(height, width, 4))
        image = cv2.cvtColor(image, cv2.COLOR_BGRA2RGB)
        return image

    def getWindowRect(self):
        left, top, right, bottom = win32gui.GetWindowRect(self.hwnd)
        shotLeft, shotTop = 0, 0
        height = bottom - top
        width = right - left
        return shotLeft, shotTop, width, height

    def create_dxgi(self, hwnd):
        if getattr(self, "dxgi", None):
            self.dxgi.destroy()
        dxgi = ctypes.CDLL(str(root / "dxgi4py.dll"))
        dxgi.grab.argtypes = (POINTER(ctypes.c_ubyte), ctypes.c_int, c_int, c_int, c_int,)
        dxgi.grab.restype = POINTER(c_ubyte)
        dxgi.init_dxgi(hwnd)
        return dxgi

调用实例

获取目标窗口句柄后,即可初始化截图器进行单次截图。返回的是 RGB 格式的 numpy.ndarray,可直接用于 OpenCV 显示或模型推理。

import win32gui
from dxgi_capture import DxgiCapture

# 获取目标窗口句柄(例如:查找原神窗口)
hwnd = win32gui.FindWindow(None, "原神")

# 初始化截图器
capture = DxgiCapture()
capture.hwnd = hwnd

# 单次截图
frame = capture(hwnd)

# 返回 RGB 格式的 numpy.ndarray (H, W, 3)
# 可直接用于 OpenCV 显示或模型推理
import cv2
cv2.imshow("Game Capture", frame)
cv2.waitKey(0)

首次使用需安装依赖库:

pip install pywin32 opencv-python numpy

技术原理简述

dxgi4py.dll 封装了以下关键步骤:

  1. 通过 IDXGIFactory1 枚举显卡适配器;
  2. 创建 IDXGIOutputDuplication 对象,绑定到目标窗口所在的显示器;
  3. 使用 AcquireNextFrame 获取 GPU 帧缓冲区;
  4. 将显存数据拷贝到 CPU 内存,并转换为 BGRA 格式;
  5. 通过 ctypes 指针传递给 Python,构建 NumPy 数组。

整个过程绕过 GDI,直接与 DirectX 交互,因此能捕获受保护内容。

常见问题

Q:是否支持 Vulkan 游戏? A:部分支持。Vulkan 内容若通过 DXGI 共享(如 Steam Overlay 开启),可被捕获;否则需额外层(如 OBS 的 Vulkan 钩子)。

Q:能否截取 UWP 应用(如 Xbox Game Bar)? A:受限于 Windows 安全策略,部分 UWP 应用无法捕获。

Q:是否需要管理员权限? A:不需要!普通用户权限即可运行。

结语

如果你正在开发游戏辅助工具、AI 自动化脚本或直播监控系统,这套基于 DXGI 的截图方案将极大提升你的效率与稳定性。相比老旧的 BitBlt 方法,DXGI 方案在处理现代图形接口时具有显著的性能优势。

目录

  1. Python 实现现代游戏窗口无闪烁、高性能 DX11/DX12 截图方案
  2. 解决方案:基于 DXGI 的 Python 封装类
  3. 核心代码实现
  4. 调用实例
  5. 获取目标窗口句柄(例如:查找原神窗口)
  6. 初始化截图器
  7. 单次截图
  8. 返回 RGB 格式的 numpy.ndarray (H, W, 3)
  9. 可直接用于 OpenCV 显示或模型推理
  10. 技术原理简述
  11. 常见问题
  12. 结语
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • ESP-SparkBot 开源 AI 桌面机器人 ESP32-S3 核心方案解析
  • OpenClaw 安全 AI 助理从零搭建实战指南
  • AI 驱动的虚拟现实与增强现实开发
  • LangChain 大模型对话记忆模块实战与 Web 应用
  • 分治算法实战:快速排序与归并排序
  • Lada v0.10.1 本地 AI 视频去马赛克工具使用教程
  • 使用 LLaMA-Factory 微调 Qwen2.5 模型并转换为 GGUF 格式部署
  • 一次性搞懂 AIGC:22 个核心概念解析
  • 生成式人工智能 (AIGC) 概念、历史与应用详解
  • Webnovel Writer:基于 Claude Code 的长篇网文 AI 创作系统
  • Mac 系统安装与配置 Claude Code 指南
  • Python 常用库指南:数值计算、可视化、机器学习等 8 大领域
  • OpenClaw 开源项目 Clawra 搭建指南:生成 AI 伴侣与动态视频
  • 基于 Meilisearch 与 Ollama 的文本向量搜索实现
  • AI 编程工具横评:TRAE、Qoder、Cursor 与 GitHub Copilot 选型指南
  • 小爱音乐 Docker 部署手册
  • System Verilog 教程:从基础到高级验证
  • iv8:基于 V8 的 C++ 浏览器补环境框架
  • 链表节点两两交换:Java 递归与迭代实战
  • OpenClaw 与 Claude Code、Cursor、Copilot 的差异解析

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online