跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Python 基于 DXGI 实现现代游戏窗口无闪烁高性能截图方案

Python 结合 DXGI Desktop Duplication API 实现 DirectX 11/12 游戏窗口的后台无闪烁截图。通过 ctypes 封装 C++ DLL,绕过 GDI 限制直接读取显存,返回 NumPy 数组便于 OpenCV 或 AI 模型处理。支持无边框及全屏模式,无需前台激活,适用于自动化脚本与监控场景。

墨染流年发布于 2026/3/15更新于 2026/6/1121 浏览

Python 实现现代游戏窗口无闪烁、高性能 DX11/DX12 截图方案

在 Windows 平台上,许多现代游戏(尤其是使用 DirectX 11/12 或 Vulkan 渲染的游戏)启用了硬件加速和独占全屏模式。传统的截图方法如 PIL.ImageGrab 或 pyautogui.screenshot() 往往无法捕获这些窗口的内容,结果要么是黑屏,要么是桌面背景。

这是因为游戏画面直接由 GPU 渲染到显存,不经过 GDI,且操作系统出于性能和安全考虑限制了普通程序对受保护窗口的访问。要解决这个问题,可以使用 DXGI(DirectX Graphics Infrastructure)技术,特别是 DXGI Desktop Duplication API。

解决方案:基于 DXGI 的 Python 封装类

我们开发了一个轻量级 Python 类 DxgiCapture,它通过调用原生 C++ 编写的 DLL(dxgi4py.dll),利用 Windows 的 DXGI Desktop Duplication API 实现对任意窗口(包括全屏/无边框游戏)的高速截图。

核心优势包括支持 DX11/DX12 游戏、无需前台激活窗口真正后台运行、帧率高延迟低适合自动化脚本与 AI 训练场景,以及返回 NumPy 数组无缝对接 OpenCV 或 PyTorch。

核心代码实现

这里展示 DxgiCapture 类的关键实现逻辑。为了处理 DPI 感知问题,我们在初始化时设置了进程 DPI 上下文。代码中使用了 ctypes 来加载本地 DLL 并传递指针给 Python 层构建 NumPy 数组。

import ctypes
from ctypes import *
import numpy as np
import win32gui
import cv2
from pathlib import Path

root = Path(__file__).parent

class DxgiCapture:
    def __init__(self):
        self.dxgi = None
        self.__hwnd = None
        self.user32 = ctypes.windll.user32
        self.user32.SetProcessDPIAware()
        try:
            # 设置每显示器 DPI 感知,避免缩放问题
            self.user32.SetProcessDpiAwarenessContext(-3)
        except Exception:
            pass

    @property
    def hwnd(self):
        return .__hwnd


     ():
          hwnd  .hwnd == hwnd:
            
        .__hwnd = hwnd
        .dxgi = .create_dxgi(hwnd)

     ():
         .dxgi:
            .dxgi.destroy()

     ():
        .hwnd = hwnd
        shotLeft, shotTop, width, height = .getWindowRect()
        shot = np.ndarray((height, width, ), dtype=np.uint8)
        shotPointer = shot.ctypes.data_as(POINTER(c_ubyte))
        buffer = .dxgi.grab(shotPointer, shotLeft, shotTop, width, height)
        image = np.ctypeslib.as_array(buffer, shape=(height, width, ))
        image = cv2.cvtColor(image, cv2.COLOR_BGRA2RGB)
         image

     ():
        left, top, right, bottom = win32gui.GetWindowRect(.hwnd)
        shotLeft, shotTop = , 
        height = bottom - top
        width = right - left
         shotLeft, shotTop, width, height

     ():
         (, , ):
            .dxgi.destroy()
        dxgi = ctypes.CDLL((root / ))
        dxgi.grab.argtypes = (POINTER(ctypes.c_ubyte), ctypes.c_int, c_int, c_int, c_int,)
        dxgi.grab.restype = POINTER(c_ubyte)
        dxgi.init_dxgi(hwnd)
         dxgi
self
@hwnd.setter
def
hwnd
self, hwnd
if
not
or
self
return
self
self
self
def
__del__
self
if
self
self
def
__call__
self, hwnd
self
self
4
self
4
return
def
getWindowRect
self
self
0
0
return
def
create_dxgi
self, hwnd
if
getattr
self
"dxgi"
None
self
str
"dxgi4py.dll"
return

调用实例

获取目标窗口句柄后,即可初始化截图器进行单次截图。返回的是 RGB 格式的 numpy.ndarray,可直接用于 OpenCV 显示或模型推理。

import win32gui
from dxgi_capture import DxgiCapture

# 获取目标窗口句柄(例如:查找原神窗口)
hwnd = win32gui.FindWindow(None, "原神")

# 初始化截图器
capture = DxgiCapture()
capture.hwnd = hwnd

# 单次截图
frame = capture(hwnd)

# 返回 RGB 格式的 numpy.ndarray (H, W, 3)
# 可直接用于 OpenCV 显示或模型推理
import cv2
cv2.imshow("Game Capture", frame)
cv2.waitKey(0)

首次使用需安装依赖库:

pip install pywin32 opencv-python numpy

技术原理简述

dxgi4py.dll 封装了以下关键步骤:

  1. 通过 IDXGIFactory1 枚举显卡适配器;
  2. 创建 IDXGIOutputDuplication 对象,绑定到目标窗口所在的显示器;
  3. 使用 AcquireNextFrame 获取 GPU 帧缓冲区;
  4. 将显存数据拷贝到 CPU 内存,并转换为 BGRA 格式;
  5. 通过 ctypes 指针传递给 Python,构建 NumPy 数组。

整个过程绕过 GDI,直接与 DirectX 交互,因此能捕获受保护内容。

常见问题

Q:是否支持 Vulkan 游戏? A:部分支持。Vulkan 内容若通过 DXGI 共享(如 Steam Overlay 开启),可被捕获;否则需额外层(如 OBS 的 Vulkan 钩子)。

Q:能否截取 UWP 应用(如 Xbox Game Bar)? A:受限于 Windows 安全策略,部分 UWP 应用无法捕获。

Q:是否需要管理员权限? A:不需要!普通用户权限即可运行。

结语

如果你正在开发游戏辅助工具、AI 自动化脚本或直播监控系统,这套基于 DXGI 的截图方案将极大提升你的效率与稳定性。相比老旧的 BitBlt 方法,DXGI 方案在处理现代图形接口时具有显著的性能优势。

目录

  1. Python 实现现代游戏窗口无闪烁、高性能 DX11/DX12 截图方案
  2. 解决方案:基于 DXGI 的 Python 封装类
  3. 核心代码实现
  4. 调用实例
  5. 获取目标窗口句柄(例如:查找原神窗口)
  6. 初始化截图器
  7. 单次截图
  8. 返回 RGB 格式的 numpy.ndarray (H, W, 3)
  9. 可直接用于 OpenCV 显示或模型推理
  10. 技术原理简述
  11. 常见问题
  12. 结语
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Flux AI 绘画控制台:Docker 镜像一键部署与实战指南
  • Redis 压缩列表、Listpack 及哈希表扩容原理
  • 内网渗透基础
  • FastAPI:Python 高性能 Web 框架深度解析
  • OpenClaw 全平台部署指南:本地化 AI 智能体安装与配置
  • 基于空间注意力机制的神经网络(SANN)设计与实现
  • WebGIS 开发:WKT 转 GeoJSON 的多种实现方案与 Leaflet 集成
  • Java 动态规划实战:从递归优化到经典模型解析
  • 鸿蒙金融理财全栈项目:运维监控、性能优化与安全加固
  • RTX 4090 部署国产 AIGC 视频模型:腾讯混元与阿里通义万相实战
  • 基于 DeepSeek 和 Cursor 构建智能代码审查工具实战
  • 算法修炼:模幂、构造、背包、贪心、剪枝、堆维护六题精析
  • OpenClaw 自动化与定时任务实战指南
  • 前端代码生成横向测评:GLM 4.7 与 MiniMax 挑战 Claude Opus
  • 玩转Llama Factory:打造你的第一个角色扮演AI
  • Spring Boot 集成 JUnit 5 报错 NoSuchMethodError 排查与修复
  • VS Code 刷新 Python 包报错:Failed to run python -m pip list 修复方案
  • 基于 C++ 的本地文件共享工具 DirectoryServer 使用指南
  • 拆解 Garry Tan 的 gstack 架构逻辑:AI 工程化协作模式
  • 深入理解 OverlayFS:分层机制下的 Linux 文件系统重组

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online