Python大前端

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

Playwright 基础教程涵盖元素拖拽操作、元素坐标获取、网页源码抓取及元素文本提取等核心功能。通过演示 drag_and_drop 方法实现跨元素交互，利用 bounding_box 计算元素位置中心点。对比 selenium 说明 page.content() 获取源码方式，并详细解析 locator 提供的多种文本提取方法如 inner_text、text_content 的区别与应用场景，适用于自动化测试与爬虫开发场景。

人间失格发布于 2025/2/7更新于 2026/6/1123 浏览

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

前言

Playwright 是微软开源的自动化测试工具，支持多种浏览器和语言。在 Web 自动化测试及爬虫开发中，我们经常需要处理复杂的用户交互，如拖拽操作，或者需要获取元素的精确位置信息以及页面内的文本数据。本文将详细介绍如何使用 Playwright 实现元素拖拽、计算元素坐标、获取网页源码以及提取元素内文本，并提供完整的代码示例。

环境准备与连接方式

在使用 Playwright 之前，确保已安装 Python 环境并安装了 playwright 库。可以通过以下命令安装依赖：

pip install playwright
playwright install

Playwright 提供了两种主要的浏览器连接模式：连接到已打开的浏览器或启动新的浏览器实例。

1. 连接已打开的浏览器

这种方式适用于调试场景，可以查看浏览器实际运行状态。通过 CDP (Chrome DevTools Protocol) 端口连接。

from playwright.sync_api import sync_playwright

class BrowserConnection:
    def __init__(self):
        self.playwright = sync_playwright().start()
        # 连接本地已启动的 Chrome 浏览器，默认端口为 9223
        browser = self.playwright.chromium.connect_over_cdp("http://127.0.0.1:9223")
        self.default_context = browser.contexts[0]
        self.page = self.default_context.pages[0]

2. 启动新浏览器实例

这是最常用的方式，适合自动化脚本执行。可以配置无头模式（headless）或可视化模式。

class NewBrowserSession:
    def __init__(self, url):
        playwright = sync_playwright().start()
        # headless=False 表示显示浏览器窗口，便于观察
        browser = playwright.chromium.launch(headless=False)
        context = browser.new_context()
        self.page = context.new_page()
        self.page.goto(url)

元素拖拽操作 (Drag and Drop)

拖拽是常见的用户交互行为，例如文件上传、排序列表等。Playwright 提供了方法简化此过程。

drag_and_drop

# 简单拖拽：从源选择器拖到目标选择器
page.drag_and_drop("#source", "#target")

# 精确控制位置：指定相对于元素左上角的偏移量
page.drag_and_drop(
    "#source",
    "#target",
    source_position={"x": 34, "y": 7},
    target_position={"x": 10, "y": 20}
)

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Drag and Drop Test</title>
    <style>
        #dragElement {
            width: 100px;
            height: 100px;
            background-color: red;
            position: absolute;
            top: 0;
            left: 0;
            cursor: move;
        }
        #dropElement {
            width: 200px;
            height: 200px;
            background-color: green;
            margin: auto;
        }
    </style>
</head>
<body>
    <div id="bigdiv">
        <div id="dragElement"></div>
        <div id="dropElement"></div>
    </div>
    <script>
        const dragElement = document.getElementById('dragElement');
        let isDragging = false;
        let startOffset = {x: 0, y: 0};

        function startDrag(e) {
            isDragging = true;
            startOffset.x = e.clientX - dragElement.offsetLeft;
            startOffset.y = e.clientY - dragElement.offsetTop;
        }

        function endDrag() {
            isDragging = false;
        }

        function drag(e) {
            if (!isDragging) return;
            dragElement.style.left = e.clientX - startOffset.x + 'px';
            dragElement.style.top = e.clientY - startOffset.y + 'px';
        }

        dragElement.addEventListener('mousedown', startDrag);
        document.addEventListener('mouseup', endDrag);
        document.addEventListener('mousemove', drag);
    </script>
</body>
</html>

from playwright.sync_api import sync_playwright
import os

class DragDropDemo:
    def __init__(self, file_path):
        self.playwright = sync_playwright().start()
        browser = self.playwright.chromium.launch(headless=False)
        context = browser.new_context()
        self.page = context.new_page()
        # 加载本地 HTML 文件
        self.page.goto(f"file://{os.path.abspath(file_path)}")

    def drag_and_drop_operate(self):
        # 将红色框拖入绿色框
        self.page.drag_and_drop(source="#dragElement", target="#dropElement")
        print("拖拽操作完成")

if __name__ == '__main__':
    # 请替换为实际的本地文件路径
    demo = DragDropDemo(r"D:/L_Learning/MyLearningCode/draganddrop.html")
    demo.drag_and_drop_operate()
    demo.playwright.stop()

def get_bounding_box(page):
    locator = page.locator("#dragElement")
    # 等待元素可见
    locator.wait_for(state="visible")
    box = locator.bounding_box()
    print(box)  # 输出示例：{'x': 0, 'y': 0, 'width': 100, 'height': 100}
    return box

def calculate_center(box):
    center_x = box["x"] + box["width"] / 2
    center_y = box["y"] + box["height"] / 2
    return center_x, center_y

# 使用示例
center = calculate_center(get_bounding_box(page))
page.click(f"#{center[0]} #{center[1]}") # 注意：click 通常接受选择器，这里仅为坐标计算演示

# 获取当前页面的完整 HTML 源码
page_source = page.content()

# 打印前 500 个字符以检查内容
print(page_source[:500])

def extract_element_text(page):
    locator = page.locator("#bigdiv")
    
    # 获取所有内部文本
    texts1 = locator.all_inner_texts()
    print(f"all_inner_texts type: {type(texts1)}, value: {texts1}")
    
    # 获取所有文本内容
    texts2 = locator.all_text_contents()
    print(f"all_text_contents type: {type(texts2)}, value: {texts2}")
    
    # 获取单个内部文本
    text3 = locator.inner_text()
    print(f"inner_text type: {type(text3)}, value: {text3}")
    
    # 获取单个文本内容
    text4 = locator.text_content()
    print(f"text_content type: {type(text4)}, value: {text4}")
    
    # 获取内部 HTML
    html5 = locator.inner_html()
    print(f"inner_html type: {type(html5)}, value: {html5[:100]}...")

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

前言

环境准备与连接方式

1. 连接已打开的浏览器

2. 启动新浏览器实例

元素拖拽操作 (Drag and Drop)

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

前言

环境准备与连接方式

1. 连接已打开的浏览器

2. 启动新浏览器实例

元素拖拽操作 (Drag and Drop)

更多推荐文章

相关免费在线工具

官方文档说明

基本用法

测试案例

拖拽代码实现

元素坐标获取 (Bounding Box)

bounding_box 方法

计算中心点

获取网页源码

对比 Selenium

代码示例

获取元素内文本

常用方法列表

详细区别解析

测试代码

最佳实践建议

常见问题与解决方案

问题 1：拖拽失败

问题 2：文本提取为空

问题 3：坐标不准

总结

更多推荐文章

相关免费在线工具

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

前言

环境准备与连接方式

1. 连接已打开的浏览器

2. 启动新浏览器实例

元素拖拽操作 (Drag and Drop)

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

Playwright 基础教程：元素拖拽、坐标获取与文本提取实战

前言

环境准备与连接方式

1. 连接已打开的浏览器

2. 启动新浏览器实例

元素拖拽操作 (Drag and Drop)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

官方文档说明

基本用法

测试案例

拖拽代码实现

元素坐标获取 (Bounding Box)

bounding_box 方法

计算中心点

获取网页源码

对比 Selenium

代码示例

获取元素内文本

常用方法列表

详细区别解析

测试代码

最佳实践建议

常见问题与解决方案

问题 1：拖拽失败

问题 2：文本提取为空

问题 3：坐标不准

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具