Python Selenium 自动化测试实战：从入门到企业级应用 | 极客日志

PythonAI大前端

Python Selenium 自动化测试实战：从入门到企业级应用

Python Selenium 自动化测试涵盖环境搭建、元素定位、等待策略及企业级部署方案。通过 WebDriver 管理工具简化配置，结合 Page Object 模式提升可维护性。内容涉及分布式集群、云测试集成及验证码处理等高级场景，并包含性能优化与移动端扩展实践，为构建稳定高效的 Web 自动化框架提供完整路径。

并发大师发布于 2026/1/5更新于 2026/7/3033 浏览

Python Selenium 自动化测试实战指南

浏览器自动化是提升 Web 测试效率的关键手段。它不仅能批量操作网页节省大量人工时间，还能确保功能验证的精准度，甚至在数据采集和跨浏览器兼容性测试中发挥重要作用。

环境搭建与基础配置

全平台安装指南

在开始之前，我们需要准备好基础组件。推荐使用 pip 安装核心库及驱动管理工具，这样可以避免手动下载驱动的繁琐步骤。

# 安装 Python 库
pip install selenium
# 浏览器驱动管理工具
pip install webdriver-manager

利用 webdriver-manager 可以自动下载并配置 Chrome 驱动，极大简化了初始化流程：

from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager

service = webdriver.ChromeService(ChromeDriverManager().install())
driver = webdriver.Chrome(service=service)

不同浏览器的驱动获取方式略有差异，以下是常见配置矩阵：

浏览器	驱动获取方式	典型应用场景
Chrome	官方 Chromedriver	主流测试环境
Firefox	Geckodriver	兼容性验证
Edge	MSEdgeDriver	Windows 生态测试
Safari	系统内置	Mac 设备专属

核心操作全解析

元素定位的八种武器

定位元素是自动化的基石。除了基础的 ID 和 CSS 选择器外，XPath 提供了更强大的层级处理能力。

基础定位器示例：

# ID 定位
driver.find_element(By.ID, "username")
# CSS 选择器
driver.find_element(By.CSS_SELECTOR, ".login-form input[type='password']")

XPath 高级技巧：

# 文本内容定位
//button[contains(text(),'提交')]
# 层级关系定位
//div[@id='header']/ul/li[position()>2]

页面交互完全手册

表单操作看似简单，但在实际项目中要注意清空旧数据后再输入。文件上传则需根据控件类型选择方案，传统 input 标签可直接发送路径，复杂控件可能需要 AutoIT 或 PyWin32 支持。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

# 表单操作四部曲
element = driver.find_element(By.NAME, "email")
element.clear()  # 清空原有内容
element.send_keys("[email protected]")  # 输入文本
element.submit()  # 提交表单

# 文件上传解决方案
file_input = driver.find_element(By.XPATH, "//input[@type='file']")
file_input.send_keys("/path/to/file.pdf")

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10)
element = wait.until(
    EC.element_to_be_clickable((By.ID, "dynamicButton"))
)

class element_has_css_class(object):
    def __init__(self, locator, css_class):
        self.locator = locator
        self.css_class = css_class

    def __call__(self, driver):
        element = driver.find_element(*self.locator)
        if self.css_class in element.get_attribute("class"):
            return element
        return False

# 使用自定义等待
wait.until(element_has_css_class((By.ID, "status"), "active"))

class LoginPage:
    def __init__(self, driver):
        self.driver = driver
        self.username_field = (By.ID, "username")
        self.password_field = (By.ID, "password")
        self.submit_btn = (By.XPATH, "//button[@type='submit']")

    def login(self, username, password):
        self.driver.find_element(*self.username_field).send_keys(username)
        self.driver.find_element(*self.password_field).send_keys(password)
        self.driver.find_element(*self.submit_btn).click()

import pytest

@pytest.mark.parametrize("username,password,expected", [
    ("admin", "123456", "Dashboard"),
    ("test", "wrongpass", "Invalid Credentials")
])
def test_login(driver, username, password, expected):
    login_page = LoginPage(driver)
    login_page.login(username, password)
    assert expected in driver.title

# 启动 Hub
java -jar selenium-server.jar hub
# 注册 Node
java -jar selenium-server.jar node --hub http://hub-host:4444

from selenium.webdriver import Remote

caps = {
    "browserName": "chrome",
    "version": "latest",
    "platform": "WINDOWS",
    "cloud:options": {
        "screenResolution": "1920x1080"
    }
}
driver = Remote(
    command_executor="CLOUD_PROVIDER_URL",
    desired_capabilities=caps
)

# 人工介入模式
input("请在浏览器完成验证码后按回车继续...")

# 第三方服务集成
from anticaptchaofficial.recaptchav2proxyless import *
solver = recaptchaV2Proxyless()
solver.set_verbose(1)
solver.set_key("API_KEY")
result = solver.solve_and_return_solution("SITE_KEY", "PAGE_URL")

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("--headless")  # 无头模式
chrome_options.add_argument("--disable-gpu")  # 禁用 GPU 加速
chrome_options.add_argument("--no-sandbox")  # 容器环境必备

from selenium.webdriver.common.proxy import Proxy
dev_tools = driver.get_devtools()
dev_tools.send("Network.enable")
dev_tools.send("Network.setRequestInterception", {"patterns": [{"urlPattern": "*"}]})

def intercept_request(request):
    if "ad.jpg" in request.url:
        dev_tools.send("Network.continueInterceptedRequest", {
            "interceptionId": request.interception_id,
            "errorReason": "BlockedByClient"
        })

dev_tools.add_listener("Network.requestIntercepted", intercept_request)

# 移动端自动化测试
from appium import webdriver
desired_caps = {
    "platformName": "Android",
    "deviceName": "emulator-5554",
    "appPackage": "com.example.app",
    "appActivity": ".MainActivity"
}
driver = webdriver.Remote("http://localhost:4723/wd/hub", desired_caps)

# 人工智能增强（概念示例）
# from selenium_ai import SmartDriver
# smart_driver = SmartDriver(driver)
# element = smart_driver.find_element_by_image("submit_button.png")

Python Selenium 自动化测试实战：从入门到企业级应用

Python Selenium 自动化测试实战指南

环境搭建与基础配置

全平台安装指南

核心操作全解析

元素定位的八种武器

页面交互完全手册

更多推荐文章

相关免费在线工具

高级应用场景实战

等待策略深度优化

框架设计模式

企业级解决方案

分布式测试集群搭建

安全防护策略

性能优化与调试技巧

浏览器性能调优

网络请求监控

扩展生态与未来趋势

最佳实践与避坑指南

总结

更多推荐文章

相关免费在线工具

Python Selenium 自动化测试实战：从入门到企业级应用

Python Selenium 自动化测试实战指南

环境搭建与基础配置

全平台安装指南

核心操作全解析

元素定位的八种武器

页面交互完全手册

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

高级应用场景实战

等待策略深度优化

框架设计模式

企业级解决方案

分布式测试集群搭建

安全防护策略

性能优化与调试技巧

浏览器性能调优

网络请求监控

扩展生态与未来趋势

最佳实践与避坑指南

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具