Python Selenium 与 Chrome WebDriver 深度配置实战 | 极客日志

Python大前端

Python Selenium 与 Chrome WebDriver 深度配置实战

Python Selenium 自动化测试涉及 Chrome WebDriver 配置、版本匹配及环境搭建。核心步骤包括下载对应版本驱动、设置系统环境变量或代码动态加载路径。通过 ChromeOptions 可控制启动参数如窗口大小、无头模式等。元素定位支持 ID、XPath、CSS 等多种策略，交互操作涵盖点击输入。页面跳转需配合显式等待机制处理异步加载，确保脚本稳定性。异常处理与日志记录提升健壮性，适用于 Web UI 自动化测试场景。

虚拟内存发布于 2025/11/3更新于 2026/6/1329 浏览

1. Selenium 自动化测试框架概述

Selenium 是一个开源的 Web 自动化测试框架，广泛应用于浏览器行为模拟、功能验证与 UI 自动化测试中。其支持多种编程语言（如 Python、Java、C#）和主流浏览器（如 Chrome、Firefox、Edge），具有高度的灵活性和跨平台能力。

Selenium 的核心组件包括 Selenium WebDriver、Selenium IDE 和 Selenium Grid，分别用于脚本开发、录制回放和分布式测试。通过 WebDriver 协议，Selenium 可与浏览器建立通信，实现页面加载、元素查找、用户行为模拟等操作。这使其成为现代 Web 应用测试不可或缺的工具。

2. Chrome WebDriver 与浏览器版本匹配原理

在使用 Selenium 进行 Web 自动化测试时，Chrome WebDriver（即 ChromeDriver）是与 Chrome 浏览器进行交互的核心组件。然而，在实际开发中，很多开发者和测试人员常常遇到'ChromeDriver 与浏览器版本不兼容'的问题。这不仅影响自动化脚本的执行效率，甚至会导致脚本直接崩溃。因此，理解 ChromeDriver 与 Chrome 浏览器之间的版本匹配原理，对于构建稳定、高效的自动化测试环境至关重要。

本章将从 WebDriver 的通信机制入手，深入解析 ChromeDriver 与 Chrome 浏览器之间的交互逻辑，进一步探讨版本兼容性问题及其解决方案，并介绍 Chrome 浏览器对自动化测试的支持机制。

2.1 WebDriver 的作用与工作原理

Selenium WebDriver 是 Selenium 自动化框架的核心模块之一，它负责与浏览器建立通信，模拟用户的操作行为。WebDriver 本质上是一个协议客户端，它通过与浏览器建立连接并发送命令，实现对浏览器的控制。

2.1.1 WebDriver 的通信机制

WebDriver 与浏览器之间的通信遵循 WebDriver 协议 ，该协议定义了标准的 RESTful API 接口，用于执行诸如打开页面、点击按钮、输入文本等操作。

WebDriver 协议结构

WebDriver 协议基于 HTTP/JSON 格式进行通信，客户端（Selenium 脚本）向 WebDriver 服务端发送 HTTP 请求，服务端再将命令转发给浏览器内核执行。

以下是一个典型的 WebDriver 请求结构示例：

POST /session Content-Type: application/json { "capabilities": { "browserName": "chrome", "version": "", "platform": "ANY" } }

通信流程图

graph TD A[Selenium 脚本] -->|HTTP 请求 | B(WebDriver 服务端)
B -->|DevTools 协议 | C[Chrome 浏览器]
C -->|执行结果 | B
B -->|响应结果 | A

逻辑分析

Selenium 脚本 ：开发者编写的 Python、Java 等代码，调用 Selenium API。
WebDriver 服务端（如 chromedriver） ：接收来自脚本的 HTTP 请求，将命令转换为浏览器可理解的协议。
Chrome 浏览器 ：通过 Chrome DevTools 协议 接收指令并执行操作。
响应结果 ：浏览器执行完成后将结果返回给 WebDriver 服务端，最终返回给脚本。

2.1.2 WebDriver 与浏览器之间的交互

WebDriver 通过浏览器内置的 远程调试接口（Remote Debugging Interface） 与浏览器建立连接。对于 Chrome 来说，这个接口是基于实现的。

from selenium import webdriver

# 初始化 Chrome WebDriver
driver = webdriver.Chrome()

# 打开百度
driver.get("https://www.baidu.com")

# 获取当前页面标题
print(driver.title)

# 关闭浏览器
driver.quit()

ChromeDriver 版本	支持的 Chrome 浏览器版本范围
114.0.5735.90	114.0.5735.x
113.0.5672.63	113.0.5672.x
112.0.5615.49	112.0.5615.x

更新 ChromeDriver 到与浏览器匹配的版本
- 使用 chromedriver --version 查看当前版本。
- 前往 ChromeDriver 官网下载对应版本。

使用版本自动匹配工具

安装 webdriver-manager 库，自动下载匹配的 ChromeDriver：

pip install webdriver-manager

Python 示例代码：

from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get("https://www.google.com")
driver.quit()

使用 Docker 镜像统一环境
- 使用官方 Selenium Docker 镜像，如 selenium/standalone-chrome ，内置匹配的 ChromeDriver 与 Chrome 浏览器。

graph TD A[Selenium 脚本] -->|HTTP 请求 | B(ChromeDriver)
B -->|WebSocket| C(Chrome DevTools)
C -->|DOM 操作 | D(浏览器页面)

from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--enable-automation')
options.add_argument('--disable-infobars')
driver = webdriver.Chrome(options=options)

# 获取性能指标
performance_log = driver.get_log('performance')
for entry in performance_log:
    print(entry)

driver.quit()

参数	作用
`--headless`	无头模式运行，不显示浏览器界面
`--disable-gpu`	禁用 GPU 加速
`--no-sandbox`	禁用沙箱模式（用于 Docker 环境）
`--disable-dev-shm-usage`	避免共享内存问题
`--window-size=1920,1080`	设置浏览器窗口大小
`--user-agent=MyUserAgent`	设置自定义 User-Agent

from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--headless') # 启用无头模式
options.add_argument('--window-size=1920,1080') # 设置窗口大小
driver = webdriver.Chrome(options=options)
driver.get("https://www.google.com")
print(driver.title)
driver.quit()

Get-FileHash -Algorithm SHA256 chromedriver.exe

shasum -a 256 chromedriver

$ shasum -a 256 chromedriver
2e90e3d000000000000000000000000000000000000000000000000000000000 chromedriver

chromedriver --version

unzip chromedriver_linux64.zip

sudo mv chromedriver /usr/local/bin/

sudo chmod +x /usr/local/bin/chromedriver

chromedriver --version

from selenium import webdriver
driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get('https://www.google.com')

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
service = Service(executable_path='/path/to/chromedriver')
driver = webdriver.Chrome(service=service)
driver.get('https://www.baidu.com')

import os
import platform
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

def get_chromedriver_path():
    current_os = platform.system()
    base_path = os.path.dirname(os.path.abspath(__file__))
    if current_os == 'Windows':
        return os.path.join(base_path, 'drivers', 'windows', 'chromedriver.exe')
    elif current_os == 'Darwin':
        return os.path.join(base_path, 'drivers', 'macos', 'chromedriver')
    elif current_os == 'Linux':
        return os.path.join(base_path, 'drivers', 'linux', 'chromedriver')
    else:
        raise Exception("Unsupported OS")

driver_path = get_chromedriver_path()
service = Service(executable_path=driver_path)
driver = webdriver.Chrome(service=service)
driver.get('https://www.example.com')

project_root/
├── drivers/
│   ├── windows/
│   │   └── chromedriver.exe
│   ├── macos/
│   │   └── chromedriver
│   └── linux/
│       └── chromedriver
└── main.py

pip install selenium

python -m venv venv
source venv/bin/activate # Linux/macOS
venv\Scripts\activate # Windows
pip install selenium

pip install selenium -i https://mirrors.aliyun.com/pypi/simple/

Selenium 版本	支持的浏览器驱动版本	备注
4.x.x	ChromeDriver 100+	支持 WebDriver 新标准协议
3.141.0	ChromeDriver 80~90	最后一个稳定版 3.x
2.x.x	已过时，不建议使用	旧版本兼容性差

pip install selenium==3.141.0

from selenium import webdriver

from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options

# 设置浏览器选项（可选）
chrome_options = Options()
chrome_options.add_argument("--headless") # 启用无头模式
chrome_options.add_argument("--disable-gpu") # 指定 ChromeDriver 路径（若未配置环境变量）
service = Service(executable_path='/path/to/chromedriver')
# 初始化浏览器对象
driver = webdriver.Chrome(service=service, options=chrome_options)
# 打开网页
driver.get("https://www.example.com")

异常类型	描述
`SessionNotCreatedException`	浏览器或驱动版本不兼容
`WebDriverException`	通用 WebDriver 错误，如路径错误
`TimeoutException`	初始化超时
`NoSuchDriverException`	指定的驱动不存在或未安装

from selenium import webdriver
from selenium.common.exceptions import SessionNotCreatedException, WebDriverException

try:
    # 初始化浏览器对象
    driver = webdriver.Chrome()
    driver.get("https://www.example.com")
except SessionNotCreatedException as e:
    print("会话创建失败：请检查浏览器和驱动版本是否兼容。")
    print(f"错误信息：{e}")
except WebDriverException as e:
    print("发生 WebDriver 错误，请检查驱动路径或浏览器状态。")
    print(f"错误信息：{e}")
finally:
    # 无论是否出错，都尝试关闭浏览器
    if 'driver' in locals():
        driver.quit()

from selenium import webdriver

# 实例化一个 Chrome WebDriver 对象
driver = webdriver.Chrome()

# 打开百度首页
driver.get("https://www.baidu.com")

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')

from selenium.webdriver.chrome.service import Service
service = Service(executable_path='/path/to/chromedriver')
driver = webdriver.Chrome(service=service)

方法名	功能描述
`driver.get(url)`	加载指定网址
`driver.back()`	浏览器返回上一页
`driver.forward()`	浏览器前进
`driver.refresh()`	刷新当前页面
`driver.title`	获取当前页面标题
`driver.current_url`	获取当前页面 URL
`driver.page_source`	获取当前页面 HTML 源码

# 设置窗口大小为 1200x800
driver.set_window_size(1200, 800)

# 最大化窗口
driver.maximize_window()
# 全屏显示（部分浏览器可能支持）
driver.fullscreen_window()

# 获取窗口位置
position = driver.get_window_position()
print(f"窗口位置：{position}")
# 获取窗口大小
size = driver.get_window_size()
print(f"窗口尺寸：{size}")

# 设置窗口位置为 (0, 0)
driver.set_window_position(0, 0)

driver.execute_script("window.open('https://www.sina.com.cn', '_blank');")

handles = driver.window_handles
print(f"所有窗口句柄：{handles}")

# 切换到最新打开的窗口
driver.switch_to.window(handles[-1])
# 切换回主窗口
driver.switch_to.window(handles[0])

# 关闭当前窗口
driver.close()
# 切换回主窗口后继续操作
driver.switch_to.window(handles[0])

from selenium.webdriver.chrome.options import Options
chrome_options = Options()
# 启用无头模式（后台运行）
chrome_options.add_argument("--headless=new")
# 禁用 GPU 加速（在无头模式下推荐使用）
chrome_options.add_argument("--disable-gpu")
# 设置浏览器窗口大小（在无头模式下可能需要）
chrome_options.add_argument("--window-size=1920,1080")
# 禁用图片加载
chrome_options.add_argument("--blink-settings=imagesEnabled=false")
# 启动浏览器时应用配置
driver = webdriver.Chrome(options=chrome_options)

chrome_options.add_argument('--proxy-server=http://127.0.0.1:8080')

chrome_options.add_argument(r"--user-data-dir=/path/to/user/data")

driver.execute_cdp_cmd("Network.setUserAgentOverride", {
    "userAgent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
})

graph TD
A[启动 Chrome 浏览器] --> B[访问百度首页]
B --> C[执行 JavaScript 打开新标签页]
C --> D[获取所有窗口句柄]
D --> E{是否打开新窗口？}
E -->|是 | F[切换到新窗口]
E -->|否 | G[继续当前操作]
F --> H[关闭新窗口]
H --> I[切换回主窗口]

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
import time

# 设置启动参数
options = Options()
options.add_argument("--headless=new")
options.add_argument("--window-size=1920,1080")
options.add_argument("--disable-gpu")

# 初始化浏览器
service = Service(executable_path='/path/to/chromedriver')
driver = webdriver.Chrome(service=service, options=options)

# 访问百度
driver.get("https://www.baidu.com")
print("当前标题:", driver.title)
print("当前 URL:", driver.current_url)

# 设置窗口最大化
driver.maximize_window()

# 打开新标签页
driver.execute_script("window.open('https://www.sina.com.cn', '_blank');")

# 等待加载
time.sleep(2)

# 切换到新标签页
handles = driver.window_handles
driver.switch_to.window(handles[-1])

# 获取新页面标题
print("新页面标题:", driver.title)

# 关闭新标签页
driver.close()

# 切换回主窗口
driver.switch_to.window(handles[0])

# 关闭浏览器
driver.quit()

<html>
<body>
<div>
<input type="text" name="username" placeholder="用户名">
<input type="password" name="password" placeholder="密码">
<button>登录</button>
</div>
</body>
</html>

graph TD
A[html] --> B(body)
B --> C(div#login-form)
C --> D(input#username)
C --> E(input#password)
C --> F(button#submit)

from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
driver.get("https://example.com/login")

# 定位用户名输入框
username_input = driver.find_element(By.ID, "username")
username_input.send_keys("testuser")

password_input = driver.find_element(By.NAME, "password")
password_input.send_keys("123456")

form_div = driver.find_element(By.CLASS_NAME, "login-form")

button = driver.find_element(By.TAG_NAME, "button")
button.click()

register_link = driver.find_element(By.LINK_TEXT, "注册")
register_link.click()

submit_button = driver.find_element(By.XPATH, '//button[@id="submit"]')
submit_button.click()

submit_button = driver.find_element(By.CSS_SELECTOR, '#submit')
submit_button.click()

选择器类型	写法示例	说明
ID 选择器	`#submit`	匹配 id 为 submit 的元素
类选择器	`.login-form`	匹配 class 为 login-form 的元素
属性选择器	`input[type="text"]`	匹配 type 为 text 的 input 元素
子元素选择器	`div > input`	匹配 div 下的直接 input 子元素
后代元素选择器	`div input`	匹配 div 下任意层级的 input 元素

username_input.send_keys("testuser")

submit_button.click()

username_input.clear()

value = username_input.get_attribute("value")
print("输入框的值为：", value)

text = submit_button.text
print("按钮上的文字为：", text)

定位方式	性能优劣	适用场景
ID	最快	元素具有唯一 ID
CSS 选择器	快	支持复杂选择，前端开发常用
XPath	一般	结构复杂或无法用 CSS 选择器时使用
NAME	一般	表单元素常用
CLASS_NAME	一般	需配合其他定位方式使用
TAG_NAME	慢	不建议单独使用

inputs = driver.find_elements(By.TAG_NAME, "input")
for input in inputs:
    print(input.get_attribute("name"))

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

driver = webdriver.Chrome()
driver.get("https://example.com/login")

# 定位用户名输入框并输入
username = driver.find_element(By.ID, "username")
username.send_keys("admin")

# 定位密码输入框并输入
password = driver.find_element(By.ID, "password")
password.send_keys("123456")

# 定位提交按钮并点击
submit = driver.find_element(By.ID, "submit")
submit.click()

# 等待跳转
time.sleep(3)

# 验证是否跳转成功
current_url = driver.current_url
if "dashboard" in current_url:
    print("登录成功，跳转至仪表盘页面。")
else:
    print("登录失败，请检查账号密码。")

driver.quit()

from selenium import webdriver
import time

driver = webdriver.Chrome()
driver.get("https://www.example.com")

# 点击一个跳转链接（假设页面中有 id 为 'next_page' 的 a 标签）
driver.find_element("id", "next_page").click()

# 强制等待页面跳转完成（不推荐）
time.sleep(3)

# 获取当前页面 URL
print("当前页面 URL:", driver.current_url)

driver.quit()

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 假设当前页面为 example.com
current_url = driver.current_url

# 点击跳转按钮
driver.find_element(By.ID, "next_page").click()

# 等待页面 URL 改变
WebDriverWait(driver, 10).until(
    lambda d: d.current_url != current_url
)
print("页面已跳转，当前 URL 为：", driver.current_url)

driver.implicitly_wait(10) # 最多等待 10 秒
element = driver.find_element(By.ID, "some_element")

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 等待某个元素可见
element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.ID, "loading_spinner"))
)

# 等待某个元素可点击
element = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.ID, "submit_button"))
)

def wait_for_ajax(driver, timeout=10):
    WebDriverWait(driver, timeout).until(
        lambda d: d.execute_script("return jQuery.active == 0")
    )

# 调用 wait_for_ajax(driver)

from selenium import webdriver
options = webdriver.ChromeOptions()
options.page_load_strategy = 'normal' # 可选值：normal / eager / none
driver = webdriver.Chrome(options=options)
driver.get("https://www.example.com")

graph TD
A[开始操作] --> B{是否需要等待？}
B -- 否 --> C[直接执行下一步]
B -- 是 --> D[选择等待类型]
D --> E[隐式等待]
D --> F[显式等待]
D --> G[自定义等待]
E --> H[全局等待元素出现]
F --> I[等待特定条件达成]
G --> J[执行自定义 JS 判断]
H --> K[继续操作]
I --> K
J --> K

Python Selenium 与 Chrome WebDriver 深度配置实战

1. Selenium 自动化测试框架概述

2. Chrome WebDriver 与浏览器版本匹配原理

2.1 WebDriver 的作用与工作原理

2.1.1 WebDriver 的通信机制

WebDriver 协议结构

通信流程图

逻辑分析

2.1.2 WebDriver 与浏览器之间的交互

示例：启动 Chrome 并访问百度

代码逻辑分析

参数说明

2.2 ChromeDriver 与 Chrome 浏览器的版本兼容性

2.2.1 版本对应关系表的查阅方法

示例：ChromeDriver 114.0.5735.90 支持的浏览器版本

查阅方法

2.2.2 不匹配导致的典型问题及解决方案

问题原因分析

解决方案

2.3 Chrome 浏览器自动化支持机制

2.3.1 DevTools 协议的作用

CDP 协议通信流程图

示例：通过 CDP 获取页面性能指标

代码逻辑分析

2.3.2 启动参数对自动化控制的影响

常用启动参数列表

示例：设置无头模式启动 Chrome

参数说明

3. ChromeDriver 下载与环境配置流程

3.1 ChromeDriver 的下载与版本选择

3.1.1 官方下载渠道与第三方镜像源

3.1.2 验证下载文件的完整性

在 Windows 系统中：

在 Linux/macOS 系统中：

示例输出：

3.2 系统环境变量配置方法

3.2.1 Windows 系统下的环境变量设置

3.2.2 Linux 与 macOS 下的配置方式

3.3 浏览器驱动路径的动态加载与程序调用

3.3.1 通过代码指定驱动路径的实现

参数说明：

代码逻辑分析：

3.3.2 多平台兼容性处理策略

代码逻辑分析：

环境结构示例：

小结与后续章节关联

4. Python 中 Selenium 库的安装与初始化

4.1 Selenium 库的安装方式

4.1.1 pip 安装与虚拟环境配置

安装过程中的注意事项：

4.1.2 版本选择与兼容性注意事项

如何指定安装特定版本：

常见版本问题：

4.2 Selenium 的基本初始化流程

4.2.1 导入模块与 WebDriver 的引入

模块说明：

4.2.2 初始化浏览器对象的代码结构

代码逻辑分析：

常见问题：

4.3 异常处理机制的引入

4.3.1 初始化失败的常见错误类型

4.3.2 try-except 结构的使用实践

代码逻辑分析：

异常处理的扩展建议：

总结与展望

5. 使用 WebDriver 启动和控制 Chrome 浏览器

5.1 启动 Chrome 浏览器的基础操作

5.1.1 使用默认配置启动 Chrome

5.1.2 显式指定 ChromeDriver 路径

5.1.3 基础浏览器控制功能

5.1.4 浏览器退出方式

5.2 浏览器窗口控制

5.2.1 设置浏览器窗口大小

5.2.2 窗口最大化与全屏

5.2.3 获取窗口位置与大小

5.2.4 窗口拖动与定位

5.3 多标签页与窗口切换

5.3.1 打开新标签页

5.3.2 获取所有窗口句柄

5.3.3 切换窗口