Python Selenium 模拟登录实战与自动化技巧 | 极客日志

Python大前端算法

Python Selenium 模拟登录实战与自动化技巧

Python 中使用 Selenium 进行 Web 自动化测试与数据采集的实战技巧。内容涵盖环境搭建、浏览器驱动配置、元素定位策略（ID、XPath、CSS 选择器等）、显式与隐式等待机制的应用。重点讲解了模拟登录流程，包括 Cookie、Session 及 Token 认证机制的分析，以及如何通过伪造请求头、IP 轮换和无头模式应对基础反爬检测。此外，还提供了验证码处理、二次验证（2FA）解决方案以及登录后的页面元素自动点击实现方法，旨在帮助开发者构建稳定、高效的自动化脚本。

晚风告白发布于 2026/3/26更新于 2026/7/836 浏览

Python Selenium 模拟登录实战与自动化技巧

在现代 Web 自动化测试与数据采集场景中，Selenium 因其强大的浏览器操控能力成为 Python 开发者的首选工具。通过模拟真实用户操作，Selenium 能够处理 JavaScript 渲染页面、表单提交以及复杂的交互逻辑，尤其适用于需要登录认证的网站。

环境准备与依赖安装

使用 Selenium 前需安装对应库并配置浏览器驱动：

安装 Selenium 库：pip install selenium
下载 ChromeDriver 并确保其位于系统 PATH 中

模拟登录代码实现

以下是一个模拟登录 GitHub 的完整示例：

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

# 初始化浏览器实例
driver = webdriver.Chrome()

# 打开目标网站
driver.get("https://github.com/login")

# 定位用户名和密码输入框并填写信息
driver.find_element(By.ID, "login_field").send_keys("your_username")
driver.find_element(By.ID, "password").send_keys("your_password")

# 点击登录按钮
driver.find_element(By.NAME, "commit").click()

# 等待页面跳转完成
time.sleep(3)

# 验证是否登录成功（检查页面标题）
if "Dashboard" in driver.title:
    print("登录成功！")
else:
    print("登录失败，请检查账号信息或验证码")

# 关闭浏览器
driver.quit()

关键注意事项

项目	说明
元素定位方式	优先使用 ID 或 Name，避免依赖 XPath 导致稳定性下降
等待机制	建议使用 WebDriverWait 配合 expected_conditions 提升健壮性
账号安全	切勿将明文密码提交至版本控制系统

graph 
 --> 
 --> C
C --> D
D --> E
E --> F{登录成功？}
F -->|是 | 
F -->|否 | H

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

from selenium import webdriver

# 初始化 ChromeDriver 实例
driver = webdriver.Chrome()

# 访问指定 URL
driver.get("https://example.com")

# 查找 ID 为 login-btn 的元素后触发点击
element = driver.find_element(By.id("login-btn"))
element.click()

浏览器	驱动程序	通信协议
Google Chrome	chromedriver	W3C WebDriver
Mozilla Firefox	geckodriver	W3C WebDriver

from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument("--headless") # 无头模式
driver = webdriver.Chrome(executable_path="/path/to/chromedriver", options=options)

element = driver.find_element(By.xpath("//div[@class='login']/input"))

driver.find_element(By.css_selector("form#login input[type='password']"))

策略	速度	稳定性
id	快	高
xpath	慢	中

维度	隐式等待	显式等待
作用范围	全局，对所有 findElement 生效	局部，仅对指定条件生效
超时机制	固定时长，无法动态判断	可组合 ExpectedConditions，支持轮询 + 自定义间隔

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10, poll_frequency=0.5)
element = wait.until(EC.element_to_be_clickable((By.ID, "submit-btn")))
# 参数说明：driver（驱动实例）、10（最大等待秒数）、0.5（轮询间隔秒）

from selenium.webdriver.common.action_chains import ActionChains

actions = ActionChains(driver)
actions.move_to_element(element).perform()

Set-Cookie: sessionId=abc123; Path=/; HttpOnly; Secure

{
  "sub": "123456",
  "exp": 1735689600,
  "role": "user"
}

Authorization: Bearer <token>

机制	状态管理	可扩展性	安全性特点
Cookie + Session	服务器端	低	防 XSS（HttpOnly）、防 CSRF 需额外措施
Token (JWT)	客户端	高	易受 XSS 影响，需合理设置过期时间

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}
response = requests.get('https://example.com', headers=headers)

from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')

driver = webdriver.Chrome(options=options)

指标	有头模式	无头模式
内存占用	高	低
执行速度	慢	快
被检测概率	低	较高

<form action="/login" method="POST">
  <input type="text" name="username">
  <input type="password" name="password">
  <input type="hidden" name="csrf_token" value="abc123">
  <button type="submit">Login</button>
</form>

def perform_login(username, password, base_url):
    driver = webdriver.Chrome()
    try:
        # 导航至登录页
        driver.get(f"{base_url}/login")
        
        # 输入凭证并提交
        driver.find_element(By.ID, "username").send_keys(username)
        driver.find_element(By.ID, "password").send_keys(password)
        driver.find_element(By.NAME, "commit").click()
        
        # 验证登录成功
        if "dashboard" in driver.current_url:
            return True
    finally:
        driver.quit()
    return False

import pyotp

# 密钥通常以 URI 形式提供
totp = pyotp.TOTP("JBSWY3DPEHPK3PXP")
one_time_code = totp.now()
print(one_time_code) # 输出当前 6 位验证码

try:
    target_button = driver.find_element(By.ID, "auto-enter-btn")
    if target_button.is_displayed():
        target_button.click() # 自动触发点击
        print("自动点击已执行")
except Exception:
    pass

Python Selenium 模拟登录实战与自动化技巧

Python Selenium 模拟登录实战与自动化技巧

环境准备与依赖安装

模拟登录代码实现

关键注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Selenium 核心原理与环境搭建

Selenium 工作原理与浏览器驱动机制

通信架构与数据流

驱动匹配与兼容性

配置 ChromeDriver 实现自动化控制

下载与版本匹配

环境变量配置

常见问题排查

定位元素的八大策略及其适用场景

常用定位策略

高级定位方式

显式等待与隐式等待的实践应用

核心差异对比

显式等待典型用法

隐式等待慎用场景

模拟用户行为：点击、输入与滑动操作

常见操作类型

代码示例：鼠标悬停与滚动

登录流程分析与反爬应对策略

常见网站登录机制解析（Cookie、Session、Token）

基于 Cookie 与 Session 的传统认证

基于 Token 的无状态认证

三种机制对比

识别并绕过基础反爬虫检测机制

伪造请求头模拟浏览器行为

控制请求频率与 IP 轮换策略

使用无头模式平衡效率与隐蔽性

启动无头模式的典型配置

性能与检测规避对比

实战案例——模拟登录主流平台并自动点击

目标网站选择与登录页面结构分析

登录页面结构解析

关键元素定位策略

编写可复用的登录自动化脚本

封装通用登录函数

配置管理与数据分离

处理验证码与二次验证的应对方案

常见验证码类型及处理思路

自动化登录中的 2FA 处理

实现登录后页面元素自动点击功能

自动化点击的实现机制

适用场景与注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具