Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解 | 极客日志

Python

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

综述由AI生成DrissionPage 是基于 Selenium 和 Requests 的 Python 库，提供 SessionPage 和 WebPage 两大模块。SessionPage 基于 HTTP 请求，轻量高效，适合静态页面爬取及会话管理；WebPage 统一了动态与静态页面的操作接口，支持 JavaScript 渲染页面及丰富的交互功能。了两者的基本使用、常用方法、优缺点及搭配方案，帮助开发者高效进行网页数据抓取与自动化任务。

DevOpsTeam发布于 2026/4/6更新于 2026/5/2439 浏览

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

前言

在信息爆炸的时代，自动化网页爬取和数据获取逐渐成为必备技能。drissionPage 是一个基于 Selenium 和 Requests 的 Python 库，通过 SessionPage 和 WebPage 两大模块，简化了网页的自动化操作与数据抓取。SessionPage 使用 HTTP 请求实现轻量级、高效的静态页面爬取，而 WebPage 则结合了动态页面操作和数据提取的强大功能。本教程将详细讲解 SessionPage 和 WebPage 的使用方法及其核心功能。

一、SessionPage

drissionPage 中的 SessionPage 模块提供了一种无头的 HTTP 方式来操作网页，主要基于 requests 库实现。比起 Selenium 模块下的 DriverPage，SessionPage 更轻量、速度更快，非常适合进行页面数据的快速爬取。

（一）SessionPage 模块的基本功能

SessionPage 的核心是使用 requests.Session 对象来模拟浏览器的请求和会话，因此它可以保留会话（如 cookies、session 变量等），方便对一些需要登录状态的页面进行爬取。它能完成 HTTP 请求、获取页面内容、解析页面数据等操作。

主要功能包括：

自动维护会话状态（如 Cookie）
设置请求头（User-Agent、Referer 等）
执行 GET 和 POST 请求
提取页面内容、元素文本、属性等数据
操作模拟表单提交、文件上传、下载等

（二）基本使用

要使用 SessionPage，首先需要导入并创建一个 SessionPage 对象。以下是一个简单的使用示例：

from drission.page import SessionPage

# 创建一个 SessionPage 对象
session_page = SessionPage()

# 访问一个网页
session_page.get('https://example.com')

# 获取网页的标题
print(session_page.title)

# 获取网页的 HTML 源码
print(session_page.html)

# 获取某个元素的文本
print(session_page('.some-class').text)

（三）常用方法

SessionPage 提供了一些常用方法，帮助简化爬虫开发。

**1. get(url, kwargs) 发送 GET 请求访问网页，支持传入请求参数、headers、cookies 等。

session_page.get('https://example.com', params={'key': }, headers={: })

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

session_page.post('https://example.com/login', data={'username': 'myusername', 'password': 'mypassword'})

session_page.set_headers({'User-Agent': 'my-custom-agent'})

session_page.download('https://example.com/image.png', 'path/to/save/image.png')

# 获取元素的文本
text = session_page('h1.title').text

# 获取元素的属性
link = session_page('a.link').attr('href')

# 获取页面中所有指定元素
all_links = session_page('a').all_attrs('href')

print(session_page.cookies)

session_page.set_cookies({'name': 'value'})

cookie_value = session_page.get_cookie('name')

session_page.clear_cookies()

from drission import Drission
from drission.page import SessionPage, DriverPage

# 创建 Drission 对象
drission = Drission()

# 获取 DriverPage 和 SessionPage
driver_page = drission.driver_page
session_page = drission.session_page

# 使用 DriverPage 登录并获取 cookies
driver_page.get('https://example.com/login')
driver_page('input[name="username"]').input('myusername')
driver_page('input[name="password"]').input('mypassword')
driver_page('button[type="submit"]').click()

# 将登录后的 cookies 复制到 SessionPage
session_page.set_cookies(driver_page.get_cookies())

# 使用 SessionPage 访问其他页面
session_page.get('https://example.com/data')
print(session_page.html)

from drission import Drission
from drission.page import WebPage

# 初始化 Drission 实例
drission = Drission()

# 创建 WebPage 对象
page = WebPage(drission)

# 访问页面
page.get('https://example.com')

# 获取页面标题
print(page.title)

# 获取页面 HTML 源码
print(page.html)

page.get('https://example.com')

print(page.title)

print(page.html)

print(page.text)

# 获取元素的文本内容
text = page('h1.title').text

# 获取元素的属性
link = page('a.link').attr('href')

# 获取页面中所有指定元素
all_links = page('a').all_attrs('href')

# 点击一个按钮
page('button.submit').click()

# 在输入框中输入文本
page('input#name').input('drission')

# 提交表单
page('form#login').submit()

# 滚动到页面底部
page.scroll_to('bottom')

# 等待某个元素出现
page.wait('div.content')

# 获取某个元素
element = page('a.link')

# 获取属性
href = element.attr('href')

# 点击元素
element.click()

# 获取子元素
sub_element = element('span')

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

前言

一、SessionPage

（一）SessionPage 模块的基本功能

（二）基本使用

（三）常用方法

更多推荐文章

相关免费在线工具

（四）页面元素定位和数据提取

（五）Cookie 和会话管理

（六）SessionPage 的优点和局限性

（七）SessionPage 和 DriverPage 的搭配使用

（八）SessionPage 总结

二、WebPage

（一）WebPage 的核心功能

（二）WebPage 的基本使用

（三）常用方法

（四）WebPage 的优缺点

（五）WebPage 和 Element 配合使用

（六）适用场景

（七）WebPage 总结

三、总结

更多推荐文章

相关免费在线工具

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

Python 爬虫实战：DrissionPage 的 SessionPage 与 WebPage 模块详解

前言

一、SessionPage

（一）SessionPage 模块的基本功能

（二）基本使用

（三）常用方法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

（四）页面元素定位和数据提取

（五）Cookie 和会话管理

（六）SessionPage 的优点和局限性

（七）SessionPage 和 DriverPage 的搭配使用

（八）SessionPage 总结

二、WebPage

（一）WebPage 的核心功能

（二）WebPage 的基本使用

（三）常用方法

（四）WebPage 的优缺点

（五）WebPage 和 Element 配合使用

（六）适用场景

（七）WebPage 总结

三、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具