Python 爬虫实战：使用 DrissionPage 抓取 BOSS 直聘岗位数据 | 极客日志

Python算法

Python 爬虫实战：使用 DrissionPage 抓取 BOSS 直聘岗位数据

通过 DrissionPage 框架实现 BOSS 直聘大数据开发岗位的批量爬取。无需分析复杂页面元素，直接监听接口数据包获取 JSON 数据。提取岗位名称、公司、薪资等核心信息并存储至 CSV 文件。支持自动翻页，可调整城市编码和爬取页数。代码简洁易懂，适合新手快速上手进行招聘数据分析。

机器人发布于 2026/3/23更新于 2026/6/216 浏览

一、前言

在求职或行业调研过程中，我们常常需要批量获取招聘平台的岗位信息，手动复制粘贴效率极低。本文将通过 DrissionPage 框架实现BOSS 直聘大数据开发岗位的批量爬取，无需分析复杂的页面元素，直接监听接口数据包获取 JSON 数据，最终将结果存入 CSV 文件，全程代码简洁易懂，新手也能快速上手。

本次实战目标

监听 BOSS 直聘岗位列表接口，获取结构化 JSON 数据
提取岗位名称、公司、薪资、学历要求等核心信息
将爬取结果批量存入 CSV 文件，方便后续数据分析
实现自动翻页，爬取前 20 页的岗位数据

二、环境准备

1. 所需 Python 库

本次实战核心使用 DrissionPage 框架（集 Selenium 和 Requests 优势于一体，支持接口监听、页面操作），另外使用 Python 内置的 csv 模块处理文件，pprint 用于格式化输出。

安装核心库

打开终端 / 命令提示符，执行以下安装命令：

pip install DrissionPage

2. 环境说明

Python 版本：3.9 及以上（推荐 3.9~3.11）
操作系统：Windows/macOS/Linux 均兼容
无需额外配置浏览器：DrissionPage 会自动适配本地 Chrome 浏览器，若未安装 Chrome，框架会提示自动下载

三、完整实战代码

直接复制以下代码，运行即可实现爬取（无需修改核心内容，可根据需求调整岗位关键词和爬取页数）。

# 导入自动化模块（核心：页面操作 + 接口监听）
from DrissionPage import ChromiumPage
# 格式化输出（方便调试，查看数据结构）
from pprint import pprint
# 导入 csv 模块（处理 CSV 文件写入）
import csv

def crawl_boss_zhipin():
    # 1. 初始化 CSV 文件，配置表头和写入对象
    with open('boss.csv', mode='w', encoding='utf-8', newline='') as f:
        # 定义 CSV 文件表头字段
        csv_fieldnames = [
            '岗位名称', '公司', '规模', '公司领域', '学历要求', '经验要求',
            , , , , , , , 
        ]
        
        csv_writer = csv.DictWriter(f, fieldnames=csv_fieldnames)
        
        csv_writer.writeheader()

        
        dp = ChromiumPage()
        
        dp.listen.start()
        
        target_url = 
        dp.get(target_url)

        
        total_pages = 
         page  (, total_pages + ):
            ()
            :
                
                resp = dp.listen.wait()
                
                json_data = resp.response.body

                
                
                job_list = json_data[][]
                 job  job_list:
                    
                    job_info = {
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, []),
                        : job.get(, []),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, ),
                        : job.get(, {}).get(, ),
                        : job.get(, {}).get(, )
                    }
                    
                    csv_writer.writerow(job_info)
                    
                    pprint(job_info)

                
                dp.scroll.to_bottom()
             Exception  e:
                ()
                

        
        dp.quit()
        ()

 __name__ == :
    crawl_boss_zhipin()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

========== 正在采集第 1 页数据内容 ==========
{'公司': '某科技有限公司', '公司领域': '大数据/人工智能', '商圈': '科技园', '学历要求': '本科', '经度': '113.94xxx', '纬度': '22.54xxx', '经验要求': '3-5 年', '福利待遇': ['五险一金', '年终奖金', '定期体检'], '技能需求': ['Hadoop', 'Spark', 'Hive'], '薪资': '25-35K·13 薪', '市': '深圳市', '区': '南山区', '规模': '500-999 人', '岗位名称': '大数据开发工程师'}

import time
# 下滑后添加延时
dp.scroll.to_bottom()
time.sleep(3)

Python 爬虫实战：使用 DrissionPage 抓取 BOSS 直聘岗位数据

一、前言

本次实战目标

二、环境准备

1. 所需 Python 库

安装核心库

2. 环境说明

三、完整实战代码

更多推荐文章

相关免费在线工具

四、核心代码解析

1. CSV 文件初始化

2. 浏览器初始化与接口监听

3. 循环翻页与数据提取

4. 数据安全提取与写入

5. 翻页逻辑与资源释放

五、运行结果展示

1. 终端运行日志

2. CSV 文件结果

六、注意事项与优化建议

1. 注意事项

2. 优化建议

七、总结

更多推荐文章

相关免费在线工具

Python 爬虫实战：使用 DrissionPage 抓取 BOSS 直聘岗位数据

一、前言

本次实战目标

二、环境准备

1. 所需 Python 库

安装核心库

2. 环境说明

三、完整实战代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、核心代码解析

1. CSV 文件初始化

2. 浏览器初始化与接口监听

3. 循环翻页与数据提取

4. 数据安全提取与写入

5. 翻页逻辑与资源释放

五、运行结果展示

1. 终端运行日志

2. CSV 文件结果

六、注意事项与优化建议

1. 注意事项

2. 优化建议

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具