跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

使用 Web Scraper 浏览器插件爬取知乎评论数据 | 极客日志

HTML / CSS大前端

使用 Web Scraper 浏览器插件爬取知乎评论数据

介绍如何使用 Web Scraper 浏览器插件抓取知乎评论数据。该工具对新手友好，无需编程基础。步骤包括安装插件、创建站点地图、配置滚动选择器以加载分页内容、定义内容选择器提取文本，最后导出数据。适用于处理单页、分页列表及筛选表单等常见网页类型。

ServerBase发布于 2026/2/8更新于 2026/7/2138 浏览

使用 Web Scraper 浏览器插件爬取知乎评论数据

一、简介

Web Scraper 是一款对新手友好的浏览器插件，屏蔽了底层编程知识，只需鼠标点选即可快速搭建自定义爬虫。

常见的网页类型包括：

1. 单页

日常阅读的文章、推文详情页属于此类。Web Scraper 入门教程常以豆瓣电影为例。

2. 分页列表

互联网资源无限，主流做法是分批加载。随着用户交互（滚动、分页）加载下一部分数据。知乎评论属于此类滚动加载分页。

3. 筛选表单

PC 网站常见，包含多个筛选项，组合多变，交互复杂，如淘宝购物筛选页。

官方支持 Firefox、Chrome 和 Edge 浏览器。

二、安装教程

在浏览器扩展商店搜索 Web Scraper 进行安装。

注意：如果只能爬取少量信息，需设置滚动延迟。

三、使用教程

1. 初始化

选择一个帖子页面。
按 F12 进入开发者模式。
点击 Create Sitemap。
输入名称，URL 填写当前网页链接，点击 Create Sitemap。

2. 配置选择器

创建新的选择器。
滚动选择器：ID 自定义，Type 选择 Element，勾选 Scroll，延迟设为 2000ms，保存。
点击 Select 选择全部下滑框区域，保存。

3. 抓取内容

进入 Content 面板，添加新选择器。
ID 自定义，Type 选择 Text，用于抓取核心数据。
点击 Select 点击内容框，按住 Shift 点击下一个目标元素，实现批量选中。
保存。

4. 执行抓取

点击 Start 开始抓取，插件会自动向下翻页。
等待结束关闭后，数据会弹出。
点击 Export 导出数据。

四、总结

掌握 Web Scraper 的使用，基本可应付学习工作中大部分的数据爬取需求。相对于 Python 爬虫，虽然灵活度受限，但低廉的学习成本可节省时间，快速解决工作问题，提高效率。

目录

一、简介
1. 单页
2. 分页列表
3. 筛选表单
二、安装教程
三、使用教程
1. 初始化
2. 配置选择器
3. 抓取内容
4. 执行抓取
四、总结

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

C++ 复习核心知识点
CCF-CV 企业交流会直播回顾：AI 安全治理与可信未来
生成式 AI 与大语言模型（LLM）原理简明教程
Java 核心面试题及答案汇总
数据可视化基础与实战：Python Matplotlib Seaborn Plotly 详解
微软 7 位研究员联合撰写：多模态大模型 5 大主题 119 页综述
位运算实战：两数之和、唯一数字与消失数字解析
WebODM 开源无人机地图制作完全指南
DownGit：GitHub 文件夹精准下载工具
基于 Docker 部署 Nginx 并通过 cpolar 实现公网远程访问
llama.cpp 量化技术详解：降低大模型内存占用的核心方法
AI 个性化导师重塑 K12 在线学习体验与教育公平
C++ 类和对象基础
C++ map 容器：键值对有序管理与高效检索
OpenClaw 本地部署与飞书机器人接入指南
MySQL 与 Navicat 安装及配置教程（Windows）
排序算法详解：直接插入、希尔与选择排序原理及实现
AI 核心概念解析：Skill、MCP 与 Function Call
LLaMA Factory 大模型微调实战指南
Vue 项目实战：全局封装 Element UI 表格组件

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online