一、简介
Web Scraper 是一款基于浏览器的无代码爬虫工具,对新手非常友好。它屏蔽了底层的编程细节,通过鼠标点选即可快速搭建自定义爬虫。对于日常生活中的数据获取需求,通常只需几分钟就能上手。
网页结构大致可分为单页、分页列表和筛选表单三种。知乎评论区属于典型的滚动加载分页类型,资源不会一次性全部加载,而是随交互操作逐步呈现。针对这类场景,配置好滚动策略是关键。
官方支持 Firefox 和 Chrome 浏览器,Edge 亦可正常使用。以下演示以 Edge 环境为例。
二、安装扩展
在浏览器扩展商店搜索 "Web Scraper" 并安装。安装完成后,点击浏览器右上角的插件图标进入主界面。


三、配置与抓取流程
1. 创建站点地图
打开目标帖子页面,按下 F12 进入开发者模式。在插件面板中点击 "Create Sitemap"。

输入任意名称,并将 URL 填入当前页面的链接地址,随后点击创建。

2. 设置滚动选择器
由于知乎采用无限滚动加载,我们需要先定义一个容器来触发数据刷新。点击 "Add" 新建选择器:

名称随意填写,Type 选择 "Scroll"(滚动),Element 设置为 "Yes"。

点击 "Select" 按钮,在页面上选中包含评论内容的滚动区域。保存时务必勾选 "Scroll" 选项,并将 Delay(延迟)设为 2000 毫秒左右,避免请求过快被拦截。














