简介
Web Scraper 是一款基于浏览器的无代码爬虫工具,对新手非常友好。它屏蔽了底层的编程细节,通过鼠标点选即可快速搭建自定义爬虫。对于知乎这种典型的滚动加载分页页面,使用图形化配置往往比写 Python 脚本更直观高效。
网页结构通常分为单页、分页列表和筛选表单三种。知乎评论属于第二种:资源无限,需通过交互(滚动)触发数据加载。掌握这类页面的抓取逻辑,基本能覆盖日常工作中 90% 的数据获取需求。
官方支持 Firefox 和 Chrome 浏览器,Edge 亦可兼容。以下演示以 Edge 为例。

安装与准备
在浏览器扩展商店搜索 "Web Scraper" 并安装。进入插件界面后,点击 "Get more extensions" 确保功能完整。

注意: 如果抓取时只能获取少量数据,通常是因为未设置滚动延迟。后续步骤会重点讲解如何配置。
核心配置步骤
1. 创建站点地图 (Sitemap)
打开目标知乎帖子页面,按 F12 打开开发者工具,切换到 Console 或 Elements 面板均可,随后在 Web Scraper 侧边栏点击 "Create Sitemap"。


输入任意名称,URL 填入当前页面链接,点击 "Create Sitemap"。


2. 配置选择器 (Selectors)
这是最关键的一步。我们需要告诉爬虫哪些元素需要抓取,以及如何翻页。
滚动容器选择器
知乎评论是动态加载的,必须配置滚动选择器来触发加载更多。
















