如何利用简单的浏览器插件Web Scraper爬取知乎评论数据

优质文章学习记录

08 Apr 2026 — 6 min read

一、简单介绍：

Web Scraper 的优点就是对新手友好，在最初抓取数据时，把底层的编程知识和网页知识都屏蔽了，可以非常快的入门，只需要鼠标点选几下，几分钟就可以搭建一个自定义的爬虫。

我在过去的半年里，写了很多篇关于 Web Scraper 的教程，本文类似于一篇导航文章，把爬虫的注意要点和我的教程连接起来。最快一个小时，最多一个下午，就可以掌握 Web Scraper 的使用，轻松应对日常生活中的数据爬取需求。

像这样的网页数据，想要通过网页爬虫的方式获取数据，可以下载web scraper进行爬虫

这是常见的网页类型：

1.单页

单页是最常见的网页类型。

我们日常阅读的文章，推文的详情页都可以归于这种类型。作为网页里最简单最常见的类型，Web Scraper 教程里就拿豆瓣电影作为案例，入门 Web Scraper 的基础使用。

2.分页列表

分页列表也是非常常见的网页类型。

互联网的资源可以说是无限的，当我们访问一个网站时，不可能一次性把所有的资源都加载到浏览器里。现在的主流做法是先加载一部分数据，随着用户的交互操作（滚动、筛选、分页）才会加载下一部分数据。

教程里我费了较大的笔墨去讲解 Web Scraper 如何爬取不同分页类型网站的数据，因为内容较多，我放在本文的下一节详细介绍。

3.筛选表单

表单类型的网页在 PC 网站上比较常见。

这种网页的最大特点就是有很多筛选项，不同的选择会加载不同的数据，组合多变，交互较为复杂。比如说淘宝的购物筛选页。

知乎就是属于第二种的网页滚动加载分页

官方支持Fierfox浏览器和Chrome浏览器，用edge浏览器也可以，以下演示我用edge浏览器来做：

二、安装教程

点进插件里获取更多扩展：

搜索web scraper进行安装

大家在自己使用的时候是不是只能爬5条信息？那是因为你没有点scroll设置延迟，下面我来教学：

三、使用教程

1.第一步：选择一个帖子

按F12进入开发者模式：

接下来点create sitemap:

然后名字随便取，url填上面的网页链接：

然后点create sitemap

接下来创建新的选择器：

id随便取，type按照我图片上的来，元素滚动：

然后点击select选择全部的下滑框，像我图里的这样，然后点保存（我红框标注的）：

然后记得scroll记得也要选上，延迟选2000，最后save：

然后再点进content里面：

继续add:

然后直接一步到位吧，把最重要的data内容爬下来，id随便取，类型是text：

其它的像名字，点赞量评论量什么的你们自己可以设置同级别的add点击需要爬取的框,把信息都爬下来

接下来点select点击内容框，此时最重要的来了！！！！！按住shift点击下一个帖子的data内容，这时候往下翻会发现都自动选中了：

done后save

其实在爬之前也可以data preview一下：

然后他会自动向下翻页

最后点击抓取：

不用管直接start：

然后他会自己往下翻，等他结束关闭了：

最后数据会弹出来，然后点导出数据：

最后结果：

四、总结：

掌握了 Web Scraper 的使用，基本上可以应付学习工作中 90% 的数据爬取需求。相对于 python 爬虫，虽然灵活度上受到了限制，但是低廉的学习成本可以大大节省学习时间，快速解决手头的工作，提高整体的工作效率。综合来看，Web Scraper 还是非常值得去学习的。

希望大家多多点赞收藏支持~

2026 前端新手必装 VS Code 插件｜10 个插件提升开发效率（附配置教程）

2026 前端新手必装 VS Code 插件｜10 个插件提升开发效率（附配置教程） VS Code 作为前端开发的「宇宙第一编辑器」，轻量性与强大的插件生态是其核心优势。对新手而言，选对插件能省去重复操作、减少语法错误，让编码效率翻倍。本文精选 10 个高频插件，按「代码高亮/格式化/快捷键辅助」分类，逐一拆解功能、安装及配置步骤，再分享组合使用技巧与冲突解决方法，帮你快速搭建高效开发环境。一、插件分类与精选推荐前端开发的核心场景离不开代码识别、格式规范与操作简化，本次推荐插件严格围绕这三大维度，兼顾新手友好度与实用性，避免冗余插件增加学习成本。（一）代码高亮类：提升代码可读性这类插件优化语法着色与文件识别，让不同语言、不同类型文件直观区分，降低视觉疲劳，尤其适合长时间编码。 1. One Dark Pro（经典深色主题）核心功能：

前端实战：基于Vue3与免费满血版DeepSeek实现无限滚动+懒加载+瀑布流模块及优化策略

目录前端实战：基于Vue3与免费满血版DeepSeek实现无限滚动+懒加载+瀑布流模块及优化策略一、前言二、如何使用腾讯云免费满血版deepseek 1、腾讯云大模型知识引擎体验中心 2、体验deepseek联网助手 3、人机交互获取AI支持三、基于DeepSeek实现无限滚动+懒加载+瀑布流模块 1、无限滚动+懒加载+瀑布流模块的底层逻辑 2、人机交互策略与Deepseek的实现过程 ①虚拟列表管理 ②布局容器初始化 ③动态渲染与销毁机制 ④无线滚动实现 ⑤内存优化策略四、最终代码呈现 1、组件代码 2、组件用法五、结语作者：watermelo37 ZEEKLOG万粉博主、华为云云享专家、阿里云专家博主、腾讯云、支付宝合作作者，全平台博客昵称watermelo37。一个假装是giser的coder，做不只专注于业务逻辑的前端工程师，Java、Docker、

【Linux】教你在 Linux 上搭建 Web 服务器，步骤清晰无门槛

【Linux】教你在 Linux 上搭建 Web 服务器，步骤清晰无门槛 * 摘要 * 一、引言：为何要在 Linux 上搭建 Web 服务器？ * 二、准备工作：连接并更新你的服务器 * 三、方案一：搭建 Nginx Web 服务器 * 3.1 在 Ubuntu 22.04 上安装 Nginx * 3.2 在 CentOS Stream 9 上安装 Nginx * 四、方案二：搭建 Apache Web 服务器 * 4.1 在 Ubuntu

安利一款超实用的前端可视化打印设计器：Vue Print Designer

做前端开发的朋友应该都懂，业务开发中遇到打印需求真的头大 —— 手写分页逻辑繁琐、不同框架适配麻烦、票据 / 快递单这类定制化打印场景不好实现，找个趁手的打印插件更是难上加难。最近发现了一款开源的可视化打印设计器Vue Print Designer，完美解决了这些痛点，不管是快速开发还是企业级定制化需求都能满足，今天就跟大家详细聊聊这款工具。一、Vue Print Designer 是什么？ Vue Print Designer 是一款面向业务表单、标签、票据、快递单等打印场景的可视化设计器，核心主打模板化、变量化设计，还提供了静默打印、云打印能力，同时支持 PDF / 图片 / Blob 等多种导出方式，完全能覆盖日常开发中的各类打印需求。它不是简单的打印插件，而是一套完整的打印解决方案，从可视化设计模板，到参数配置、多端打印，再到定制化扩展，一站式搞定，而且项目还在持续更新，最新版本已经支持英寸、厘米作为单位，对国际化和精细化设计更友好了。项目地址：https://gitee.com/