
利用浏览器插件 Web Scraper 爬取知乎评论数据
介绍如何使用 Web Scraper 浏览器插件抓取知乎评论数据。步骤包括安装插件、创建站点地图、配置滚动选择器以加载分页内容、提取文本数据并导出。相比 Python 编程,该工具学习成本低,适合快速处理日常网页数据爬取需求。
博客作者
浴火重生
315
已发布文章
8.9K
博客获赞
801K
博客浏览
第 5 页

介绍如何使用 Web Scraper 浏览器插件抓取知乎评论数据。步骤包括安装插件、创建站点地图、配置滚动选择器以加载分页内容、提取文本数据并导出。相比 Python 编程,该工具学习成本低,适合快速处理日常网页数据爬取需求。

如何利用 Bright Data MCP 与 N8N 工作流工具结合 AI 技术,构建自动化新闻编辑智能体。文章详细阐述了 Bright Data MCP 在数据采集、动态解析及合规防护方面的优势,以及 N8N 在可视化流程构建和 AI 集成上的特点。通过环境准备、API 获取、节点配置及工作流搭建等步骤,实现了从多源新闻采集、合并到 AI 摘要生成的全流程…

介绍在 Ubuntu 22.04 系统上配置 ROS2 Humble 环境,并搭建 PX4 无人机仿真平台。主要步骤包括下载 PX4 源码、安装 Gazebo 仿真依赖、编译及部署 Micro XRCE-DDS Agent 代理、编译 PX4 固件以及进行通信与 offboard 控制测试。通过该流程可实现 PX4 与 ROS2 之间的数据交互与仿真验证。

了 HTML、CSS 和 JavaScript 在前端开发中的核心定位与协同关系。HTML 负责网页结构骨架,CSS 负责外观样式美化,JavaScript 负责动态交互行为。三者层层依赖,浏览器按 HTML-CSS-JS 顺序加载执行。文章通过学员档案表格案例展示了三者如何结合实现功能,强调它们是前端开发的三大基础,缺一不可。
在 Ubuntu 22.04 环境下使用 ROS2 Humble 版本和 RPLidar A1 雷达进行 SLAM 建图的完整流程。内容包括安装必要的软件包(slam_toolbox、导航包等),配置 UDEV 规则识别雷达,创建自定义功能包及启动文件,构建工作空间,并在 RViz2 中配置显示与保存地图。通过该教程,用户可以快速搭建基于 slam_tool…
探讨了 AI 在六花直装 V8.3.9 版本自动化开发与测试中的应用。主要优势包括智能分析更新日志、自动生成代码补丁与测试用例、支持多语言及持续集成。AI 能减少重复劳动、降低错误并加快迭代速度。但需注意生成的代码需人工审查,测试用例需结合业务场景补充,核心逻辑仍需人工把控。

大模型工具调用技术的演进,从私有接口的 Function Calling 到开放标准的 Model Context Protocol (MCP)。文章通过门票数据助手和高德地图等案例,展示了如何利用 Function Calling 实现 SQL 查询与可视化,以及如何使用 MCP 协议连接外部工具如高德 API 和本地文件。MCP 旨在标准化 LLM 与外…
ManiSkill 是一个开源机器人操作模拟平台,支持在虚拟环境中测试算法和验证想法。从零开始的安装步骤,包括基础环境配置、Vulkan 驱动安装及系统兼容性要求。内容涵盖核心任务演示、进阶环境配置、常见问题排查(如 Vulkan 初始化失败)以及性能优化技巧。通过手动控制和视觉感知示例,帮助用户快速上手并定制专属模拟环境,为真实机器人部署提供保障。

解析了 AI 自动化系统中的三个核心概念:Agent(决策与执行主体)、MCP(标准化通信协议)和 Skill(可复用能力模块)。文章阐述了它们各自的技术背景、职责分工及协同逻辑,指出三者共同构成'决策—通信—执行'的闭环。通过报表生成和客服响应等场景示例,说明了如何降低 Token 消耗并提升任务自主性,帮助开发者构建长期价值的 AI 系统架构。
对下一代物联网中无人机基站部署面临的复杂优化问题,对比研究了布谷鸟搜索(CS)、大象群体优化(EHO)、灰狼优化(GWO)、帝王蝴蝶优化(MBO)、鲨鱼群算法(SSA)和粒子群优化(PSO)六种智能算法。通过构建覆盖最大化、时延最小化及能耗最低化的数学模型,利用 Matlab 进行仿真实验。结果表明,GWO 算法在综合性能上表现最优,能有效平衡多目标约束。文…

介绍如何利用 Continue 插件在 VS Code 中本地部署 AI 代码助手,以替代 Cursor 或 GitHub Copilot。通过部署 Qwen2.5 等开源模型并配置本地 API,可实现代码补全、对话交互及重构功能,同时保障数据隐私与离线可用性。步骤涵盖环境准备、模型部署、插件安装及 config.yaml 配置,最终完成本地化编程辅助环境的…

百度文心 ERNIE 4.5 大模型的开源版本及其技术特点,包括多模态异构 MoE 架构和高效训练并行策略。详细阐述了基于 FastDeploy 工具在本地 GPU 环境下的部署流程,涵盖环境准备、虚拟环境创建、依赖安装及模型启动步骤。通过通识基础、中文复杂语境及写作能力测试,验证了轻量级模型(如 0.3B)的响应速度与生成质量。结论表明该方案降低了大模型应…

OpenClaw Zero Token 是一个开源 AI 智能体框架,通过 Playwright 浏览器自动化技术复用网页端登录状态,绕过传统 API Token 调用,实现对 DeepSeek、千问、Kimi 等主流大模型的本地 Agent 调用。项目采用五层架构设计,包含接入层、调度层、核心 Agent 层、大模型调用层及底层技术层。支持多种接入方式如…
OpenClaw Web UI 无法访问 Not Found 的根本原因,即 Gateway 的 resolveControlUiRootSync 函数未包含特定 UI 目录路径。解决方案包括将 UI 文件复制到项目根目录或使用绝对路径配置 openclaw.json 中的 controlUi.root 属性。

通义万相 2.1 是开源视频生成 AI 模型,在 VBench 排行榜中表现优异。支持 1080P 分辨率且无时长限制,能模拟自然动作并还原物理规律。适用于 AIGC 内容生成、大模型训练及科学计算等场景。

基于 cann-recipes-train 仓库,解读昇腾平台下 DeepSeek-R1 与 Qwen2.5 的强化学习训练优化实践。内容涵盖仓库全景解析、部署准备、DeepSeek-R1 的 Verl 框架适配及性能优化(训推一体化、参数重排、算子融合),以及 Qwen2.5 的入门级 RL 训练方案与奖励函数优化。旨在帮助开发者在昇腾环境中高效完成大模型…

Vivado 软件在 FPGA 开发中的完整工作流程。内容涵盖从新建工程、添加 Verilog 设计文件、编写 D 触发器代码、综合编译,到创建 Testbench 进行仿真验证,再到配置管脚约束以及最终生成 Bitstream 文件并烧录至硬件的全过程。通过具体示例演示了各步骤的操作方法和注意事项。
对比了火山引擎多模态 API 与 GLM-4.6V-Flash-WEB 本地部署方案。分析了两者在延迟、成本、数据安全和可控性上的差异。火山引擎适合 MVP 验证,但存在网络延迟和数据合规风险。GLM-4.6V-Flash-WEB 支持本地运行,隐私性好,长期成本低。通过硬件投入测算,高调用量场景下自建服务器可在两三个月内收回成本。建议根据业务阶段选择:初期…
对 Vue3 跨组件数据共享痛点,详解 Vuex 状态管理方案。内容包括安装配置、Store 实例创建、组件调用方式,并通过手写迷你 Vuex 剖析其响应式数据与依赖注入原理。同时介绍 Getters 派生计算、Actions 异步处理机制,并推荐 TypeScript 项目优先使用 Pinia。

介绍利用 AI 编程助手进行 Java 微服务开发的完整流程。涵盖 IDEA 插件安装配置、通过自然语言指令生成订单服务核心代码、自动生成 SQL 与缓存配置、智能诊断并修复空指针异常,以及一键生成 Kubernetes 部署文件。文章展示了 AI 技术在简化 CRUD 开发、降低调试成本及加速云原生部署方面的实际应用效果。