
基于 Selenium 的 Python 图片爬虫实战
使用 Python 和 Selenium 抓取网页图片的方法涉及安装 Firefox 驱动和 Selenium 库,控制浏览器打开目标网站,利用 JavaScript 滚动加载内容,并通过 CSS 选择器定位图片元素。随后使用 Requests 和 PIL 库下载并保存图片。文章还讨论了优化方向,如命令行参数、自定义选择器及高清图片获取等注意事项。
博客作者
热烈活着
347
已发布文章
13K
博客获赞
866K
博客浏览
第 17 页

使用 Python 和 Selenium 抓取网页图片的方法涉及安装 Firefox 驱动和 Selenium 库,控制浏览器打开目标网站,利用 JavaScript 滚动加载内容,并通过 CSS 选择器定位图片元素。随后使用 Requests 和 PIL 库下载并保存图片。文章还讨论了优化方向,如命令行参数、自定义选择器及高清图片获取等注意事项。

探讨了 AI Agent 的核心价值在于工作流设计而非概念本身。文章指出,思维链(CoT)是提升生成质量的关键,而非单纯的 Agent 数量。设计适合 AI 的工作流需遵循四大原则:避免过度拟人化、采用人机协作决策模式、结合多领域工具模型、回归问题本质。通过 PDF 转 Markdown 和漫画翻译的案例,展示了如何利用 PyMuPDF、OCR 及视觉模型构…

Python 是一门广泛应用于大数据和人工智能领域的编程语言,以其简洁的语法著称。系统梳理了 Python 的核心知识点,涵盖基本数据类型(整数、浮点数、布尔值等)、运算符与流程控制、字符串处理、容器类型(列表、字典)、函数定义与作用域、常用内置模块(数学计算、日期时间、正则表达式)、文件读写操作、面向对象编程(类与对象、继承多态)以及异常处理机制。通过理论…
本教程演示如何使用 Python 语言从零构建一个基础的学生信息管理系统。内容涵盖系统开发环境配置、核心功能模块设计以及完整代码实现。系统支持新建、显示、查询、修改和删除学生信息(姓名及语数英成绩),并具备数据本地保存与加载功能。通过该项目可巩固 Python 基础语法、数据结构、逻辑控制及文件操作等知识点,适合初学者进行实战练习。

腾讯混元大模型通过技术升级降低推理成本并提升性能,展示了企业应用 AI 的新方向。混元 Turbo 在中文基准测评中表现优异,接近国际领先水平,同时推理成本降低一半。腾讯云推出 TI 平台及知识、图像、视频创作引擎等工具链,支持医疗、汽车等行业落地。文章强调 AI 价值在于真实场景解决实际问题,而非单纯的技术堆砌,随着成本下降,企业引入 AI 将更具经济效益…

AI Agent 代表大模型从内容生成向自主任务执行的演进。OpenAI 通过 GPTs 和 Assistants API 布局生态,定义了 Agent 的初期形态。国内厂商因生态不足被迫转型,需打造独立 Agent 产品。核心技术包含规划、记忆、工具与反思机制。未来竞争焦点在于解决复杂场景问题及构建深度集成的原生应用,这为创业者提供了千载难逢的机会。

Python 是一门流行且易学的编程语言,适用于 Web 开发、数据分析及人工智能等领域。 Python 环境的搭建方法,包括官方解释器安装、IDLE 及 PyCharm 集成开发环境的使用。内容涵盖基础数据类型(整数、浮点数、字符串等)、数据结构(列表、元组、字典)、变量赋值规则、运算符分类以及控制语句(条件判断与循环)。此外,还讲解了函数定义、程序结构规…

Android 开发者进阶需构建扎实的技术底座。梳理了从 Java 基础、框架源码解析到性能优化的完整技能树,涵盖架构设计、Kotlin 实战、NDK 开发及跨平台技术路线。通过理解行业需求与技术趋势,明确学习方向,掌握核心原理与实战经验,从而提升工程能力与业务价值,实现从初级到高级的跨越。

2024 年大模型方向秋招面试中关于 Triton 内核优化、MLIR 编译器架构、LLM 推理技术及 GPU 底层架构的核心问题。内容涵盖 Triton 下降流程与 Layout 机制、MLIR 中 Tensor 与 Memref 的区别及算子融合策略、LLM 推理中的 KV Cache 与 Flash Attention 优化、以及 GPU SM 架构细…

通过 Python 的 Selenium 库可以实现浏览器自动化操作,常用于 UI 测试和重复性任务模拟。详细讲解了环境搭建、核心 API 使用及购物车结算流程的自动化实现逻辑,包含完整的代码示例与常见错误排查指南。内容涵盖 Chromedriver 配置、显式等待机制、元素定位方法及异常处理策略,并提供合规使用建议。

介绍使用 Python 的 Selenium 自动化库模拟浏览器操作,实现 12306 铁路售票系统的自动查询与下单流程。内容涵盖环境配置、核心类设计、关键 XPath 定位及等待机制处理。代码示例展示了从登录验证到订单提交的完整逻辑,旨在提供技术参考与学习思路。请注意,此类脚本仅供技术研究,实际使用需遵守平台规则。

Python 是机器学习领域的首选语言,因其丰富的库和易用性。介绍 Python 在数据处理、建模及深度学习中的应用。涵盖 NumPy、Pandas 等基础库,Scikit-learn 实现监督与无监督学习,以及 TensorFlow 和 PyTorch 框架基础。通过实际代码示例展示数据清洗、模型训练与评估流程,帮助开发者快速掌握机器学习核心技能,构建预测…

详细讲解了 ChatGPT 等大语言模型的 Prompt 工程核心方法论。内容涵盖基础指令与角色设定的科学依据,Zero-shot 与 Few-shot 的区别及示例,以及链式思考(CoT)在复杂推理中的应用。文章提供了包含角色、目标、上下文、输入输出规则及示例的万能 Prompt 模板,并通过代码审查、数据分析等实战案例演示了具体用法。同时指出了常见误区,…

渗透测试是通过模拟恶意攻击评估系统安全性的方法。涵盖基本概念、PTES 执行标准、具体实施流程(准备、信息收集、漏洞扫描、利用、报告)、常用工具及风险规避策略。重点阐述了黑盒、白盒、灰盒测试的区别,以及如何在合法授权下规范执行测试,确保业务连续性与数据安全。文章详细介绍了渗透测试的七个标准阶段,列举了 Kali、Metasploit、Burp Suite 等…

本地化部署大语言模型能够保障数据隐私安全,降低使用成本并提升响应效率。 RWKV-Runner、ChatGLM3 及 Langchain-Chatchat 三款主流开源项目的特性与部署方案,涵盖环境配置、量化策略及 RAG 知识库构建流程,帮助开发者在本地构建专属 AI 应用。

探讨了 AI 时代产品经理的职业前景与核心竞争力。文章指出尽管市场环境变化,产品经理仍是高薪且需求稳定的岗位,尤其在 ChatGPT 等 AI 风口下薪资显著增长。核心观点强调高薪背后需要能力与经验的双重加持,包括产品思维、用户调研、竞品分析及文档撰写等基本功。针对 AI 转型,文章详细拆解了大模型学习的七个阶段,涵盖系统设计、提示词工程、平台应用、RAG…

AI 大模型与 AI Agent 是当前人工智能领域的核心方向。系统梳理了从深度学习基础到分布式训练,再到主流大模型架构(如 Transformer、BERT、GPT 系列)的技术原理。同时深入探讨了 AI Agent 的定义、特性及开发框架,涵盖 LangChain、LlamaIndex、AutoGen 等工具的使用,以及检索增强生成(RAG)、多智能体协…
Linux 下通过 dlopen 系列 API 实现动态链接库加载。核心包括打开库、获取符号地址、关闭库及错误处理。配合 RTLD 标志位控制解析时机与作用域,支持运行时模块扩展。编译需添加 -ldl 等参数,适用于 Apache 等服务器插件场景。

Redis 与 NoSQL 数据库基础笔记涵盖 NoSQL 起源、3V+3 高特性及四大分类。阐述传统 MySQL 扩展瓶颈,介绍 KV、文档、列族、图模型差异。解析 ACID 事务与 CAP 原理,说明最终一致性与高可用在 Web2.0 场景的应用。总结大型互联网数据存储架构演进方案及 UDSL 解决思路。
C++ 临时对象在直接调用构造函数时产生,生命周期仅贯穿单条语句。在构造函数内部直接调用另一个构造函数会生成临时对象而非初始化当前对象成员,导致初始化失败。推荐通过私有成员函数进行初始化以避免此问题。此外,在 main 函数中直接调用构造函数也会创建并立即销毁临时对象,应予以避免。