【Python练习五】Python 正则与网络爬虫实战:专项练习(2道经典练习带你巩固基础——看完包会)

【Python练习五】Python 正则与网络爬虫实战:专项练习(2道经典练习带你巩固基础——看完包会)

第一题

题目:
使用正则完成下列内容的匹配

  • 匹配陕西省区号 029-12345
  • 匹配邮政编码 745100
  • 匹配邮箱 [email protected]
  • 匹配身份证号 62282519960504337X

代码:

import re # 1. 匹配陕西省区号 029-12345 pattern_area =r'^029-\d{5}$'# 精确匹配 029- 开头,后接5位数字 test_area ='029-12345'print("区号匹配:", re.match(pattern_area, test_area)isnotNone)# 2. 匹配邮政编码 745100 pattern_post =r'^\d{6}$'# 精确匹配6位数字 test_post ='745100'print("邮编匹配:", re.match(pattern_post, test_post)isnotNone)# 3. 匹配邮箱 [email protected] pattern_email =r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$' test_email ='[email protected]'print("邮箱匹配:", re.match(pattern_email, test_email)isnotNone)# 4. 匹配身份证号 62282519960504337X pattern_id =r'^\d{17}[\dXx]$'# 17位数字 + 1位数字或X/x test_id ='62282519960504337X'print("身份证匹配:", re.match(pattern_id, test_id)isnotNone)

运行结果:

在这里插入图片描述

第二题

题目:
爬取学校官网,获取所有图片途径并将路径存储在本地文件中,使用装饰器完成

代码:

import requests import re # 装饰器:记录爬取任务deflog_crawl_task(func):defwrapper(url):print(f"开始爬取: {url}") result = func(url)print(f"爬取完成,共获取 {len(result)} 条图片路径")return result return wrapper # 爬取函数@log_crawl_taskdefcrawl_school_images(url):try:# 基础请求配置,避免被反爬 headers ={"User-Agent":"Mozilla/5.0"} response = requests.get(url, headers=headers, timeout=10) response.encoding ="utf-8"# 确保中文路径不乱码# 正则提取img标签的src属性 img_paths = re.findall(r'<img src="(.*?)"', response.text)return img_paths except Exception as e:print(f"爬取失败: {str(e)}")return[]# 保存路径到本地文件defsave_image_paths(paths):withopen("学校图片路径.txt","w", encoding="utf-8")as f: f.write("\n".join(paths))print("图片路径已保存到 学校图片路径.txt")# 调用示例if __name__ =="__main__": school_url ="https://www.cqcst.edu.cn" image_paths = crawl_school_images(school_url)if image_paths: save_image_paths(image_paths)else:print("未获取到任何图片路径")

运行结果:

在这里插入图片描述


在这里插入图片描述

Read more

最新电子电气架构(EEA)调研-3

而新一代的强实时性、高确定性,以及满足CAP定理的同步分布式协同技术(SDCT),可以实现替代TSN、DDS的应用,且此技术已经在无人车辆得到验证,同时其低成本学习曲线、无复杂二次开发工作,将开发人员的劳动强度、学习曲线极大降低,使开发人员更多的去完成算法、执行器功能完善。 五、各大车厂的EEA 我们调研策略是从公开信息中获得各大车厂的EEA信息,并在如下中进行展示。 我们集中了华为、特斯拉、大众、蔚来、小鹏、理想、东风(岚图)等有代表领先性的车辆电子电气架构厂商。        1、华为 图12 华为的CCA电子电气架构              (1)华为“计算+通信”CC架构的三个平台                         1)MDC智能驾驶平台;                         2)CDC智能座舱平台                         3)VDC整车控制平台。        联接指的是华为智能网联解决方案,解决车内、车外网络高速连接问题,云服务则是基于云计算提供的服务,如在线车主服务、娱乐和OTA等。 华

By Ne0inhk
Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践

Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践

Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践 文章目录 * Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践 * Apache IoTDB 核心特性与价值 * Apache IoTDB 监控面板完整部署方案 * 安装步骤 * 步骤一:IoTDB开启监控指标采集 * 步骤二:安装、配置Prometheus * 步骤三:安装grafana并配置数据源 * 步骤四:导入IoTDB Grafana看板 * TimechoDB(基于 Apache IoTDB)增强特性 * 总结与应用场景建议 Apache IoTDB 核心特性与价值 Apache IoTDB 专为物联网场景打造的高性能轻量级时序数据库,以 “设备 - 测点” 原生数据模型贴合物理设备与传感器关系,通过高压缩算法、百万级并发写入能力和毫秒级查询响应优化海量时序数据存储成本与处理效率,同时支持边缘轻量部署、

By Ne0inhk
SQL Server 2019安装教程(超详细图文)

SQL Server 2019安装教程(超详细图文)

SQL Server 介绍) SQL Server 是由 微软(Microsoft) 开发的一款 关系型数据库管理系统(RDBMS),支持结构化查询语言(SQL)进行数据存储、管理和分析。自1989年首次发布以来,SQL Server 已成为企业级数据管理的核心解决方案,广泛应用于金融、电商、ERP、CRM 等业务系统。它提供高可用性、安全性、事务处理(ACID)和商业智能(BI)支持,并支持 Windows 和 Linux 跨平台部署。 一、获取 SQL Server 2019 安装包 1. 官方下载方式 前往微软官网注册账号后,即可下载 SQL Server Developer 版本(

By Ne0inhk