Web 自动化测试入门：从概念到百度搜索实战 | 极客日志

Javajava

Web 自动化测试入门：从概念到百度搜索实战

Web 自动化测试的核心概念、分类及金字塔模型，重点讲解了 WebDriver 驱动机制、WebDriverManager 管理工具以及 Selenium 框架的使用。通过百度搜索实战案例，阐述了浏览器配置、元素定位策略（如 XPath）及自动化脚本的执行流程，强调了底层自动化对保障软件质量的重要性。

KernelLab发布于 2026/4/6更新于 2026/7/2051 浏览

一、自动化的核心概念

定义：通过自动方式替代人工操作完成任务，生活中常见案例（自动洒水机、自动洗手液、超市闸机）体现了'减少人力消耗、提升效率 / 质量'的特点。
软件自动化测试的核心目的：
- 用于回归测试：软件迭代新版本时，验证新增功能是否影响历史功能的正常运行。
常见面试题解析：
- 自动化测试不能完全取代人工测试：需人工编写脚本，且功能变更后需维护更新，可靠性未必优于人工。
- 自动化测试不能'大幅度降低工作量'：仅能'一定程度'减少重复工作，需注意表述的严谨性。

文章配图

二、自动化测试的分类

自动化是统称，包含多种类型，核心分类及说明如下：

分类	说明
接口自动化	针对软件接口的测试，目的是验证接口的功能、性能、稳定性等。
UI 自动化	针对软件界面的测试，包含：
	1. 移动端自动化：通过模拟器在电脑上编写脚本，测试手机应用；稳定性较差（受设备、系统版本等环境因素影响）。
	2. Web 自动化：模拟浏览器操作（如自动打开百度、执行搜索），替代人工完成网页操作与验证。

以'百度搜索'为例，Web 自动化的执行逻辑是：自动打开浏览器→访问百度首页→在搜索框输入内容→执行搜索→验证结果，以此替代人工的重复操作，提升测试效率。

文章配图

三、自动化测试金字塔

文章配图

1. 理想的自动化测试金字塔

结构与逻辑：
- 从下到上依次为：单元测试 → API / 集成 / 组件测试 → UI 自动化测试 → 手动 / 探索性测试。
- 核心特点：投入产出比从下到上递减——底层的单元测试消耗更少时间 / 精力，却能发现更多问题，投资回报率更高；上层的 UI 自动化、手动测试则需更多资源，但回报更低。
设计目的：倡导企业优先在底层（单元测试、接口测试）投入自动化，以更低成本保障软件质量。

2. 企业实际的'冰淇淋蛋筒模式'

结构与逻辑：与理想模型倒置：从下到上依次为：单元测试 → API / 集成 / 组件测试 → UI 自动化测试 → 手动 / 探索性测试。

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

维度	简写 XPath（相对 XPath）	Full XPath（绝对 XPath）
定位逻辑	从整个页面找'id=chat-textarea'的任意元素	从 HTML 根节点（/html）开始，按'层级路径'找元素
稳定性	高（只要 id 不变，页面结构变了也能找到）	极低（页面任意层级改了，路径就失效）
长度 / 可读性	短、易读、易维护	超长、难读、难维护
依赖页面结构	不依赖（通过属性定位，和层级无关）	完全依赖（层级错 1 个就定位失败）
实际使用场景	工作中首选（99% 的场景用这个）	仅临时调试 / 无属性可定位的极端场景

特征	是脚本	不是脚本
核心目的	完成具体的、落地的任务（比如搜百度、批量改文件、自动发消息）	学习 / 验证语法、造工具 / 结构（比如练打印、写链表、算算法）
执行方式	「一键运行」就能自动干完所有事，不用手动干预	要么只输出一个结果，要么只是定义'工具'（比如定义个类 / 链表），没实际干活
举例子	'开百度→输文字→关浏览器'代码	单行`System.out.println("hello")`、写个二叉树类、写冒泡排序

代码内容	算不算脚本？	核心判断
写个 for 循环，打印 1 到 100	算「极简脚本」	完成了'输出 1-100'的具体小任务
写个计算器函数（加 / 减），但只定义不调用	不算	只造工具，没实际算任何数
写计算器函数 + 输入 2 个数 + 调用加法 + 打印结果	算脚本	完成了'计算 2 数之和'的具体任务

Web 自动化测试入门：从概念到百度搜索实战

一、自动化的核心概念

二、自动化测试的分类

三、自动化测试金字塔

1. 理想的自动化测试金字塔

2. 企业实际的'冰淇淋蛋筒模式'

更多推荐文章

相关免费在线工具

3. 核心结论

四、Web 自动化测试

1. 驱动的核心作用

2. 驱动管理工具：WebDriverManager

五、Selenium（Web 自动化测试工具）

1. Selenium 的定位

2. 简单的 Selenium 自动化示例

1. 环境依赖（Maven）

2. 自动化脚本逻辑（以'百度搜索'为例）

创建浏览器配置对象（ChromeOptions/EdgeOptions）

实例化驱动对象（WebDriver）并关联配置

3. Selenium + 驱动 + 浏览器的工作原理

脚本的核心是「做事儿」，不是「造东西 / 练手」

1. 为啥'单行打印 hello'不算脚本？

2. 那'写个数据结构（比如链表 / 二叉树）'算脚本吗？

核心价值

更多推荐文章

相关免费在线工具

Web 自动化测试入门：从概念到百度搜索实战

一、自动化的核心概念

二、自动化测试的分类

三、自动化测试金字塔

1. 理想的自动化测试金字塔

2. 企业实际的'冰淇淋蛋筒模式'

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 核心结论

四、Web 自动化测试

1. 驱动的核心作用

2. 驱动管理工具：WebDriverManager

五、Selenium（Web 自动化测试工具）

1. Selenium 的定位

2. 简单的 Selenium 自动化示例

1. 环境依赖（Maven）

2. 自动化脚本逻辑（以'百度搜索'为例）

创建浏览器配置对象（ChromeOptions/EdgeOptions）

实例化驱动对象（WebDriver）并关联配置

3. Selenium + 驱动 + 浏览器的工作原理

脚本的核心是「做事儿」，不是「造东西 / 练手」

1. 为啥'单行打印 hello'不算脚本？

2. 那'写个数据结构（比如链表 / 二叉树）'算脚本吗？

核心价值

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具