Web 基础架构核心
万维网(Web)的运转依赖于四大基石:超文本传输协议(HTTP)、超文本标记语言(HTML)、统一资源定位符(URL)和超链接。这些技术共同支撑了现代互联网的基础架构,让信息的发布、检索和共享成为可能。
核心组件详解
HTTP是客户端与服务器通信的基石,定义了请求和响应的格式,支持 GET、POST 等方法获取或提交资源。虽然它本身是无状态的,但借助 Cookie 等技术可以实现会话管理。
HTML负责构建网页的结构和内容,通过标签定义标题、段落、图像等元素。HTML5 引入的语义化标签和多媒体支持,显著增强了网页的表现力和交互性。
URL则是资源的唯一标识符,由协议、域名、路径和查询参数组成。例如 https://example.com/path?query=value,确保用户和程序能准确访问特定网络资源。
超链接作为连接不同网页的桥梁,通常以可点击的文本或图像呈现,通过 HTML 的 <a> 标签指向另一个 URL,实现了万维网的'网状'结构。
Web 服务器概览
Web 服务器负责处理客户端(如浏览器)的 HTTP 请求,并返回响应(HTML 页面、图像或数据)。常见的软件包括 Apache、Nginx 和 IIS。
- Apache:开源跨平台,模块化扩展灵活,适合动态内容处理(如 PHP),但在高并发下性能可能受限。
- Nginx:高性能事件驱动架构,擅长静态内容和反向代理,常用于负载均衡和缓存加速。
- Microsoft IIS:专为 Windows 设计,深度集成 .NET 框架,提供图形化管理界面,适合企业级应用。
工作原理与流程
- 接收请求:客户端通过 HTTP/HTTPS 发送请求。
- 处理请求:服务器解析 URL、方法(GET/POST)等参数。
- 生成响应:返回静态文件或调用后端程序(如 PHP、Node.js)。
- 发送响应:将 HTML、JSON 等数据传回客户端。
访问全流程
用户在浏览器输入 URL 后,经历以下关键步骤:
- DNS 解析:系统递归或迭代查询,依次检查浏览器缓存、操作系统缓存、路由器缓存、ISP DNS 服务器及根域名服务器,将域名转换为 IP。
- TCP 连接:客户端与服务器通过三次握手建立连接(SYN -> SYN-ACK -> ACK)。若启用 HTTPS,还需进行 TLS 握手协商加密。
- HTTP 请求:浏览器构造包含请求方法、头信息(User-Agent、Accept)及请求体的报文。
- 服务器处理:根据路径和参数决定返回静态文件还是执行后端逻辑,附带状态码(如 200 OK)和响应头。
- 浏览器渲染:解析 HTML 构建 DOM 树,解析 CSS 构建 CSSOM,合并生成渲染树,计算布局并绘制像素。JavaScript 执行需注意加载顺序以避免阻塞渲染。
- 连接终止:页面加载完成后,通过四次挥手释放 TCP 连接。
性能优化方向
- 减少 DNS 查询:使用预解析或减少域名数量。
- 复用连接:启用 HTTP/2 或 Keep-Alive 避免重复握手。
- 压缩资源:Gzip 压缩文本,优化图片格式。
- 延迟加载:异步加载非关键资源(如 JavaScript)。
安全加固实践
Web 服务器面临多种威胁,需针对性防护。
常见漏洞类型
- 注入漏洞:SQL 注入、OS 命令注入等,利用未过滤的用户输入执行恶意代码。

