Web 基础技术详解
万维网(Web)的四大核心构成
万维网的四大核心构成包括超文本传输协议(HTTP)、超文本标记语言(HTML)、统一资源定位符(URL)和超链接(Hyperlink)。这些技术共同支撑了现代互联网的基础架构。
超文本传输协议(HTTP)
HTTP 是客户端和服务器之间通信的基础协议,用于传输超文本数据。它定义了请求和响应的格式,支持 GET、POST 等方法来获取或提交资源。HTTP 是无状态的,但通过 Cookie 等技术可以实现会话管理。
超文本标记语言(HTML)
HTML 是用于创建和设计网页的标准标记语言。它通过标签定义网页的结构和内容,如标题、段落、图像和链接。HTML5 引入了更多语义化标签和多媒体支持,增强了网页的表现力和交互性。
统一资源定位符(URL)
URL 是用于标识互联网上资源位置的字符串。它由协议、域名、路径和查询参数等部分组成。例如,https://example.com/path?query=value。URL 确保用户和程序能够准确访问特定的网络资源。
超链接(Hyperlink)
超链接是连接不同网页或资源的桥梁,通常以可点击的文本或图像形式呈现。它通过 HTML 的 <a> 标签实现,指向另一个 URL。超链接是万维网'网状'结构的核心,实现了信息的互联互通。
这些技术共同构成了万维网的基础,使得信息的发布、检索和共享成为可能。
Web 服务器的基本概念
Web 服务器是一种软件或硬件系统,负责处理客户端(如浏览器)的 HTTP 请求,并返回响应(如 HTML 页面、图像或数据)。常见的 Web 服务器软件包括 Apache、Nginx、IIS 等。
主流 Web 服务器软件
Apache
- 开源且跨平台,支持模块化扩展。
- 适合动态内容处理,如与 PHP 结合使用。
- 配置灵活,但高并发场景下性能可能受限。
Nginx
- 高性能,擅长处理静态内容和反向代理。
- 事件驱动架构,支持高并发连接。
- 常用于负载均衡和缓存加速。
Microsoft IIS
- 专为 Windows 设计,深度集成.NET 框架。
- 图形化界面管理,适合企业级应用。
Web 服务器的工作原理
- 接收请求:客户端通过 HTTP/HTTPS 协议发送请求。
- 处理请求:服务器解析请求(如 URL、方法 GET/POST)。
- 生成响应:返回静态文件或调用后端程序(如 PHP、Node.js)。
- 发送响应:将 HTML、JSON 等数据返回客户端。
Web 访问流程概述
Web 访问流程描述了从用户在浏览器输入 URL 到页面加载完成的完整过程,涉及 DNS 解析、TCP 连接、HTTP 请求与响应、页面渲染等关键步骤。
DNS 解析
用户在浏览器输入 URL 后,系统首先通过 DNS(域名系统)将域名转换为对应的 IP 地址。DNS 查询遵循递归或迭代方式,依次检查浏览器缓存、操作系统缓存、路由器缓存、ISP DNS 服务器,直至根域名服务器。
建立 TCP 连接
获取目标服务器 IP 后,客户端通过 TCP 三次握手与服务器建立连接。步骤如下:
- 客户端发送 SYN(同步)报文到服务器。
- 服务器回应 SYN-ACK(同步 - 确认)报文。
- 客户端发送 ACK(确认)报文完成握手。
若启用 HTTPS,还需进行 TLS 握手协商加密协议。
发送 HTTP 请求
TCP 连接建立后,浏览器构造 HTTP 请求报文,包含请求方法(如 GET/POST)、请求头(如 User-Agent、Accept)、请求体(如 POST 数据)。示例 GET 请求:

