Web基础

万维网(Web)的四大核心构成

万维网的四大核心构成包括超文本传输协议(HTTP)、超文本标记语言(HTML)、统一资源定位符(URL)和超链接(Hyperlink)。这些技术共同支撑了现代互联网的基础架构。

超文本传输协议(HTTP)

HTTP是客户端和服务器之间通信的基础协议,用于传输超文本数据。它定义了请求和响应的格式,支持GET、POST等方法来获取或提交资源。HTTP是无状态的,但通过Cookie等技术可以实现会话管理。

超文本标记语言(HTML)

HTML是用于创建和设计网页的标准标记语言。它通过标签定义网页的结构和内容,如标题、段落、图像和链接。HTML5引入了更多语义化标签和多媒体支持,增强了网页的表现力和交互性。

统一资源定位符(URL)

URL是用于标识互联网上资源位置的字符串。它由协议、域名、路径和查询参数等部分组成。例如,https://example.com/path?query=value。URL确保用户和程序能够准确访问特定的网络资源。

超链接(Hyperlink)

超链接是连接不同网页或资源的桥梁,通常以可点击的文本或图像形式呈现。它通过HTML的<a>标签实现,指向另一个URL。超链接是万维网“网状”结构的核心,实现了信息的互联互通。

这些技术共同构成了万维网的基础,使得信息的发布、检索和共享成为可能。

Web服务器的基本概念

Web服务器是一种软件或硬件系统,负责处理客户端(如浏览器)的HTTP请求,并返回响应(如HTML页面、图像或数据)。常见的Web服务器软件包括Apache、Nginx、IIS等。

主流Web服务器软件

Apache

  • 开源且跨平台,支持模块化扩展。
  • 适合动态内容处理,如与PHP结合使用。
  • 配置灵活,但高并发场景下性能可能受限。

Nginx

  • 高性能,擅长处理静态内容和反向代理。
  • 事件驱动架构,支持高并发连接。
  • 常用于负载均衡和缓存加速。

Microsoft IIS

  • 专为Windows设计,深度集成.NET框架。
  • 图形化界面管理,适合企业级应用。

Web服务器的工作原理

  1. 接收请求:客户端通过HTTP/HTTPS协议发送请求。
  2. 处理请求:服务器解析请求(如URL、方法GET/POST)。
  3. 生成响应:返回静态文件或调用后端程序(如PHP、Node.js)。
  4. 发送响应:将HTML、JSON等数据返回客户端。

Web访问流程概述

Web访问流程描述了从用户在浏览器输入URL到页面加载完成的完整过程,涉及DNS解析、TCP连接、HTTP请求与响应、页面渲染等关键步骤。

DNS解析

用户在浏览器输入URL后,系统首先通过DNS(域名系统)将域名转换为对应的IP地址。DNS查询遵循递归或迭代方式,依次检查浏览器缓存、操作系统缓存、路由器缓存、ISP DNS服务器,直至根域名服务器。

建立TCP连接

获取目标服务器IP后,客户端通过TCP三次握手与服务器建立连接。步骤如下:

  1. 客户端发送SYN(同步)报文到服务器。
  2. 服务器回应SYN-ACK(同步-确认)报文。
  3. 客户端发送ACK(确认)报文完成握手。

若启用HTTPS,还需进行TLS握手协商加密协议。

发送HTTP请求

TCP连接建立后,浏览器构造HTTP请求报文,包含请求方法(如GET/POST)、请求头(如User-Agent、Accept)、请求体(如POST数据)。示例GET请求:

GET /index.html HTTP/1.1 Host: example.com User-Agent: Mozilla/5.0 

服务器处理请求

服务器接收请求后,根据路径和参数处理请求,可能涉及后端程序(如PHP、Node.js)或静态文件直接返回。响应包括状态码(如200 OK)、响应头(如Content-Type)和响应体(如HTML内容)。

浏览器渲染

浏览器解析响应内容,逐步加载HTML、CSS、JavaScript及图片等资源:

  • 构建DOM树:解析HTML生成文档对象模型。
  • 构建CSSOM:解析CSS生成样式规则树。
  • 执行JavaScript:可能阻塞渲染,需优化加载顺序。
  • 生成渲染树:合并DOM与CSSOM,计算布局。
  • 绘制页面:根据渲染树进行像素级绘制。

连接终止

页面加载完成后,TCP连接通过四次挥手释放:

  1. 客户端发送FIN报文。
  2. 服务器回应ACK报文。
  3. 服务器发送FIN报文。
  4. 客户端回应ACK报文,等待超时后关闭连接。

性能优化方向

  • 减少DNS查询:使用DNS预解析或减少域名数量。
  • 复用连接:启用HTTP/2或Keep-Alive避免重复握手。
  • 压缩资源:Gzip压缩文本文件,优化图片格式。
  • 延迟加载:异步加载非关键资源(如JavaScript)。

Web服务器漏洞类型及防护措施

常见漏洞类型

  • 注入漏洞:SQL注入、OS命令注入等攻击方式,通过未过滤的用户输入执行恶意代码。
  • 跨站脚本(XSS):攻击者注入客户端脚本,窃取用户会话或篡改网页内容。
  • 配置错误:默认配置、未关闭的调试接口或暴露的敏感文件(如.git目录)。
  • 拒绝服务(DoS/DDoS):通过大量请求耗尽服务器资源导致服务瘫痪。
  • 过时组件:未更新的Web服务器软件(如Apache/Nginx旧版本)或存在已知漏洞的依赖库。

检测与修复方法

  • 使用自动化工具(如Nessus、OpenVAS)扫描漏洞,定期进行渗透测试。
  • 对用户输入实施严格过滤和验证,采用参数化查询防止SQL注入。
  • 配置Web应用防火墙(WAF)拦截恶意流量,如ModSecurity。
  • 及时安装安全补丁,移除不必要的服务和默认账户。

安全加固实践

  • 最小化权限原则:限制服务器进程和数据库账户的权限。
  • 启用HTTPS并配置HSTS,使用强加密算法(如TLS 1.3)。
  • 日志监控:记录访问日志和错误日志,设置异常行为告警。

代码示例(防护SQL注入)

# 使用参数化查询(Python示例) import sqlite3 conn = sqlite3.connect('example.db') cursor = conn.cursor() user_input = "admin' OR 1=1--" cursor.execute("SELECT * FROM users WHERE username=?", (user_input,)) # 安全 

数学公式(DoS攻击模型)
攻击流量阈值计算:
$$
T_{attack} = \frac{C_{server}}{R_{request}}
$$
其中,(C_{server})为服务器承载能力,(R_{request})为单请求资源消耗。

 

Read more

2026年3月13日AI热点:芯片大战、Agent爆发、安全争议

2026年3月13日AI热点:芯片大战、Agent爆发、安全争议 今日AI圈发生了什么?十大热点一文打尽 ChatGPT o3 pro | Claude 3.7 | Gemini 2.5 pro免费用 👉 AI工具集 今天的AI圈依然热闹非凡!从芯片巨头的大手笔投入,到Agent时代的全面爆发,再到AI安全争议愈演愈烈…让我带你一篇看完今日AI十大热点! 🔥 十大AI新闻 1. Anthropic 起诉美国国防部 Anthropic就供应链风险认定起诉五角大楼,称这一认定可能让其损失数十亿美元。特朗普政府表示不排除对Anthropic采取进一步行动。 2. Nvidia 投资260亿美元开发开源模型 最新文件显示,Nvidia计划投入260亿美元构建开源权重AI模型,展现其对开源生态的承诺。 3. Meta 发布4款新AI芯片 Meta推出了MTIA 300芯片,用于训练Instagram和Facebook的排序推荐系统。MTIA 400/450/500将在2027年前支持生成式AI推理。 4. Google Gemini 登陆 Chrome

【Unity-AI开发篇】| Unity-MCP最新指南:让AI接管游戏开发

【Unity-AI开发篇】| Unity-MCP最新指南:让AI接管游戏开发

* 前言 * 【Unity-AI开发篇】| Unity-MCP最新指南:让AI接管游戏开发 * 一、🧐 MCP是什么? * 1.1 MCP介绍 * 1.2 为什么要配置MCP? * 1.3 效果展示 * 1.4 使用说明及下载 * 二、🚀MCP安装步骤 * 2.1 前提条件 * 2.2 安装 Unity-MCP包(桥接组件) * 2.2 MCP配置 * 三、🎈Trae配置 * 3.1 添加MCP配置 * 3.2 创建一个智能体并添加Unity-MCP * 3.3 使用AI开发功能 * 总结 前言 * 在人工智能飞速发展的今天,大语言模型早已不仅限于聊天和文本生成。 * 它们开始能够使用工具,与环境进行交互,从而执行复杂任务。 * 对于广大游戏开发者而言,

AI的提示词专栏:重构建议 Prompt,代码可读性提升

AI的提示词专栏:重构建议 Prompt,代码可读性提升

AI的提示词专栏:重构建议 Prompt,代码可读性提升 本文围绕重构建议 Prompt 在提升代码可读性中的应用展开,先明确代码可读性的五大评价维度(命名规范、函数设计、逻辑简化、注释完整性、代码复用)及量化标准,再构建基础版、进阶版、专家版三级 Prompt 设计框架,结合 Python、Java、JavaScript/TypeScript、Go 等主流语言特性提供适配技巧,还分析了 Prompt 使用中常见问题(如模型误解需求、方案不可执行)及解决方案。最后通过核心要点回顾、实践建议和不同难度的课后练习,形成 “问题识别 - Prompt 设计 - 方案落地 - 效果验证” 的全流程指南,助力开发者利用 Prompt 高效完成代码重构,平衡代码可读性与业务稳定性。 人工智能专栏介绍     人工智能学习合集专栏是