Web基础

万维网(Web)的四大核心构成

万维网的四大核心构成包括超文本传输协议(HTTP)、超文本标记语言(HTML)、统一资源定位符(URL)和超链接(Hyperlink)。这些技术共同支撑了现代互联网的基础架构。

超文本传输协议(HTTP)

HTTP是客户端和服务器之间通信的基础协议,用于传输超文本数据。它定义了请求和响应的格式,支持GET、POST等方法来获取或提交资源。HTTP是无状态的,但通过Cookie等技术可以实现会话管理。

超文本标记语言(HTML)

HTML是用于创建和设计网页的标准标记语言。它通过标签定义网页的结构和内容,如标题、段落、图像和链接。HTML5引入了更多语义化标签和多媒体支持,增强了网页的表现力和交互性。

统一资源定位符(URL)

URL是用于标识互联网上资源位置的字符串。它由协议、域名、路径和查询参数等部分组成。例如,https://example.com/path?query=value。URL确保用户和程序能够准确访问特定的网络资源。

超链接(Hyperlink)

超链接是连接不同网页或资源的桥梁,通常以可点击的文本或图像形式呈现。它通过HTML的<a>标签实现,指向另一个URL。超链接是万维网“网状”结构的核心,实现了信息的互联互通。

这些技术共同构成了万维网的基础,使得信息的发布、检索和共享成为可能。

Web服务器的基本概念

Web服务器是一种软件或硬件系统,负责处理客户端(如浏览器)的HTTP请求,并返回响应(如HTML页面、图像或数据)。常见的Web服务器软件包括Apache、Nginx、IIS等。

主流Web服务器软件

Apache

  • 开源且跨平台,支持模块化扩展。
  • 适合动态内容处理,如与PHP结合使用。
  • 配置灵活,但高并发场景下性能可能受限。

Nginx

  • 高性能,擅长处理静态内容和反向代理。
  • 事件驱动架构,支持高并发连接。
  • 常用于负载均衡和缓存加速。

Microsoft IIS

  • 专为Windows设计,深度集成.NET框架。
  • 图形化界面管理,适合企业级应用。

Web服务器的工作原理

  1. 接收请求:客户端通过HTTP/HTTPS协议发送请求。
  2. 处理请求:服务器解析请求(如URL、方法GET/POST)。
  3. 生成响应:返回静态文件或调用后端程序(如PHP、Node.js)。
  4. 发送响应:将HTML、JSON等数据返回客户端。

Web访问流程概述

Web访问流程描述了从用户在浏览器输入URL到页面加载完成的完整过程,涉及DNS解析、TCP连接、HTTP请求与响应、页面渲染等关键步骤。

DNS解析

用户在浏览器输入URL后,系统首先通过DNS(域名系统)将域名转换为对应的IP地址。DNS查询遵循递归或迭代方式,依次检查浏览器缓存、操作系统缓存、路由器缓存、ISP DNS服务器,直至根域名服务器。

建立TCP连接

获取目标服务器IP后,客户端通过TCP三次握手与服务器建立连接。步骤如下:

  1. 客户端发送SYN(同步)报文到服务器。
  2. 服务器回应SYN-ACK(同步-确认)报文。
  3. 客户端发送ACK(确认)报文完成握手。

若启用HTTPS,还需进行TLS握手协商加密协议。

发送HTTP请求

TCP连接建立后,浏览器构造HTTP请求报文,包含请求方法(如GET/POST)、请求头(如User-Agent、Accept)、请求体(如POST数据)。示例GET请求:

GET /index.html HTTP/1.1 Host: example.com User-Agent: Mozilla/5.0 

服务器处理请求

服务器接收请求后,根据路径和参数处理请求,可能涉及后端程序(如PHP、Node.js)或静态文件直接返回。响应包括状态码(如200 OK)、响应头(如Content-Type)和响应体(如HTML内容)。

浏览器渲染

浏览器解析响应内容,逐步加载HTML、CSS、JavaScript及图片等资源:

  • 构建DOM树:解析HTML生成文档对象模型。
  • 构建CSSOM:解析CSS生成样式规则树。
  • 执行JavaScript:可能阻塞渲染,需优化加载顺序。
  • 生成渲染树:合并DOM与CSSOM,计算布局。
  • 绘制页面:根据渲染树进行像素级绘制。

连接终止

页面加载完成后,TCP连接通过四次挥手释放:

  1. 客户端发送FIN报文。
  2. 服务器回应ACK报文。
  3. 服务器发送FIN报文。
  4. 客户端回应ACK报文,等待超时后关闭连接。

性能优化方向

  • 减少DNS查询:使用DNS预解析或减少域名数量。
  • 复用连接:启用HTTP/2或Keep-Alive避免重复握手。
  • 压缩资源:Gzip压缩文本文件,优化图片格式。
  • 延迟加载:异步加载非关键资源(如JavaScript)。

Web服务器漏洞类型及防护措施

常见漏洞类型

  • 注入漏洞:SQL注入、OS命令注入等攻击方式,通过未过滤的用户输入执行恶意代码。
  • 跨站脚本(XSS):攻击者注入客户端脚本,窃取用户会话或篡改网页内容。
  • 配置错误:默认配置、未关闭的调试接口或暴露的敏感文件(如.git目录)。
  • 拒绝服务(DoS/DDoS):通过大量请求耗尽服务器资源导致服务瘫痪。
  • 过时组件:未更新的Web服务器软件(如Apache/Nginx旧版本)或存在已知漏洞的依赖库。

检测与修复方法

  • 使用自动化工具(如Nessus、OpenVAS)扫描漏洞,定期进行渗透测试。
  • 对用户输入实施严格过滤和验证,采用参数化查询防止SQL注入。
  • 配置Web应用防火墙(WAF)拦截恶意流量,如ModSecurity。
  • 及时安装安全补丁,移除不必要的服务和默认账户。

安全加固实践

  • 最小化权限原则:限制服务器进程和数据库账户的权限。
  • 启用HTTPS并配置HSTS,使用强加密算法(如TLS 1.3)。
  • 日志监控:记录访问日志和错误日志,设置异常行为告警。

代码示例(防护SQL注入)

# 使用参数化查询(Python示例) import sqlite3 conn = sqlite3.connect('example.db') cursor = conn.cursor() user_input = "admin' OR 1=1--" cursor.execute("SELECT * FROM users WHERE username=?", (user_input,)) # 安全 

数学公式(DoS攻击模型)
攻击流量阈值计算:
$$
T_{attack} = \frac{C_{server}}{R_{request}}
$$
其中,(C_{server})为服务器承载能力,(R_{request})为单请求资源消耗。

 

Read more

Spring AI框架完整指南

Spring AI 框架完整指南(2025 年最新版) Spring AI 是 Spring 生态中专为 AI 工程设计的应用框架,于 2024 年正式推出,并在 2025 年快速发展,已成为 Java 开发者构建生成式 AI 应用的首选工具。它简化了与大型语言模型(LLM)、嵌入模型和向量数据库的集成,让企业级 Java 应用轻松接入 AI 能力,如聊天机器人、RAG(Retrieval Augmented Generation)和智能代理。根据官方文档和 2025 年最新发布(如 Spring AI 1.1 GA),本指南从基础到高级全面解析,结合代码示例和最佳实践,帮助你快速上手。内容基于

By Ne0inhk
【安全指南】OpenClaw 安全最佳实践:保护你的 AI 和数据

【安全指南】OpenClaw 安全最佳实践:保护你的 AI 和数据

目录 前言:安全无小事,别等出事再后悔 一、OpenClaw 安全架构概览 1.1 安全边界 1.2 威胁模型 二、API 密钥安全 2.1 密钥存储最佳实践 2.2 密钥权限最小化 2.3 密钥泄露应对 三、工作区安全 3.1 文件访问控制 3.2 危险操作防护 3.3 工作区备份 四、技能安全 4.1 第三方技能审查 4.2 技能沙箱 4.3 技能权限分级 五、会话安全 5.

By Ne0inhk

月之暗面(Moonshot AI)的Kimi K2.5开源权重多模态旗舰大模型

Kimi K2.5是月之暗面(Moonshot AI)于 2026 年 1 月 27 日发布的开源权重多模态旗舰大模型 定位为 “Kimi 迄今最智能、最全能的模型”,核心突破在Agent 集群、原生多模态与编码能力,并以 MoE 架构实现高效推理 K2.5 强调文本和视觉的联合优化,通过文本-视觉预训练、零视觉SFT和联合文本-视觉强化学习等技术,提升编码、视觉、推理和智体任务等领域的性能。 K2.5引入了Agent Swarm框架,能动态分解复杂任务并并行执行,降低延迟达4.5倍,在多个基准测试中表现亮眼,接近国际顶尖闭源模型水平,还支持视觉编程、多模态输入输出等能力,是原生多模态模型的代表之一。 三大核心能力 Agent Swarm(智能体集群,研究预览) 基于PARL(并行智能体强化学习),动态拆解复杂任务,调度最多

By Ne0inhk
AI视频生成模型从无到有:构建、实现与调试完全指南

AI视频生成模型从无到有:构建、实现与调试完全指南

文章目录 * **引言:从理论到实践的跃迁** * **第一部分:理论基石——视频生成模型的核心思想** * **第二部分:开发环境搭建与工具链** * **第三部分:亲手构建一个简易视频生成模型** * **第四部分:系统调试与效果评估** * **第五部分:模型优化与进阶探索** * **第六部分:从玩具到应用——部署与展望** * **结语:你的创造之旅,刚刚开始** 引言:从理论到实践的跃迁 在人工智能内容生成(AIGC)浪潮中,视频生成正成为最具挑战性和想象力的前沿领域。从几秒的动图到理论上无限时长的电影级叙事,技术的边界正在被快速突破。然而,对于大多数开发者和研究者而言,前沿模型如Sora、SkyReels-V2或Wan看似高不可攀,其背后动辄千亿级的数据和庞大的算力需求让人望而却步。 本指南的核心目标,正是要打破这种认知壁垒。我将引导你从最基础的原理出发,亲自动手构建一个具备完整AI特性的视频生成模型。这个模型将遵循“简单但完整”的原则:它可能无法生成好莱坞大片,但会清晰地展现扩散模型如何将噪声转化为连贯的动态序列,以及如何通过注意力机制维

By Ne0inhk