从单机架构到分布式:Redis为何成为架构升级的关键一环?

从单机架构到分布式:Redis为何成为架构升级的关键一环?

 


目录

1.前言

插播一条消息~

2.正文

2.1单机架构

2.1.1核心定义与应用场景

2.1.2优势

2.1.3缺点

2.1.4走向分布式

2.2何为分布式

2.3数据库分离

2.3.1问题分析

2.3.2解决方案

2.3.3新的局限与问题

2.4负载均衡

2.4.1问题分析

2.4.2解决方案:负载均衡

2.4.3优势以及新瓶颈

2.5读写分离

2.5.1核心与流程

2.5.2局限与新问题 

2.6引入缓存

2.6.1读流程

2.6.2写流程

2.6.3核心优点与新挑战

2.7数据库分库分表

2.7.1垂直分库

2.7.2 水平分库/分表

2.8初识微服务

2.8.1引入

2.8.2微服务架构

2.8.3优势与局限

3.小结


1.前言

想象一下这个场景:你精心开发的电商系统初期运行良好,但随着用户量突破2000万,日活激增,系统开始频频告警。数据库CPU持续飙红,查询响应时间从几十毫秒飙升到数秒,页面加载缓慢,用户抱怨不断... 这,就是单机架构的‘天花板’。

要突破这个瓶颈,我们必须拥抱‘分布式’。但分布式并非银弹,它是一个循序渐进、充满挑战的演进过程。理解这个演进过程,是理解Redis为何诞生以及它解决何种核心问题的关键。今天,我们就来聊聊从单机到分布式架构的演进之路,看看Redis是如何在解决一个个关键瓶颈中,成为现代高并发、高性能系统架构中不可或缺的‘关键先生’。

本文是Redis系列的开篇先导,将采取循序渐进的方式来讲解,不会深入Redis的具体命令和配置,而是聚焦于回答一个根本问题:我们的架构为什么会走到需要Redis这一步?让我们从最初的起点开始...(温馨提示,本文文字内容较多,建议收藏下来反复学习喔)


插播一条消息~

🔍十年经验淬炼 · 系统化AI学习平台推荐

系统化学习AI平台https://www.captainbed.cn/scy/

📚 完整知识体系:从数学基础 → 工业级项目(人脸识别/自动驾驶/GANs),内容由浅入深💻 实战为王:每小节配套可运行代码案例(提供完整源码)🎯 零基础友好:用生活案例讲解算法,无需担心数学/编程基础

🚀 特别适合

想系统补强AI知识的开发者转型人工智能领域的从业者需要项目经验的学生

2.正文

2.1单机架构

2.1.1核心定义与应用场景

单机架构(Monolithic Architecture),顾名思义,是指一个完整的应用系统(包括其所有核心功能模块)以及支撑其运行所必需的所有基础设施组件,都被部署在单一的一台物理服务器或虚拟机实例上。

典型组件部署在同一台机器:

Web服务器: (如Nginx, Apache Tomcat) 负责处理HTTP(S)请求、静态资源服务。应用服务器/业务逻辑: (如运行在Tomcat中的Spring Boot应用,或其他Java EE容器) 承载核心业务处理逻辑。数据库: (如MySQL, PostgreSQL) 负责数据的持久化存储与访问。文件存储: (可能直接使用服务器本地磁盘) 存放用户上传的文件、日志等。缓存: (如本地的Ehcache, 或小型的Redis实例) 如果使用,也部署在同一台机器。消息队列: (如轻量级的ActiveMQ) 如果使用,通常也内嵌或部署在同一环境。

典型应用场景:

早期创业公司/个人项目网站: 用户量不大(可能日活几百到几千),功能相对简单(如博客系统、小型内容管理CMS、内部工具)。原型验证阶段: 快速搭建一个可运行的Demo进行功能验证和早期用户反馈收集。特定场景的内部系统: 如小范围使用的报表生成工具、批处理脚本等,并发和数据处理压力很小。

核心特征: 所有代码通常打包在一个大的可部署单元(如一个WAR包或一个包含所有依赖的Fat JAR),部署时整体复制到服务器运行。


2.1.2优势

单机架构的吸引力在于其极致的简单性,特别适合项目初期和资源有限的情况:

1.开发简单:

代码结构通常是一个大项目,模块间通过本地方法调用通信,调试直观。技术栈相对统一,开发人员无需过多考虑跨服务通信、分布式事务等复杂问题。

2.部署运维简单:

一键部署: 只需将打包好的应用复制到目标服务器,启动即可(通常一个启动命令)。环境单一: 只需维护一套运行环境(操作系统、JVM、数据库等),配置管理简单。监控直接: 监控目标单一,关注一台机器的CPU、内存、磁盘、网络和应用日志即可。

3.测试相对简单:

端到端测试可以在单一环境中完成,不需要复杂的服务间Mock或集成环境搭建。

4.初始成本低:

硬件成本低(一台服务器)。软件许可成本(如果需要)通常也更低。运维人力成本低。

总结优点: 它让团队能够以最低的初始成本和最少的架构复杂性快速启动和交付产品。


2.1.3缺点

然而,当业务开始增长(用户量、数据量、并发量、功能复杂度提升),单机架构的简单性会迅速转化为制约发展的沉重枷锁,其缺点暴露无遗且难以克服:

性能瓶颈可用性低存储容量受限扩展性差技术选型与升级僵化持续交付与发布困难

 

2.1.4走向分布式

单机架构的优点使其成为许多系统诞生的摇篮。然而,其固有的、由单点资源集中化带来的性能瓶颈、单点故障风险、存储与扩展性天花板,决定了它只能是特定发展阶段的产物,无法承载持续增长的业务规模(用户量↑、数据量↑、并发量↑)。

为了解决单机架构的核心痛点,我们自然地需要将系统拆解,将不同的组件(尤其是数据库!)、不同的业务模块,部署到多台独立的、通过网络连接的机器上协同工作,这就是分布式架构的起点。后续我们将深入探讨读写分离、分库分表、微服务、服务治理、分布式缓存等分布式核心技术如何逐一击破单机架构的这些瓶颈,构建高并发、高可用、易扩展的现代化系统。


2.2何为分布式

作为开发者,我们常追求系统的高性能与高可用,分布式架构正是实现这一目标的核心手段。其严谨定义如下:

分布式系统是由一组通过网络互联的独立计算机(称为节点)协同工作,对终端用户呈现为单一、连贯系统的计算模型。
目标内涵解析典型场景
高并发利用多节点并行处理能力,分散用户请求负载,突破单机处理瓶颈。电商秒杀、春运抢票
高可用通过冗余设计消除单点故障,部分节点失效时系统仍可提供服务(如 N+1 部署)。支付系统、在线医疗平台
可扩展支持水平扩展(Scale-Out),通过增加节点线性提升系统容量,成本可控。社交平台用户量激增
高性能将计算/存储任务分散到多节点执行,降低单点压力,提升吞吐量和响应速度。大数据实时分析、视频转码
大数据存储突破单机存储极限,实现 PB/EB 级数据的安全存储与高效访问。物联网日志、用户行为数据仓库

2.3数据库分离

2.3.1问题分析

在典型的单机部署架构中(如下图所示),应用服务器与数据库服务同处一物理机或虚拟机:

[ 单机服务器 ] ├── 应用服务器 (Tomcat/SpringBoot) └── 数据库服务 (MySQL/Oracle)

这种架构存在致命缺陷

资源争抢严重

CPU/内存冲突:应用服务器处理业务逻辑(如复杂计算、对象转换)时消耗大量CPU和内存,与数据库进程(如SQL解析、执行计划生成、缓存管理)激烈竞争资源。I/O瓶颈突出:数据库频繁读写磁盘(执行查询、写入日志、刷脏页)产生巨大I/O压力,与应用服务器可能需要的磁盘操作(如日志写入、文件上传)相互阻塞。

互相影响,稳定性差

应用服务器的高CPU负载可能导致数据库查询响应变慢。数据库的密集型I/O操作(如全表扫描、大事务提交)会拖慢整个系统的响应速度。任何一方的崩溃、重启或资源耗尽都可能直接导致另一方乃至整个系统不可用。

优化与扩展困难

无法针对应用或数据库各自的特性进行独立的硬件选型、OS参数调优或垂直扩容。

2.3.2解决方案

核心思想:将数据库服务从应用服务器所在的物理环境剥离,部署到专用的、性能更优的独立服务器上

[ 应用服务器 ] <--- 网络 ---> [ 数据库服务器 ] (Tomcat/SpringBoot) (MySQL/Oracle) (CPU/内存密集型优化) (大内存/高速磁盘/多核优化)

优点详解:解耦带来的显著收益

资源隔离 (Resource Isolation)

独立资源池:应用服务器与数据库服务器拥有各自独立的CPU、内存、磁盘I/O、网络带宽资源池。互不影响:应用的CPU密集型任务(如报表生成)不会抢占数据库执行SQL所需的CPU周期;数据库的磁盘高吞吐写入(如批量导入)不会阻塞应用读写本地日志文件。

独立优化

应用服务器:可选用高主频CPU、大内存配置,专注于JVM调优(堆大小、GC策略)。数据库服务器:可选用多核CPU处理并发查询、超大内存配置innodb_buffer_pool_size (MySQL) 或 SGA/PGA (Oracle) 以缓存数据和索引、高速SSD阵列提升I/O能力、优化网络配置(如巨帧)。

性能提升 (Performance Enhancement)

专用硬件优势:数据库服务器利用更强大的硬件(特别是高速磁盘和大内存),显著减少磁盘I/O等待时间,提高缓存命中率,加速查询处理。减少干扰:消除了应用进程对数据库关键资源(CPU时间片、内存带宽、磁盘队列)的干扰,使数据库能更稳定、高效地运行。

初步解耦 (Initial Decoupling)

架构清晰化:明确了应用层与数据层的物理边界,职责分离。奠定扩展基础:这是走向分布式架构的第一步。分离后,应用层和数据库层可以独立进行水平或垂直扩展,为后续引入缓存、读写分离、分库分表等更高级的架构演进铺平道路。

2.3.3新的局限与问题

数据库单点故障 (Single Point of Failure - SPOF)

核心风险:独立部署的数据库服务器本身成为系统新的单一故障点。若该服务器硬件故障(磁盘损坏、电源故障)、操作系统崩溃、数据库进程异常终止或遭遇严重网络中断,将导致整个依赖它的应用完全不可用高可用缺失:此方案本身未解决数据库的高可用性问题。系统依然脆弱,不符合关键业务对持续可用性的要求。

性能瓶颈再现 (Renewed Performance Bottleneck)

读写压力集中:随着用户量和数据量的持续增长,所有的读写请求(Read & Write) 仍然集中涌向这台单一的数据库服务器。硬件极限:即使使用顶级硬件,单台服务器的处理能力(CPU计算力、内存容量、磁盘I/O吞吐量、网络带宽)终将达到物理上限。连接数暴增、复杂查询、大事务、海量数据写入都可能再次压垮数据库,成为系统瓶颈。

网络通信开销 (Network Overhead)

延迟增加:应用与数据库之间的所有交互(SQL执行、结果集传输)现在必须通过网络进行。相比于本机进程间通信(IPC)或本地磁盘访问,网络延迟(通常增加0.5ms - 2ms+)变得不可忽视,尤其对高频次的小查询影响显著。带宽消耗:大量数据的查询结果传输会占用网络带宽。大数据量的批处理操作或报表生成可能成为瓶颈。可靠性依赖:数据库服务的可用性现在高度依赖网络的稳定性。网络抖动或中断会直接影响应用访问数据库的能力。

单数据库节点扛不住读写压力了,怎么办?首先解决“读”的压力! 


2.4负载均衡

2.4.1问题分析

当用户量激增,单台应用服务器面临:

CPU/内存耗尽:并发线程数超出处理能力,请求堆积响应延迟飙升:TP99从毫秒级升至秒级(如电商秒杀场景)服务不可用:最终导致服务器宕机(如OOM Killer杀死进程)

2.4.2解决方案:负载均衡

图解:

关键技术实现:

1.负载均衡器选型

软件层:Nginx(C10K问题优化)、HAProxy(TCP/HTTP精细控制)硬件层:F5 BIG-IP(高性能但成本高)云服务:AWS ALB、阿里云SLB

2.路由算法对比

算法类型适用场景特点
轮询(Round Robin)各节点性能均等实现简单,流量绝对平均
加权轮询节点配置异构按权重分配负载
最少连接(Least Conn)长连接服务(如WebSocket)动态感知节点压力
IP Hash需会话保持同一用户固定访问某节点

3.Nginx配置示例(加权轮询)

upstream app_cluster { server 192.168.1.101:8080 weight=3; # 高配服务器 server 192.168.1.102:8080 weight=2; server 192.168.1.103:8080 weight=1; keepalive 32; # 连接复用优化 } server { location / { proxy_pass http://app_cluster; proxy_set_header X-Real-IP $remote_addr; # 传递真实IP } }

2.4.3优势以及新瓶颈

引入负载均衡,流量分配更加合理

并发能力线性提升高可用保障机制无缝水平扩展

但仍有尚未解决的问题: 

问题表象:

根本矛盾:

读写比例失衡:典型Web应用读:写 ≈ 8:2锁竞争加剧:多App节点并发访问导致行锁/表锁等待连接数瓶颈:MySQL默认max_connections=151

2.5读写分离

2.5.1核心与流程

读写分离的核心思想是将数据库的读操作和写操作分离到不同的数据库实例上处理

核心组件与流程:

主数据库 (Master):

职责: 唯一负责处理所有写操作(INSERT, UPDATE, DELETE, DDL)。特性: 业务数据的唯一“源头”,拥有最新的、权威的数据状态。

从数据库 (Slave):

职责: 主要负责处理读操作(SELECT)。可以部署一个或多个从库。数据来源: 并非直接接收应用写请求,而是通过复制机制从主数据库同步数据。

复制机制 (Replication):

原理 (以MySQL为例):主库将所有的写操作变更记录到其二进制日志 (Binary Log, binlog) 中。从库上的I/O线程会连接到主库,读取主库的binlog。I/O线程将读取到的binlog事件写入从库本地的中继日志 (Relay Log)。从库上的SQL线程读取Relay Log中的事件,并在从库上重放 (Replay) 这些SQL语句,从而使从库的数据与主库保持一致。关键特性: 主从复制通常是异步 (Asynchronous) 的。这意味着主库提交事务成功后,会立即返回给应用,而binlog的传输和从库的重放操作是在后台进行的。

应用层修改 (数据源路由):

核心任务: 应用层(或中间件)需要具备根据SQL操作类型(读/写)将请求路由到正确数据库实例的能力。实现方式:框架集成: 使用如Spring Framework的AbstractRoutingDataSource,结合AOP或注解(如@Transactional(readOnly = true))动态切换数据源。中间件代理: 引入数据库中间件(如MyCAT, ShardingSphere-Proxy, ProxySQL, MySQL Router)。应用连接中间件,中间件负责解析SQL并路由到主库或从库。对应用透明。客户端SDK: 使用特定数据库驱动或SDK(如支持读写分离的JDBC驱动扩展)实现路由。

2.5.2局限与新问题 

瓶颈:

主库写压力瓶颈数据延迟 (Replication Lag)主库单点故障 (写服务不可用)应用复杂度增加

读写分离(主从复制)是解决数据库读性能瓶颈的关键一步,它显著提升了系统的读吞吐量和读可用性。然而,它并非银弹:

主库写瓶颈依然悬而未决。数据延迟问题对业务逻辑和用户体验构成持续挑战。主库的单点故障风险需要复杂的高可用方案来缓解。应用复杂度显著上升。

更重要的是,我们需要认识到一个本质问题:无论读写分离做得多好,直接访问数据库(无论是主库还是从库)始终是一个相对“慢”的操作。这个“慢”主要体现在:

磁盘I/O: 数据库的核心数据存储在磁盘上。即使有缓冲池(如InnoDB Buffer Pool),随机I/O(尤其是HDD)和持久化写操作(WAL)仍然是性能瓶颈。SQL解析与执行计划生成。锁竞争与事务管理开销。

那么,有没有一种方法,能提供比直接查询数据库快几个数量级的数据访问呢?答案是肯定的:缓存 (Cache)


2.6引入缓存

为了跨越磁盘I/O这道鸿沟,我们引入一个高速的内存数据存储层,位于应用服务器和数据库之间。常用的成熟组件包括 Redis 和 Memcached。它们将数据存储在内存中,提供极其快速的读写访问(微秒级μs),其核心目标是:拦截大量高频读请求,避免它们直接冲击数据库,从而显著提升系统整体性能和吞吐量。

 

缓存的工作模式主要围绕“读”和“写”两个操作展开,核心策略是 Cache-Aside Pattern (旁路缓存),这也是最常用、最直观的模式。


2.6.1读流程

应用发起读请求: 应用需要获取数据(例如,根据商品ID product:123 获取商品信息)。查询缓存: 应用首先尝试从缓存(如Redis)中根据Key(product:123)读取数据。缓存命中(Cache Hit): 如果缓存中存在该Key的有效数据,则直接返回该数据给应用。流程结束。 (这是性能最优路径)缓存未命中(Cache Miss):缓存中不存在该Key,或Key对应的数据已过期/无效。应用转而查询数据库(通常是从库),获取所需数据。应用将从数据库获取到的结果数据写入缓存(设置Key为 product:123, Value为查到的数据),通常还会设置一个过期时间(TTL)。应用将数据返回给调用方。

2.6.2写流程

应用发起写请求: 应用需要更新数据(例如,更新商品 product:123 的价格)。更新数据库: 应用首先执行数据库写操作(通常是主库),完成数据的持久化更新。失效(或更新)缓存:主流策略:失效(Delete/Invalidate): 应用删除缓存中对应的Key(product:123)。这是更简单、更常用的策略。下次读请求发生时,会因未命中而触发从数据库加载最新数据并回填缓存。可选策略:更新(Update): 应用在更新数据库后,同步更新缓存中对应Key的数据为最新值。此策略对一致性要求更高,但实现更复杂(需保证DB与Cache更新的原子性,否则易导致不一致)。

2.6.3核心优点与新挑战

性能质的飞跃显著降低数据库压力提升系统整体吞吐量缓解热点数据访问压力

但引入缓存绝非银弹,它引入了新的复杂性和潜在问题,必须谨慎设计和应对:

1.数据一致性(Data Consistency) - 核心挑战!

问题本质: 如何确保缓存中的数据与数据库中的数据是同步的?在写操作发生后,缓存何时、如何反映最新的变化?

2.缓存穿透(Cache Penetration)

问题: 查询一个数据库中根本不存在的数据。每次请求都会穿透缓存,直接查询数据库。如果被恶意攻击(如用随机不存在的ID发起大量请求),会严重压垮数据库。

3.缓存击穿 (Cache Breakdown)

 问题: 一个访问量巨大(热点) 的Key在缓存失效(过期)的瞬间,大量请求同时涌入,直接穿透缓存去查询数据库,导致数据库瞬间压力过大甚至崩溃。

4.缓存雪崩(Cache Avalanche)

问题: 大量缓存Key在同一时间点(或短时间内)集中失效,或者缓存服务集群整体宕机。导致所有请求瞬间涌向数据库,造成数据库压力雪崩式增长甚至崩溃。

毫无疑问,缓存(尤其是Redis)是解决数据库读性能瓶颈、提升系统响应速度和吞吐量的利器! 它通过内存的高速访问特性,完美地拦截了高频重复查询和热点数据访问,让数据库得以喘息。

那么,当缓存优化到极致,数据量和写压力依然巨大,单库难以支撑时,我们该怎么办?

答案就是:数据库分库分表(Sharding)! 通过将单一庞大的数据库(表),按照特定的规则(如用户ID、订单ID、地理位置等)水平拆分到多个独立的物理数据库(表)中,从而突破单库在存储容量、连接数、I/O吞吐量和CPU计算能力上的限制。


2.7数据库分库分表

2.7.1垂直分库

 

拆分原则:按业务领域划分(如用户、订单、商品)核心价值:业务解耦:各模块独立迭代,避免连锁影响资源隔离:CPU/IO资源按业务优先级分配典型问题:跨库Join失效:需改造为多次查询应用层拼接分布式事务:订单创建需同时操作订单库+用户库

2.7.2 水平分库/分表

  • 分片策略对比
策略实现方式优点缺点适用场景
哈希分片shard = user_id % N数据均匀分布扩容需全量迁移随机查询为主的场景
范围分片shard = create_time YYYYMM范围查询高效易出现热点分片时序数据、冷热分离
一致性哈希虚拟节点环扩容仅迁移部分数据实现复杂动态扩容频繁的场景
  • 分片键(Sharding Key)选择原则
    1. 高频查询条件(如90%查询含user_id
    2. 数据分布均匀性(避免某分片存储80%数据)
    3. 业务连续性(同一用户的数据尽量在同一分片)

2.8初识微服务

2.8.1引入

当单体应用发展到一定规模,即使进行了数据库层面的分库分表优化,其固有的架构模式仍会引发一系列严峻问题:

1.臃肿复杂,维护困难,构建部署慢:

代码膨胀: 所有功能模块代码混杂在同一个代码仓库中,项目体积巨大。理解、修改一处逻辑可能牵涉大量无关代码,认知负荷极高。构建与部署瓶颈: 一次代码提交触发整个应用的重新编译、打包和部署。即使只修改了一个小功能,也需要完整走完整个流程,耗时长,风险高(全量部署),严重影响迭代速度和持续交付能力。技术债累积: 在庞大代码库中进行技术栈升级或框架迁移极其困难且风险巨大,导致技术债越积越多。

2.模块耦合度高,故障传播风险大:

强耦合: 不同业务模块(如用户管理、订单处理、库存管理)通常通过进程内函数调用、共享内存或强耦合的数据库表结构紧密连接。故障雪崩: 一个非核心模块(如积分服务)的Bug或性能瓶颈(如慢SQL),可能通过共享资源(如数据库连接池耗尽)或连锁调用导致整个应用崩溃(雪崩效应)。稳定性难以保障。

3.技术栈单一,无法因地制宜:

一刀切限制: 整个应用被迫使用统一的技术栈(如Java + Spring MVC + MySQL)。无法根据特定模块的独特需求(如全文搜索用Elasticsearch、实时推荐用图数据库、高并发缓存用Redis)选择最合适的工具,限制了系统性能和开发效率。

4.扩展性粒度粗,资源利用率低:

整体扩展: 只能通过水平复制整个应用实例(scale-out)来应对流量压力。即使只有订单模块负载高,也不得不扩展包含所有模块(包括低负载的用户模块、商品模块)的实例,造成资源浪费和成本上升。无法按需伸缩: 难以精确针对高负载的服务进行独立扩容缩容。

2.8.2微服务架构

微服务架构是针对上述单体痛点的系统性解决方案。其核心理念是将一个庞大的单体应用,按照业务能力边界(如订单、用户、支付)或领域驱动设计(DDD) 的限界上下文(Bounded Context)拆分为一组:

小型化服务: 每个服务聚焦一个单一的、明确的业务能力。独立部署: 每个服务可以独立编译、打包、部署和启动/停止,不影响其他服务。松耦合: 服务间通过定义良好的轻量级通信机制(通常是基于HTTP/RESTful API或RPC如gRPC/Dubbo)进行交互,避免直接的代码或数据库耦合。自治性:独立进程,独立数据存储,独立团队

2.8.3优势与局限

采用微服务架构能有效解决单体应用的痛点,带来显著收益:

解耦与独立提升可维护性增强容错性

但微服务并非银弹。它将单体应用内部的复杂性转移到了服务之间的分布式交互上,引入了分布式系统固有的复杂性问题,这是架构演进必须付出的代价。

在这种架构下,对跨服务的状态管理、高速访问、协调与通信的需求变得空前强烈。而Redis,凭借其卓越的特性,完美契合了这些需求,成为构建健壮、高性能微服务架构不可或缺的基础设施。


3.小结

从单机的局限出发,我们一步步构建分布式系统:数据库分离、负载均衡、读写分离、分库分表,直至微服务解耦。每一步演进,核心目标都是突破性能、可用性和扩展性的瓶颈。

然而,关系型数据库的磁盘I/O特性,使其在高并发、低延迟的海量请求前始终面临挑战。即使借助读写分离与分库分表,性能提升的代价是陡增的复杂性。

此时,‘引入缓存’成为关键转折。Redis这类高性能内存存储,不仅极大缓解了数据库压力、提升了响应速度,更在微服务架构中,从单纯缓存演变为分布式锁、会话共享、消息队列等核心组件的基石,成为维系分布式系统高效稳定的‘瑞士军刀’。

理解这个演进历程,才能真正领悟Redis的价值——它并非凭空出现,而是为解决分布式架构核心痛点而生的利器。

欢迎在评论区分享你的架构挑战或Redis疑问!原创不易,如果本文对你有启发,欢迎点赞、收藏、关注支持!我们下期见!

 

Read more

山东大学《Web数据管理》期末复习宝典【万字解析!】

山东大学《Web数据管理》期末复习宝典【万字解析!】

🌈 个人主页:十二月的猫-ZEEKLOG博客 🔥 系列专栏:🏀山东大学期末速通专用_十二月的猫的博客-ZEEKLOG博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光  目录 1. 第二章 网络爬虫 1.1 爬虫基础知识 1.2 爬虫分类 1.3 开源工具 Nutch 2. 第三章 网页分析 2.1 正则表达式 2.2 DOM模型 2.3 Beautiful Soup工具 2.4 Scrapy框架 2.5 不同爬虫工具比较 2.6 元搜索引擎 3. 第四章 爬虫与网站的博弈 3.1 Robot协议 3.

By Ne0inhk
一文看懂 Modbus RTU 协议:核心架构、报文解析与现场调试避坑指

一文看懂 Modbus RTU 协议:核心架构、报文解析与现场调试避坑指

目录 一、 核心架构:主从式结构 (Client/Server) 二、 常见传输模式:RTU 与 TCP 三、 数据模型:四类存储寄存器 四、 常用功能码 (Function Codes) 五、 报文结构示例 (Modbus RTU) 六、 常见问题与排查思路 一、 核心架构:主从式结构 (Client/Server) Modbus 采用典型的主从式通信模型: 主站 (Master/Client):唯一的指令发起方,同一网络内同一时刻仅存在一台主站,负责主动查询从站数据 / 下发控制指令; 从站 (Slave/Server):指令被动响应方,每台从站配备唯一站号(ID),仅在被主站点名调用时反馈数据 / 执行指令,无主动发送数据的权限; * 注意: 从站不会主动发送数据,只有在被主站“

By Ne0inhk
Flask工厂模式与蓝图设计:构建可扩展大型应用的架构之道

Flask工厂模式与蓝图设计:构建可扩展大型应用的架构之道

目录 📖 摘要 🏗️ 第一章:为什么需要工厂模式? 1.1 从单体应用到模块化架构 1.2 工厂模式的诞生 1.3 性能提升数据 🔧 第二章:Flask应用工厂深度解析 2.1 基础工厂实现 2.2 配置管理 2.3 扩展初始化顺序 🧩 第三章:蓝图模块化架构 3.1 蓝图基础 3.2 企业级蓝图结构 3.3 蓝图间通信 🚀 第四章:完整电商平台实战 4.1 项目结构 4.2 应用工厂完整实现 4.3 数据模型设计 4.4 测试策略 🚀 第五章:

By Ne0inhk
SkyWalking - Spring Cloud Alibaba 全链路追踪实战

SkyWalking - Spring Cloud Alibaba 全链路追踪实战

👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕SkyWalking这个话题展开,希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手,还是正在进阶的开发者,希望你都能有所收获! 文章目录 * SkyWalking - Spring Cloud Alibaba 全链路追踪实战 🚀 * 1. 环境准备与核心概念 🧰 * 1.1 核心概念解析 * 1.2 环境准备 * 2. 构建 Spring Cloud Alibaba 微服务项目 🏗️ * 2.1 创建父工程 * 2.2 构建 `inventory-service`(库存服务) * 2.3 构建 `order-service`(订单服务) * 2.4 验证基础功能 * 3. 集成

By Ne0inhk