数据结构：kmp算法，Trie树，以及并查集的干货详解---小白也能看懂

Ne0inhk

16 Mar 2026 — 8 min read

🎬 博主名称：个人主页

🔥 个人专栏: 《算法通关》，《Java讲解》

⛺️心简单，世界就简单

序言

昨晚数据结构写了一半，做图太累了，文章写的比较慢，这篇应该就是第二篇，后面还有一篇，太困了，真不行了

今天讲一下 kmp算法，Trie，并查集

KMP算法

这里说一下kmp的大致情况

用于处理字符串匹配问题，他也是十分的抽象给一个S[]主串（比较长的那个），P[]为模板串，kmp我们一般用下标1来开始遍历

接下来我们需要去思考的是

1，暴力去怎么做

2，怎么去优化

下面是暴力的模板代码

大概意思就是，每当我们匹配到不一样的部位，我们的P就要从头开始再跟刚刚s的起点+1位置重新匹配，这样就会造成串的长度很长时候，就会超时，所以我们就要从这个过程中找性质了

 for(int i = 1; i <= m; i ++){//枚举当前的起点 bool flag = true;// 成功的状态 for(int j = 1; j <= n; j++){ if(S[i+j-1] != P[j]){ flag = false; break; } } }

原理

看这个第一个是暴力，我们需要每次遇到不一样的字符，就让P从头开始，去匹配 S 串，这样我们其实可以发现 P 串他本身就会有一些相同的前缀后缀，然后当我们遇到不相同的字符，我们没必要再一个一个匹配，我们可以直接跳到一定位置接着继续匹配，这就是我们的原理

现在我们就要去思考，我们怎样找到，当一个位置匹配失败时，我们需要让这个串最多移动多少，这就是我们常常听说的next数组的用处了

next数组

next[ i ] 的含义就是以 i 为终点的这个后缀和从1开始的这个前缀相等，且这个长度最长

比如， next[ i ] = j,意思就是，p[ 1.....j] = p[ i - j + 1........i]

next数组咱咋求，我们先假设 i-1 位置（包括i-1这个位置）之前的最长的前缀和后缀的长度为 j ,如果此时 i 位置和 j + 1位置相等，那我们就在此基础上先 j ++,然后让ne[ i ] = j，如果就是位置不相等嘞，那我们就利用next[ j ]找到这个相等的前缀，然后继续匹配，也就是 j = ne[ j ]
好了大致就是这样，你一定要先知道next数组是干啥

for(int i = 1, j = 0;i <=m; i++ ){ while(j && S[i] != P[j + 1]) j = ne[j]; if(S[i] == P[j + 1]) j ++; if(j == n){ //匹配成功 printf("%d ", i - n);//减n是因为，字符串的位置是从0开始 j = ne[j];//成功后可能后面还有能匹配的，继续操作 } }

 for(int i = 2, j = 0; i <= n;i ++){ while(j && P[i] != P[j + 1]) j = ne[j]; if(P[i] == P[j + 1]) j ++; ne[i] = j; }

匹配过程

我们先明确指针，大概就是上面这个图，我们每次是要看j + 1 和 i位置是否相同，不同就让j退回到ne[ j ]位置，然后再看j + 1位置和 i 是否相同，如果相同我们就让j ++，然后让ne[ i ] 等于j

代码其实和构造next数组几乎一样

for(int i = 1, j = 0;i <=m; i++ ){ while(j && S[i] != P[j + 1]) j = ne[j]; if(S[i] == P[j + 1]) j ++; if(j == n){ //匹配成功 printf("%d ", i - n);//减n是因为，字符串的位置是从0开始 j = ne[j];//成功后可能后面还有能匹配的，继续操作 } }

合起来就是这个，下面是题目模板

#include<iostream> using namespace std; const int N = 1e4 + 10; const int M = 1e5 +10; char S[M], P[N], ne[N], n, m; int main(){ cin >> n >> (P + 1) >> m >> (S + 1); //求next过程 for(int i = 2, j = 0; i <= n;i ++){ while(j && P[i] != P[j + 1]) j = ne[j]; if(P[i] == P[j + 1]) j ++; ne[i] = j; } for(int i = 1, j = 0;i <=m; i++ ){ while(j && S[i] != P[j + 1]) j = ne[j]; if(S[i] == P[j + 1]) j ++; if(j == n){ //匹配成功 printf("%d ", i - n);//减n是因为，字符串的位置是从0开始 j = ne[j];//成功后可能后面还有能匹配的，继续操作 } } }

Trie树

用来快速的存储和查找字符串集合的数据结构

这个很简单我们来拿给题举例子

现在给了左侧这么多单词，我们来存进树里，我们从根节点开始，将每个单词的字母一一存进去，另外我们给最后一个字母做上标记，防止少走某些点

#include<iostream> using namespace std; const int N = 1e5 + 10; char str[N]; int son[N][26], cnt[N], idx;//下标是0的带你，既是根节点又是 空节点 //cnt是以当前这个点结尾的单词有多少个 //插入操作 void insert(char str[]){ int p = 0;//从根节点开始，从0开始遍历 for(int i = 0; str[i]; i ++){ int u = str[i] - 'a'; //如果p这个节点不存在u这个儿子，就创建一个 if(!son[p][u]) son[p][u] = ++idx; p = son[p][u]; } cnt[p]++; } //查询操作 int query(char str[]){ int p = 0; for(int i = 0; str[i]; i ++){ int u = str[i] - 'a'; if(!son[p][u]) return 0; p = son[p][u]; } return cnt[p]; } int main(){ int n; scanf("%d", &n); while(n --){ char op[2]; scanf("%s%s", op, str); if(op[0]=='I') insert(str); else printf("%d\n", query(str)); } }

并查集

我们先知道并查集是干啥的

1，他是将两个集合合并

2，询问两个元素是否在一个集合中

基本原理：每个集合用一颗树来表示，树根的编号就是整个集合的编号，每个节点存储他的父节点，p[ x ]表示父节点

问题 1：如何判断树根：if（p[ x ] == x)

问题2 ：如何求x的集合编号：while( p[ x ] !=x) x = p[ x ];

问题3：如何合并两个集合：假设p[ x ]是x的集合编号，p[ y ] 是y的集合编号，直接让这两个其中一个插到集合根-------p[ find(x) ] = p[ u ]

优化：路径压缩

下面展示一下并查集模板

#include<iostream> using namespace std; const int N = 1e5 + 10; int p[N], n, m; int find(int x){ //返回下的祖宗节点，路径压缩优化 if(p[x] != x) p[x] = find(p[x]); return p[x]; } int main(){ cin>>n>>m; //最开始自己就是根 for(int i = 1; i <= n; i++) p[i] = i; while(m --){ char op[2]; int a, b; scanf("%s%d%d", op, &a, &b); if(op[0] == 'M') p[find(a)] = find(b); //合并操作让a的祖宗节点的父亲等于b的祖宗 else{ //判断两个节点是不是在一个集合 if(find(a)==find(b)) puts("Yes"); else{ puts("No") } } } }

如果说我们要求出每一个集合的有多少个点呢

这时候我们添加一个size数组就行了，如果合并就让 sizes[find(b)] += sizes[find(a)];

如果两个点在一个集合就 continue

#include<iostream> using namespace std; const int N = 1e5 + 10; int p[N], n, m, sizes[N]; int find(int x){ //返回下的祖宗节点，路径压缩优化 if(p[x] != x) p[x] = find(p[x]); return p[x]; } int main(){ cin>>n>>m; //最开始自己就是根 for(int i = 1; i <= n; i++) p[i] = i, sizes[i] = 1; while(m --){ char op[5]; int a, b; scanf("%s", op); if(op[0] == 'C') { scanf("%d%d", &a, &b); if(find(a) == find(b)) continue; sizes[find(b)] += sizes[find(a)]; p[find(a)] = find(b); } //合并操作让a的祖宗节点的父亲等于b的祖宗 else if(op[1] == '1'){ scanf("%d%d", &a, &b); //判断两个节点是不是在一个集合 if(find(a)==find(b)) puts("Yes"); else{ puts("No"); } } else { scanf("%d", &a); printf("%d\n", sizes[find(a)]); } } }

前端保持和服务器时间同步的方法【使用vue3举例】

你只管努力！剩下的交给时间！目录 * 引言： * 方法一：轮询（定时请求服务器时间） * 优点： * 缺点： * 方法二：使用WebSocket * 优点： * 缺点： * 方法三：时间戳校正 * 优点： * 缺点： * 方法四：使用NTP（网络时间协议） * 优点： * 缺点： * 方法五：使用SSE（Server-Sent Events） * 优点： * 缺点： * 总结：引言：保持前端与服务器时间同步是一个常见的需求，特别是在需要确保时间一致性的应用中，比如在线投票、实时聊天或游戏等。以下是一些方法来实现这一目标：方法一：轮询（定时请求服务器时间）可以定时向服务器发送请求获取当前时间，以此来更新前端的时间显示。 <template><div><h1>当前时间:

前端异常捕获与统一格式化：从 console.log(error) 到服务端上报

🧑 博主简介：ZEEKLOG博客专家，「历代文学网」（公益文学网，PC端可以访问：https://lidaiwenxue.com/#/?__c=1000，移动端可关注公众号 “ 心海云图 ” 微信小程序搜索“历代文学”）总架构师，首席架构师，也是联合创始人！16年工作经验，精通Java编程，高并发设计，分布式系统架构设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分享所学，希望通过我的实践经历和见解，启发他人的创新思维。在这里，我希望能与志同道合的朋友交流探讨，共同进步，一起在技术的世界里不断学习成长。 🤝商务合作：请搜索或扫码关注微信公众号 “ 心海云图 ” 前端异常捕获与统一格式化：从 console.log(error) 到服务端上报引言在前端开发中，异常监控是保证应用稳定性的重要一环。当用户遇到页面白屏、功能不可用等问题时，如果能及时收集到详细的错误信息（包括堆栈、

【AI深究】逻辑回归（Logistic Regression）全网最详细全流程详解与案例（附大量Python代码演示）| 数学原理、案例流程、代码演示及结果解读 | 决策边界、正则化、优缺点及工程建议

大家好，我是爱酱。本篇将系统讲解——逻辑回归（Logistic Regression）的原理、公式、案例流程、代码实现和工程建议。内容详细分步，便于新手和进阶读者理解和实操。注：本文章含大量数学算式、详细例子说明及大量代码演示，大量干货，建议先收藏再慢慢观看理解。新频道发展不易，你们的每个赞、收藏跟转发都是我继续分享的动力！注：本文章颇长近5000字、以及大量Python代码、非常耗时制作，建议先收藏再慢慢观看。新频道发展不易，你们的每个赞、收藏跟转发都是我继续分享的动力！一、逻辑回归简介逻辑回归是一种经典的线性分类算法，本质上是用Sigmoid函数将线性回归的输出“压缩”到0~1之间，输出为概率，常用于二分类任务。与KNN（K-近邻算法）不同，逻辑回归是判别式模型，直接建模输入特征与类别之间的概率关系，适合特征和类别呈线性可分或近似线性关系的数据。注：爱酱也有文章介绍了分类以及其他五大任务的技巧，有兴趣的也可以参考一下哦～分类任务文章传送门：【算法解析1/5】分类任务深度拆解：

用AI给老照片上色：算法对比与调参技巧

用AI给老照片上色：算法对比与调参技巧 * 一、前言 * 二、传统上色算法与局限性 * 2.1 基于直方图匹配的上色算法 * 2.2 基于特征匹配的上色算法 * 三、基于深度学习的上色算法 * 3.1 基于 CNN 的端到端上色算法 * 3.2 基于 GAN 的上色算法 * 3.3 基于Transformer的上色算法 * 四、实用调参技巧 * 4.1 数据预处理调参 * 4.1.1 图像分辨率调整 * 5.1.2 降噪与增强参数 * 5.2 模型结构调参 * 5.2.1 CNN 模型调参 * 5.2.

next数组

匹配过程

Trie树

并查集

Read more

前端保持和服务器时间同步的方法【使用vue3举例】

前端异常捕获与统一格式化：从 console.log(error) 到服务端上报

【AI深究】逻辑回归（Logistic Regression）全网最详细全流程详解与案例（附大量Python代码演示）| 数学原理、案例流程、代码演示及结果解读 | 决策边界、正则化、优缺点及工程建议

用AI给老照片上色：算法对比与调参技巧