马年“码”上发力:用Manacher“马拉车”算法,拉平最长回文难题

马年“码”上发力:用Manacher“马拉车”算法,拉平最长回文难题


在这里插入图片描述
💗博主介绍:计算机专业的一枚大学生 来自重庆 @燃于AC之乐✌专注于C++技术栈,算法,竞赛领域,技术学习和项目实战✌
💗根据博主的学习进度更新(可能不及时)
💗后续更新主要内容:C语言,数据结构,C++、linux(系统编程和网络编程)、MySQL、Redis、QT、Python、Git、爬虫、数据可视化、小程序、AI大模型接入,C++实战项目与学习分享。
👇🏻 精彩专栏 推荐订阅👇🏻
点击进入🌌作者专栏🌌:
算法画解
C++
🌟算法相关题目点击即可进入实操🌟
感兴趣的可以先收藏起来,请多多支持,还有大家有相关问题都可以给我留言咨询,希望希望共同交流心得,一起进步,你我陪伴,学习路上不孤单!

文章目录

前言

今年是马年, 我来分享一个与 “马” 有关的算法, Manacher(马拉车)。

在这里插入图片描述

算法如骏马,载我们驰骋于数据的原野。值此马年,愿各位的代码“码”不停蹄,一往无前,愿你们的项目“马”到功成,顺利上线,愿你们的Bug屈指可“马”,轻松搞定!新的一年,让我们驾驭技术的快马,共同奔赴星辰大海。

在这里插入图片描述

Manacher(马拉车)算法

问题:

1.在字符串中,找出所有的回文子串;

2.在字符串中,找出最长的回文子串;

两个问题可以结合解决。

1.相关概念引入

1.回文字符串: 正着读和反着读都⼀样的字符串就是回⽂字符串。

2.回文子串: 一个字符串的某个字串是回文。

3.奇回文串: 回文串的字符数为奇数。

4.偶回文串: 回文串的字符数为偶数。

5.回文中心: c, 回文串最中心的位置。 奇回文串(回文中心): n + 1 / 2; 偶回文串(回文中心): n / 2与n/2 + 1之间

6.回文半径: d, 回文中心到回文半径左/右端点的距离(字符数,包括本身)。

2.中心扩展算法

算法原理

1.从前往后遍历字符串,以 s[i] 或 s[i] 与 s[i + 1] 的中间作为回文串的中心位置;

2.从中间位置开始,枚举半径长度,逐渐向两边扩展,找出以该点为中心的最长的回文子串。

在这里插入图片描述

预处理

为了防止对奇偶回文字串进行分类讨论,且奇回文字串更好处理,这里将其统一转化为奇回文串。

预处理字符串:

在相邻字符之间和整个字符串的两端任意加⼊⼀个字符 ‘#’ 。

例如,字符串 s = “abcbaa” 经过预处理之后就变成: s = “#a#b#c#b#a#a#” 。

经过预处理之后:

本来是奇回⽂串,处理之后依旧是奇回文串。例如 “bab” 处理后为 “#b#a#b#” ;

本来是偶回⽂串,处理之后就变成奇回文串。例如 “abba” 处理后为 “#a#b#b#a#” ;

此时,在处理之后的串上跑中心扩展算法时,由于所有的回文串都是奇回文串,仅需枚举所有中心点,即可找到所有的回文串。

注意: (不用像 kmp 算法那样,加⼊⼀个不会出现的字符,这⾥可以加⼊任意字符。

因为判断回⽂的时候,只会原始字符和原始字符判断,新加⼊的字符和新加⼊的字符判断。因此,可以加入任意字符。)

代码:

string t, s;int m, n;// 以求解最⻓回⽂⼦串为例intfun(){// 预处理字符串 cin >> t; m = t.size(); s +=' ';//这里要处理边界不同,‘ ’ != ‘#’for(auto ch : t){ s +='#'; s += ch;} s +="##"; n = s.size()-2;int ret =1;// 中⼼扩展算法for(int i =1; i <= n; i++){int d =1;// 枚举向右向左的距离while(s[i - d]== s[i + d]) d++; ret =max(ret, d -1);}return ret;}

时间复杂度:O(n ^ 2 )

3.Manacher算法

概念引入

1.回文半径数组: d[i] (以i为中心的最长回文半径)。
例如,字符串“#a#a#a#b#a#", 回文半径数组:

字符串#a#a#a#b#a#
下标1234567891011
回文半径12343214121

2.两个重要的性质:

1.回文串的长度为d[i] - 1;

2.以i为中心的回文串有d[i] / 2 个。

3.加速盒子(最右回文串):

从前往后填表的过程中,区间 [l, r] ,找到右端点最靠右的回文子串,不断维护区间。

它可以帮助我们加速填表。

如:“#a#a#a#b#a#”;

依次维护的区间:[1, 1] -> [1, 3] -> [1, 5] -> [1, 7] -> [1, 7] -> [1, 7] -> [1, 7] -> [5, 11] -> [5, 11]

4.【Manacher 算法 - 利⽤最右回文串加速更新回文半径数组】

分类讨论(核心)

从前往后填表,当填到d[i]时,d[1] ~ d[i - 1] 均已经填好,并且维护最右回文串[l, r] 。当填写时,分下面大类,四种情况讨论:

  1. i > r, 当前点没有在最右回⽂串中。此时,d[1] ~ d[i - 1] 的回文信息提供不了任何帮

助。直接以 i 为中心暴力扩展(与中心扩展算法⼀致);

在这里插入图片描述


2. i <= r, 当前点在最右回文串中,由对称性可知, j - l = r - i, 对称点j = r - i + l 的回文半径d[j], 分为一下三种情况进行讨论:

a. d[j] < r - i + 1( 最长回文半径),即以 j 为中心的最长回文串包含在[l, r]内:

由对称性可知,d[i] = d[j] = d[r - i + l]

在这里插入图片描述


b. d[j] > r - i + 1,即以 j 为中心的最长回文串的左边界越过了l:

d[i] = r - i + 1。

在这里插入图片描述


c. d[j] = r - i = 1, 即以 j 为中心的最长回文串的左边界正好在l位置:

此时d[i]至少为d[j],且还可能往外扩展。 就可以从d[j]开始, 用中心扩展算法暴力向外扩展。

在这里插入图片描述


注意这里:1和2.c情况还会涉及到对最右回文串区间[l, r]的更新。

时间复杂度: 注意到,在整个算法执⾏的过程中 r 是不会回退的,相当于 i, r 两个指针不回退的向后移动。

因此整个时间复杂度为 O(n)

代码实现:

这里非常的精妙,可以把4种情况都考虑进去。

string t, s;int n, d[N];//预处理voidinit(){ cin >> t; s =' ';for(auto ch : t){ s +='#'; s += ch;} s +="##"; n = s.size()-2;}voidget_d(){ d[1]=1;for(int i =2, l =1, r =1; i <= n; i++){int len = r >= i ?min(d[r - i + l], r - i +1):1;//=1是第1种情况, d[r - i + 1]是第2,r - i + 1是第3,两个相等,任取一个是第4。while(s[i + len]== s[i -len]) len++;//1,4会进入循环,执行中心扩展算法, 2,3会判断不等if(i + len -1> r) r = i + len -1, l = i - len +1;//更新区间 d[i]= len;}}
在这里插入图片描述

4.算法模板

P3805 【模板】Manacher

在这里插入图片描述


代码:

#include<iostream>usingnamespace std;constint N =2.2e7+10; string t, s;int m, n;int d[N];intmain(){ cin >> t; m = t.size(); s +=' ';for(auto ch : t){ s +='#'; s += ch;} s +="##";//处理边界要不同 n = s.size()-2; d[1]=1;int ret =1;for(int i =2, l =1, r =1; i <= n; i++)// 这里初始化,不能在内 {int len = r >= i ?min(d[r - i + l], r - i +1):1;while(s[i + len]== s[i - len]) len++;if(i + len -1> r) r = i + len -1, l = i - len +1; d[i]= len; ret =max(ret, d[i]-1);} cout << ret << endl;return0;}

结尾

愿你的程序一马平川,运行无阻;
愿你的思路天马行空,创意无限;
愿你的职场骏马奔腾,前程似锦!
码上成功,我们马上同行!🐎

在这里插入图片描述


看到这里请点个赞,关注,如果觉得有用就收藏一下吧。后续还会持续更新的。 创作不易,还请多多支持!

在这里插入图片描述

Read more

无中生有——无监督学习的原理、算法与结构发现

无中生有——无监督学习的原理、算法与结构发现

“世界上绝大多数数据都没有标签。 真正的智能,不是在已知答案中选择,而是在混沌中发现秩序。” ——无监督学习的哲学 一、为什么需要无监督学习? 在前七章中,我们系统学习了监督学习(Supervised Learning)的核心范式:给定输入 x\mathbf{x}x 和对应标签 yyy,学习映射 f:x↦yf: \mathbf{x} \mapsto yf:x↦y。无论是线性回归、决策树,还是神经网络,都依赖于标注数据这一稀缺资源。 然而,现实世界的数据绝大多数是未标注的: * 用户浏览日志(只有行为,没有“好/坏”标签); * 医学影像(只有图像,没有诊断结论); * 社交网络(只有连接关系,没有群体划分); * 传感器时序(只有数值流,没有异常标记)

By Ne0inhk
Flutter 组件 humanize 的适配 鸿蒙Harmony 深度进阶 - 驾驭多语言复数逻辑算法、实现鸿蒙端中式大额单位感知与极致人性化文本渲染方案

Flutter 组件 humanize 的适配 鸿蒙Harmony 深度进阶 - 驾驭多语言复数逻辑算法、实现鸿蒙端中式大额单位感知与极致人性化文本渲染方案

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 humanize 的适配 鸿蒙Harmony 深度进阶 - 驾驭多语言复数逻辑算法、实现鸿蒙端中式大额单位感知与极致人性化文本渲染方案 前言 在前文我们掌握了 humanize 进行基础数据转换的方法。但在鸿蒙(OpenHarmony)面向全球市场的布局中,真正的技术挑战往往隐藏在极其琐碎的“语言表达”中。例如:在英文中我们说 1 items 是错误的,必须是 1 item 与 2 items;而在中文环境下,我们虽然没有复数形变,但却有“万、亿”这类独特的四位一级计数逻辑。 一个真正具备“高级感”的鸿蒙应用,不应在数据展示上显得僵硬且带有明显的机器翻译痕迹。 本文将作为 humanize 适配的进阶篇,带你攻克多语言复数(Pluralization)

By Ne0inhk
优选算法——双指针专题 3.快乐数 4.盛水最多的容器

优选算法——双指针专题 3.快乐数 4.盛水最多的容器

优选算法——双指针专题 3.快乐数 4.盛水最多的容器 一.快乐数 1.题目解析 [题目传送门](202. 快乐数 - 力扣(LeetCode)) 2.原理解析 第一种情况:数最后变成1 第二种情况:无限循环但不是1 但两种都可以抽象成一种,有点像之前做过的带环链表 解法:快慢双指针 1.定义快慢指针 2.慢指针每次向后移动一步,快指针每次向后移动两步 3.判断相遇时候的值 3.代码实现 classSolution{public:intBitSum(int n)//返回每一位数上的平方和{int sum=0;while(n){int m=n%10;

By Ne0inhk

Python 数据科学秘籍(五)

原文:annas-archive.org/md5/a4f348a4e11e27ea41410c793e63daff 译者:飞龙 协议:CC BY-NC-SA 4.0 第九章:生长树 本章我们将涵盖以下食谱: * 从树到森林——随机森林 * 生长极度随机化的树 * 生长旋转森林 介绍 在本章中,我们将看到更多基于树的算法的袋装方法。由于它们对噪声的鲁棒性以及对各种问题的普适性,它们在数据科学社区中非常受欢迎。 大多数这些方法的名声在于它们相比其他方法能够在没有任何数据准备的情况下获得非常好的结果,而且它们可以作为黑盒工具交给软件工程师使用。 除了前文提到的过高的要求外,还有一些其他优点。 从设计上看,袋装法非常适合并行化。因此,这些方法可以轻松应用于集群环境中的大规模数据集。 决策树算法在树的每一层将输入数据划分为不同的区域。因此,它们执行了隐式的特征选择。特征选择是构建良好模型中的一个重要任务。通过提供隐式特征选择,决策树相较于其他技术处于有利位置。因此,带有决策树的袋装法具备这一优势。 决策树几乎不需要数据准备。例如,考虑属性的缩放。属性的缩放对决策

By Ne0inhk