跳到主要内容
哈希表的数据结构与实现详解 | 极客日志
C++ 算法
哈希表的数据结构与实现详解 综述由AI生成 哈希表(散列表)的基本概念、哈希函数设计方法(除法、乘法、全域散列等)、冲突处理策略(开放地址法中的线性探测与二次探测、链地址法)。通过 C++ 模板实现了哈希表的核心操作,包括插入、查找、删除及扩容机制,重点讲解了负载因子控制、状态标记及质数表扩容方案。
道系青年 发布于 2026/3/25 更新于 2026/6/3 26 浏览1 哈希概念
哈希(hash)又称散列,是一种组织数据的方法。从译名上来看的话,有散乱排列的意思。本质就是通过一个哈希函数把关键字 Key 跟存储位置建立一个映射关系,查找时通过这个哈希函数计算出 Key 存储的位置,进而能够快速查找。
1.1 直接定址法
当关键字的范围比较集中时,直接定址法就是一个非常简单且高效的方法,比如一组关键字都在 [0, 99] 的这个范围之间,我们开一个 100 个数的数组,每个关键字的值直接就可以是存储位置的下标。再比如说一组关键字都在 [a, z] 的小写字母这个范围中,那么我们开一个 26 个数的数组,每个关键字的 ascii 码就可以是存储位置的下标,也就是直接定址法的本质就是用关键字计算出一个绝对位置或者相对位置。这个方法我们在计数排序部分就已经用过了。
直接定址法我们感觉它使用起来确实很方便,但是,直接定址法的缺点同样也是非常明显的,可以说是内存不够用,假设我们只有数据范围是 [0, 9999] 的 N 个值,此时,我们要映射到一个 M 个空间的数组中(一般情况下 M>=N),那么此时我们还需要借助哈希函数 hf,关键字 Key 被放到数组中下标为 hf(Key) 这个位置上去,这里我们需要注意的是 hf(Key) 所计算出来的值必须是在 [0, M) 这个范围之内。
1.2 哈希冲突
直接定址法在将关键字映射到数组中不同位置的时候,其实还存在一个问题,就是两个不同的 Key 可能会映射到同一个位置中去,而这种问题我们将其称之为是哈希冲突,或者哈希碰撞。理想情况下是找出一个好的哈希函数以避免发生哈希冲突,但是在实际的场景中,冲突是绝对不可避免的,所以我们要在这里尽可能地去设计出优秀的哈希函数,减少冲突的次数,同时也要去设计出解决冲突的方法。
1.3 负载因子
假设哈希表中已经映射存储了 N 个值,哈希表的大小为 M,那么负载因子=N/M,负载因子有些地方也被翻译成载荷因子/装载因子等,它的英文为 load factor。负载因子越大,哈希冲突的概率就越高,空间利用率就会越高;负载因子越小,哈希冲突的概率就越低,空间利用率就会越低。
1.4 将关键字转成整数
我们将关键字映射到数组中的某一个位置上,一般是整数好做映射计算,如果不是整数,我们就要想办法将这个关键字转化成整数,这个小细节我们后面在代码实现中再展示。下面哈希函数我们在讨论时,如果关键字不是整数,那么我们讨论关于 Key 转化成整数的这个函数。
1.5 哈希函数
一个好的哈希函数应该让 N 个关键字被等概率的均匀的散布到哈希表的 M 个空间中,但是实际中却是很难做到的,但是我们也要尽可能地往这个方向上考量设计。
1.5.1 除法散列法 / 除留余数法
除法散列法又名除留余数法,顾名思义,假如哈希表的大小为 M,那么通过 Key 除以 M 的余数作为余数来作为映射位置的下标,也就可得哈希函数:h(Key)=Key%M。
当我们使用除法散列法时,要尽量避免 M 为某些值,如 2 的幂,10 的幂等(如果我们大家在这里认真地去发现的话,不难会发现 Key%2^x,本质上就相当于保留 Key 的后 x 位(2 进制),如果后 x 位一样的值,由此计算出来的哈希值就是一模一样的了),这样会造成冲突。比如:63 和 31 这两个值,假如 M 是 16(2^4,保留二进制的后 4 位),那么这样的话,计算出来的哈希值均为 15,63 的二进制后 8 位是 00111111(二进制 1111 的十进制是 15),31 的二进制后 8 位是 00011111。如果是 10^x 的话,结果那就会更明显了,保留的都是十进制的后 x 位,如:112 和 12312 这两个值,假如 M 为 10^2,那么计算出来的哈希值均为 12。
当使用除法散列法时,建议 M 取不太接近 2 的整数次幂的一个质数。
需要说明的是,除留余数法在实践中也是八仙过海,各显神通,Java 的 HashMap 采用除法散列法时就是用 2 的整数次幂去做的哈希表的大小 M 的,这样玩的话,它并没有像我们上述所讲的那样,采用取模运算,而是直接采用位运算的方法,位运算相当于取模运算来说效率会显得更高一些。但它不是单纯地去取哪几位,比如 M 是 2^16,本质上最终得到的是数字二进制的后 16 位,但是通过我们前面所讲解过的知识可知,这样是不行的,Java 自然也知道这一点,因此为了避免这种情况,它没有将二进制的后 16 位作为哈希表,而是又求了 Key 的前 16 位,然后将这两个值进行异或操作,最后将这个异或的结果作为了哈希值。
也就是说这里打破了那个最后几位相同的不足,我们映射出来的值还是在 [0, 2^16] 范围之内,但是这里尽量要让 Key 所有的位都参与运算,这样映射出来的哈希值就会显得更均匀一些,我们上面建议 M 取不太接近 2 的整数次幂的一个质数的理论是大多数的数据结构的书籍中写的理论,但在实践中,灵活运用,抓住本质。
OK,回到我们这里的 C++ 中来,我们上面是采用这个除法散列法去作为哈希函数的,通过前面方法的实现步骤我们可以得知,不同的值是极有可能映射到表中的同一个位置的,但是,我们一个位置上只能存储一个数据,这就引发了哈希冲突,目前为止,有 2 种解决方法,这个我们稍后再讲,这里先将哈希函数这一部分讲完。(后面的三种方法以及刚刚讲解的这种方法我们只需简单了解一下即可,不要求大家重点掌握)
1.5.2 乘法散列法
乘法散列法对哈希表大小 M 没有要求,他的第一步思路:用关键字 Key 乘上常数 A(0<A<1),并抽取出 KeyA 的小数部分。第二步:再用 M 乘以 Key A 的小数部分,再向下取整。
h(Key)=floor(M*((A*Key)%1.0)),其中 floor 表示对表达式进行下取整,A∈(0,1),这里最重要的是 A 的值应该如何设定,Knuth 认为 A = (√5 - 1)/2 = 0.6180339887....(黄金分割点) 比较好。
乘法散列法对哈希表大小 M 是没有要求的,假设 M 为 1024,Key 为 1234,A = 0.6180339887, AKey=762.6539420558,取小数部分为 0.6539420558, M×((A×Key)%1.0) = 0.6539420558 1024 =669.6366651392,那么 h(1234) = 669。
1.5.3 全域散列法
如果存在一个恶意的对手,他针对我们提供的散列函数,特意构造出一个发生严重冲突的数据集,比如,让所有关键字全部落入同一个位置中。这种情况是可以存在的,只要散列函数是公开且确定的,就可以实现此攻击。解决方法自然是见招拆招,给散列函数增加随机性,攻击者就无法找出确定可以导致最坏情况的数据。这种方法叫做全域散列。
hab(key) = ((a × key + b)%P )%M,P 需要选一个足够大的质数,a 可以随机选 [1,P-1] 之间的任意整数,b 可以随机选 [0,P-1] 之间的任意整数,这些函数构成了一个 P*(P-1) 组全域散列函数组。假设 P=17,M=6,a = 3,b = 4, 则 h34(8) = ((3 × 8 + 4)%17)%6 = 5。
需要注意的是每次初始化哈希表时,随机选取全域散列函数组中的一个散列函数使用,后续增删查改都固定使用这个散列函数,否则每次哈希都是随机选一个散列函数,那么插入是一个散列函数,查找又是另一个散列函数,就会导致找不到插入的 key 了。
1.5.4 其他方法
上面的几种方法是《算法导论》书籍中讲解的方法。
《殷人昆 数据结构:用面向对象方法与 C++ 语言描述(第二版)》和《[数据结构 (C 语言版)].严蔚敏_吴伟民》等教材型书籍上面还给出了平方取中法、折叠法、随机数法、数学分析方法等,这些方法相对更适用于一些局限的特定场景,有兴趣可以去看看这些书籍。
1.6 处理哈希冲突
1.6.1 开放地址法
在开放地址法中所有的元素都放到哈希表里,当一个关键字 Key 用哈希函数计算出的位置冲突了,则按照某种规则找到一个没有存储数据的位置进行存储,开放地址法中负载因子(表中存储值的个数 / 哈希表的大小)一定是小于 1 的,这里的规则有 3 种:线性探测,二次探测,双重探测(这里我们不讲这个规则,既不常用又不好动,因此我们这里只讲解前两种规则)。
1.6.1.1 线性探测
从发生冲突的位置开始,依次线性向后探测,直到寻找到下一个没有存储数据的位置为止,如果走到哈希表尾的话,则回绕到哈希表头的位置继续往后找。
h(Key)=hash0=Key%M,若 hash0 这个位置冲突了(也就是已经有数据存在了),则线性探测公式为:hc(Key,i)=hashi=(hash0+i)%M,i={1,2,3...,M-1},因为负载因子始终要保持<1,则最多探测 M-1 次,一定能找到一个存储 Key 的位置。
线性探测的比较是简单且容易实现的,线性探测的问题假设,hash0 这个位置连续冲突,hash0,hash1,hash2 位置均已经存储数据了,后续映射到 hash0,hash1,hash2,hash3 位置的值都会去争夺 hash3 这个位置,这种现象叫做群积(1.6.1.2 中的二次探测可以一定程度上解决这个问题)。
下面我们来演示 {19,30,5,36,13,20,21,12} 这一组值映射到 M=11 的表中。
1.6.1.2 二次探测
从发生冲突的位置开始,依次左右按二次方跳跃式探测,直到寻找到下一个没有存储数据的位置为止,如果往右走到哈希表尾的话,则会回绕到哈希表头的位置上;如果往左走到哈希表头,则回绕到哈希表尾的位置。
h(Key)=hash0=Key%M,hash0 的位置冲突了,则第二次探测的公式为:hc(Key,i)=hashi=(hash+-i^2)%M,i={1,2,3...,M/2}。
二次探测当 hashi=(hash-i^2)%M 时,当 hashi<0 时,需要 hashi+=M。
下面就来浅浅地演示一下 {19,30,52,63,11,22} 这组值映射到 M=11 的表中。
OK,上述的两种开放地址法是应对哈希冲突的一种比较简单的一种方法,相当来说是比较好理解的。
1.6.2 代码实现开放地址法
我们这里讲的开放地址法在实践中使用的并不多,我们后面会讲的链地址法,实践中使用的次数更多的是链地址法,开放地址法解决冲突不管是用线性还是二次,它最终都是去占用别的元素的空间,也就是说占用的均为哈希表中的空间,始终都会存在互相影响的问题,效率提升不上去。
我们在正式开始写哈希表的一系列操作时,我们先来看一下哈希表的结构,我们的这个代码是选择使用开放地址法中的线性探测这个方法做了一个简要的分析,它难免会发生位置冲突,进而去占领别的元素的原本地盘,根据这个方法,我们来捋一下思路,如果当前的这个元素的位置存在且没有元素,那么这个位置就归这个元素了,反之,要从这个被映射的位置开始,不断地往后去找一个存在且为空的位置去插入这个元素,既然这样的话,那么我们的查找思路就是从当前这个被映射的位置开始不断地往后找,直到遇上了一个没有存放数据的位置(要查找的那个元素绝对在被映射的位置和第一个遇到的空位置之间),删除元素的操作在这里和查找元素的操作如出一辙了,OK,以上思路就是我们实现的主要思路,其实说到这里还有一个小问题,我们来通过前面所讲解的线性探测的那个例子来说明一下这个问题,这里我先提前来为大家说一下,我们除了要写一些基本的结构以外,还要另外再写一个枚举来标明一下当前这个位置的状态:
enum State
{
EXIST,
EMPTY,
DELETE
};
如上图所示,我们这里将 30 这个元素直接给删除了的话,此时我们若再通过 find 函数去找 20 这个元素的话,就会找不到了(我们这里要知道的是,20 这个元素原本的位置其实并不是在下标为 10 的这个位置,而是在下标为 9 的这个位置),我们这里用我们前一页中所说的查找的思路来顺一下,先通过 20 这个元素来找到它原本被映射的位置,这里是下标为 9 的位置,然后我们再从下标为 9 的这个位置往后找,直到遇到最后一个空位置,按照我们上面那个哈希表来看的话,下标为 9 的那个位置就是一个空位置(这里其实用空位置的这个说法并不准确,因为我们是无法将某一个空间中所存放的数据给彻底地删除掉的,只能说是用另一个毫不相关的数据去替换掉我们这里的这个原有的数据),编译器在这里就不会再去后面继续找了,直接返回,因此查找就失败了,但其实 20 这个元素是存在的,基于这个原因和我们无法判断这个位置是否是我们上面思路中的空位置,因此,我们在这里决定去定义一个枚举类型用来标记各个空间中存储值的状态。
template <class K ,class V >
struct HashData
{
pair<K, V> _kv;
State _state = EMPTY;
HashData (const pair<K, V>& kv) :_kv(kv) { }
};
如上述代码所述,当我们给每个位置加上一个状态标识 {EXIST,EMPTY,DELETE},这样我们在删除 30 的时候就不用再删除值了,而是把状态改成 DELETE 就可以了,那么我们在查找 20 的时候就是以遇到 EMPTY 为结束的条件,就可以找到 20 这个元素了。
1.6.2.1 扩容操作
我们这里用的是除留余数法的那个哈希函数,这个哈希函数要求我们每次扩容的空间个数取不小于 2 的整数次幂的一个质数。而且我们这里将哈希表负载因子控制在 0.7,当负载因子到 0.7 以后我们这里就需要继续扩容操作了,我们这里还是按照 2 倍扩容,但是同时我们要保持哈希表的大小是一个质数,第一次开的空间个数是一个质数,那 2 倍之后就不是质数了。那么如何解决这个问题呢?一种发案就是上面除法散列法中我们讲的 Java 的 HashMap 中使用的 2 的整数幂,另一种发案就是 sgi 版本的哈希表使用的方法,给了一个近似 2 倍的质数表,每次去质数表中去获取扩容后的大小。(我们这里暂时就先不将这个质数表的代码给大家展示出来了,给大家简单说一下质数表这个函数的函数名:__stl_next_prime(unsigned long n);这个函数的功能就是根据当前哈希表的大小来找到下一次扩容后的哈希表的空间大小,并返回该大小的值,后续会说,这里我们暂时只需知晓它的作用即可)
1.6.2.2 Key 不能取模的问题
当 Key 是 string / Date 等类型的数据时,Key 无法进行取模(取模操作仅限于整数),那么我们需要给 HashTable 增加一个仿函数,这个仿函数支持把 Key 转换成一个可以取模的整形数据,如果 Key 可以转换成整形并且不易冲突,那么这个仿函数就用默认的参数(缺省值)即可,如果这个 Key 不能转换成整形,我们就需要自己实现一个仿函数去传给这个参数,实现这个仿函数的要求就是尽量 Key 的每个值均要参与到计算中去,让不同的 Key 转换出整形值不同。string 做哈希表的 Key 非常常见,所以我们在这里可以考虑把 string 特化一下。我们下面用代码来实现出这个将 Key 转换成整形数据的仿函数:
template <class K >
struct HashFunc
{
size_t operator () (const K& key)
{
return (size_t )key;
}
};
template <>
struct HashFunc <string>
{
size_t operator () (const string& key)
{
size_t amount = 0 ;
for (auto ch : key)
{
amount *= 131 ;
amount += ch;
}
return amount;
}
};
OK,好的,有了上面的基础常识后,我们接下来用线性探测的方法来实现一下哈希表的一些基本操作先来实现一下哈希表的一个整体框架:
template <class K ,class V ,class Hash =HashFunc<K>,class KeyOfT,class Pred=equal_to<K>,class Alloc=allocator<K>>
class HashTable
{
public :
HashTable ()
{
_tables.resize (__stl_next_prime(_tables.size () + 1 ));
}
private :
vector<HashData<K, V>> _tables;
size_t _n = 0 ;
};
1.6.2.3 插入一个数据 bool Insert (const pair<K, V>& kv)
{
if (Find (kv.first))
{
return false ;
}
if (_n * 10 / _tables.size () >= 7 )
{
vector<HashData<K, V>> newtables (__stl_next_prime(_tables.size () + 1 ));
for (auto & data : _tables)
{
if (data._state == EXIST)
{
size_t hash0 = data._kv.first % newtables.size ();
while (_tables[hash0]._state == EXIST)
{
hash0++;
hash0 %= _tables.size ();
}
newtables[hash0] = data;
newtables[hash0]._state = EXIST;
}
}
_tables.swap (newtables);
}
size_t hash0 = kv.first % _tables.size ();
while (_tables[hash0]._state == EXIST)
{
hash0++;
hash0 %= _tables.size ();
}
_tables[hash0]._kv = kv;
_tables[hash0]._state = EXIST;
++_n;
return true ;
}
OK,上述代码就是我们这里写的插入元素的操作,我们在写插入的代码时,其中有扩容的操作,我们这里在写这个扩容操作时,是我们自己在开创空间,我们之前有讲过像这种我们自己去扩容的空间这个方法是传统的扩容,那么,接下来,我们就来写一下上述代码中有关扩容操作的现代写法。
if (_n * 10 / _tables.size () >= 7 )
{
HashTable<K, V> newht;
newht._tables.resize (__stl_next_prime(_tables.size () + 1 ));
for (auto & data : _tables)
{
if (data._state == EXIST)
{
newht.Insert (data._kv);
}
}
_tables.swap (newht._tables);
}
以上就是我们所实现的扩容操作的现代写法,有的小伙伴在这里写这个现代写法时,产生了一些问题,就是在现代写法的代码中,我们是将原哈希表中的所有元素均插入到了新开创的哈希表中去,既然如此的话,有人就会问,在 newht 中难道就不会发生扩容操作吗(在实现插入操作时)?说实话,在将原哈希表中的所有元素 "移动" 到 newht 的过程中,确实不会再发生扩容了,因为 newht 的大小就是我们扩容之后的大小,这里是元素 "移动" 也就是说元素的个数是固定的,只是空间扩大为原来的近 2 倍的空间,那么这样的话,就算最后将所有的元素都 "移动" 结束之后,newht 中的负载因子的值最终也不会超过 0.6,因此 newht 是不会再进行扩容操作的;我们前面已经讲过了哈希表的结构了,一个哈希表的内部只有一个 vector 类类型的对象和一个 size_t 类型的变量,因此最后将原哈希表和 newht 中的顺序表交换一下即可。
1.6.2.4 查找一个数据 HashData<K, V>* Find (const K& key)
{
size_t hashi = key % _tables.size ();
while (_tables[hashi]._state != EMPTY)
{
if (_tables[hashi]._state == EXIST && _tables[hashi]._kv.first == key)
{
return &_tables[hashi];
}
hashi++;
hashi %= _tables.size ();
}
return nullptr ;
}
1.6.2.5 删除一个元素 bool Erase (const K& key)
{
HashData<K, V>* ret = Find (key);
if (ret == nullptr )
{
return false ;
}
else
{
ret->_state = DELETE;
return true ;
}
}
1.6.3 链地址法
1.6.3.1 解决冲突的思路
开放地址法中所有的元素都放到哈希表里,链地址法中所有的数据不再直接存储在哈希表中,哈希表中存储一个指针,没有数据映射这个位置时,这个指针为空,有多个数据映射到这个位置上时,我们把这些冲突的数据连接成一个链表,挂在哈希表的这个位置的下面,链地址法也叫做拉链法或者哈希桶。我们下面演示一下将 {24,13,5,96,30,17} 这组值映射到 M=11 的哈希表中:
1.6.3.2 扩容
开放定址法中负载因子必须小于 1,链地址法的负载因子就没有限制了,可以大于 1.负载因子越大,哈希冲突的概率越高,空间利用率就越高;负载因子越小,哈希冲突的概率就越低,空间利用率就越低;STL 中将 unordered_xxx 的最大负载因子基本控制在 1,大于 1 的话就扩容,我们后面再代码中也使用这个方式。
1.6.3.3 极端场景
如果极端场景下,某个桶特别长的话怎么办呢?其实我们这里可以考虑使用全域散列法,这样就不容易被针对了。但是假设不是被针对了,用了全域散列法,但是偶然情况下,某个桶很长,查找效率很低怎么办?这里在 Java8 的 HashMap 中当桶的长度超过一定阀值 (8) 时就把链表转换成红黑树。一般情况下,不断扩容,单个桶很长的场景还是比较少的,下面我们代码实现就不搞这么复杂了,这个解决极端场景的思路,大家了解一下。
通过我们上述对链地址法的讲解以及对哈希表的了解可知,我们这里的链地址法它是将所有的映射位置相同的元素都放在了同一个位置上,这样的话,我们在查找元素的时候,直接找到这个元素的映射位置就可以了,既然这样的话,那么我们这里的链地址法中的元素就和我们前面开放地址法中的元素时不同的,开放地址法中的 HashData 类中有一个枚举类型的变量,目的主要是去用于查找元素的,而对于这里的链地址法来说,HashData 类中是不需要那个枚举类型的变量,通过我们前面对链地址法的讲解可以得知,我们在 HashData 类中还需要有一个哈希元素的指针,因此,我们这里来重新写一下链地址法中的哈希表的元素节点(链地址法中的元素是单独作为一个节点由指针连接起来的)。
template <class K ,class V >
class HashNode
{
public :
pair<K, V> _kv;
HashNode<K, V>* _next;
HashNode (const pair<K, V>& kv) :_kv(kv),_next(nullptr ) { }
};
OK,有了上面的基础后,我们接下来用链地址法的方法来实现一下哈希表的一些基本操作,这个链地址法相对来说还是比较重要的,因为在实际的实现过程中,就是通过链地址法去实现的,因此这里需要我们重点掌握一下,在实现具体操作之前,我们这里先来实现一下哈希表的一个整体框架:
template <class K , class V , class Hash = HashFunc<K>, class KeyOfT, class Pred = equal_to<K>, class Alloc = allocator<K>>
class HashTable
{
public :
typedef HashNode<K, V> Node;
HashTable ()
{
_tables.resize (__stl_next_prime(_table.size () + 1 ), nullptr );
}
private :
vector<HashNode<K, V>*> _tables;
size_t _n = 0 ;
};
1.6.3.4 插入一个元素 bool Insert (const pair<K, V>& kv)
{
if (Find (kv.first))
{
return false ;
}
size_t hashi = kv.first % _tables.size ();
if (_n / _tables.size () == 1 )
{
HashTables<K, V> newht;
newht._tables.resize (__stl_next_prime(_tables.size () + 1 ));
for (size_t i = 0 ; i < _tables.size (); i++)
{
Node* cur = _tables[i];
while (cur)
{
newht.Insert (cur->_kv);
cur = cur->_next;
}
}
_tables.swap (newht._tables);
}
Node* newnode = new Node (kv);
newnode->_next = _tables[hashi];
_tables[hashi] = newnode;
++_n;
return true ;
}
OK,上述代码就是我们这里所实现的插入元素的代码,我们在其中写了一段扩容的代码,我们的扩容操作是开创了新的代码,就是我们在从旧单链表中找到元素,将找到的这个元素重新插入到 newht 这个哈希表中的这个操作,这里编译器是重新开创了一个与找到的那个元素一样大的空间,将这个新空间链接到 newht 哈希表中去。这样做的话,可以是可以,但是这样做的话,会导致空间的浪费,基于此,我们这里直接移动旧表的节点到新表,岂不更好,我们就上述方法来重新实现一下扩容操作:
if (_n / _tables.size () == 1 )
{
vector<Node*> newtables (__stl_next_prime(_tables.size() + 1 ), nullptr ) ;
for (size_t i = 0 ; i < _tables.size (); i++)
{
Node* cur = _tables[i];
while (cur)
{
Node* next = cur->_next;
size_t hashi = cur->_kv.first % _tables.size ();
cur->_next = newtables[hashi];
newtables[hashi] = cur;
cur = next;
}
_tables[i] = nullptr ;
}
_tables.swap (newtables);
}
1.6.3.5 查找一个元素 Node* Find (const K& key)
{
size_t hashi = key % _tables.size ();
Node* cur = _tables[hashi];
while (cur)
{
if (cur->_kv.first == key)
{
return cur;
}
else
{
cur = cur->_next;
}
}
return nullptr ;
}
1.6.3.6 删除一个元素 bool Erase (const K& key)
{
size_t hashi = key % _tables.size ();
Node* prev = nullptr ;
Node* cur = _tables[hashi];
while (cur)
{
if (cur->_kv.first == key)
{
if (prev == nullptr )
{
_tables[hashi] = cur->_next;
}
else
{
prev->_next = cur->_next;
}
delete cur;
--_n;
return true ;
}
prev = cur;
cur = cur->_next;
}
return false ;
}
1.6.4 质数表
我们前面的讲解中讲过质数表这个东西,前面只是浅浅地讲了一下,这里我来写一下质数表地这个代码吧,相信看过这个代码过后就明白了:
inline unsigned long __stl_next_prime(unsigned long n)
{
static const int __stl_num_primes = 28 ;
static const unsigned long __stl_prime_list[__stl_num_primes] =
{
53 , 97 , 193 , 389 , 769 , 1543 , 3079 , 6151 , 12289 , 24593 , 49157 , 98317 , 196613 , 393241 , 786433 , 1572869 , 3145739 , 6291469 , 12582917 , 25165843 , 50331653 , 100663319 , 201326611 , 402653189 , 805306457 , 1610612741 , 3221225473 , 4294967291
};
const unsigned long * first = __stl_prime_list;
const unsigned long * last = __stl_prime_list + __stl_num_primes;
const unsigned long * pos = lower_bound (first, last, n);
return pos == last ? *(last - 1 ) : *pos;
}
相信凭借大家现在地实力,要想看懂上述的一段代码其实并不难,甚至可以说丝毫没有压力,通过我们前面的讲解可知,我们每次进行扩容操作时,都是从质数表中,也就是上述代码中的 28 个质数中挑选出扩容的空间的个数,通过上述的代码我们可知,这里是通过 lower_bound 这个函数去找相应的扩容的值的,我们前面在 "map 和 set 的使用,相信我,超简单的!" 这篇文档中讲过,它是返回大于等于 val 的迭代器的,这里与其类似,上述代码中的 lower_bound 函数返回的是 [first,last] 这个区间中大于等于 n 的值,因为是大于等于,因此在传参时才需要我们多加 1,否则的话会达不到我们想要的效果。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
Gemini 图片去水印 基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
HTML转Markdown 将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online