C++ 哈希表原理及开放寻址与链地址法实现

一、哈希表的使用

代码用法几乎与 map 和 set 一样。

区别：

哈希表为单向迭代器
哈希表遍历为无序
哈希表增删查改为 O(1)

同样支持 multi 的键值冗余。

二、基本概念

哈希表本质：通过哈希函数将 N 个值映射到 M 个值中（M >= N）
直接定址法：关键字集中，不用哈希函数。如：将英文字母映射成数字，记录在数组中统计字母出现个数。
哈希碰撞：不同值，但是映射到相同位置。
负载因子：N/M。

三、哈希函数

好的哈希函数可以让 N 尽可能均匀分布在 M 中。

1. 除法散列法（除留余数法）

H(key) = key % M

M 应避免为某些值如 2 的幂，10 的幂。

2 的幂：设 m 为 2^k，那么余数只会为 m 的最低 k 位比特，造成大量冲突。
10 的幂：同理，余数位 m 的 k 位，造成冲突。

2. 乘法散列法

对哈希表的大小 M 没有要求。取 kA（0<A<1）的小数部分，再M（按比例映射）。A 可以取根号 5-1/2(黄金分割数)。

3. 全域散列法

为防止固定的哈希函数的服务器被攻击，新增两个随机数 a,b。 ((a*k+b)%p)%M 其中，p 为较大的质数，a，b 为随机整数 (a 为 [1,p-1],b 为 [0,p-1))。在任务开始前随机选取，但再映射，查找时 a,b 值不变。

四、开放寻址法哈希表

1. 枚举状态

enum state { EXIST, EMPTY, DELETE };

为什么要有 DELETE 状态？ 原因：表大小为 11，如果插入 12（->1）,23(->1,冲突，->2)。我们删除 12，如果直接将 1 的状态设置为 empty，那我们查找 23 时，会找到 1，发现为 empty，就会返回找不到，但实际上时有 23 的。

2. 成员，初始化

template<class K,class V> struct hashdata { 
    std::pair<K, V> _kv; 
    state _state=EMPTY; 
}; 

template<class K, class V> class hash { 
public: 
    hash() :_tables(23) ,_n(0) { } 
private: 
    std::vector<hashdata<K, V>> _tables; 
     _n; 
};

C++ 哈希表原理及开放寻址与链地址法实现

一、哈希表的使用

二、基本概念

三、哈希函数

1. 除法散列法（除留余数法）

2. 乘法散列法

3. 全域散列法

四、开放寻址法哈希表

1. 枚举状态

2. 成员，初始化

更多推荐文章

相关免费在线工具

3. 插入

4. 扩容

5. 质数处理

6. Find

7. 转无符号整型

8. 自定义类和哈希函数

五、链地址法实现

1. 节点定义

2. 插入加扩容

3. 查询和删除

六、哈希表其它接口

七、封装和模拟实现

1. 迭代器成员声明

2. 迭代器成员函数

3. 迭代器++

4. 封装

更多推荐文章

相关免费在线工具

C++ 哈希表原理及开放寻址与链地址法实现

一、哈希表的使用

二、基本概念

三、哈希函数

1. 除法散列法（除留余数法）

2. 乘法散列法

3. 全域散列法

四、开放寻址法哈希表

1. 枚举状态

2. 成员，初始化

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 插入

4. 扩容

5. 质数处理

6. Find

7. 转无符号整型

8. 自定义类和哈希函数

五、链地址法实现

1. 节点定义

2. 插入加扩容

3. 查询和删除

六、哈希表其它接口

七、封装和模拟实现

1. 迭代器成员声明

2. 迭代器成员函数

3. 迭代器++

4. 封装

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具