Java：关于哈希表

直接定制法：取关键字的某个线性函数为散列地址：Hash（Key）= A*Key + B 。优点是简单、均匀。缺点是需要事先知道关键字的分布情况使用场景：适合查找比较小且连续的情况
除留余数法：设散列表中允许的地址数为m，取一个不大于m，但最接近或者等于m的质数p作为除数，按照哈希函数： Hash(key) = key% p(p<=m),将关键码转换成哈希地址
负载因子调节，这个下面会重点讲解

其他的方法还有：平方取中法、折叠法、随机数法、数学分析法等，感兴趣的话可以了解一下。

负载因子调节

产生冲突的概率叫做冲突率，已知哈希表中已有的关键字个数是不变的，那么我们能调整的就只有哈希表中的数组的大小。

Java中负载因子的值为0.75，即当填入表中的元素个数 / 散列表的长度 > 0.75时。产生冲突的概率会很大，这时候我们就要来解决冲突。

冲突的解决

解决哈希冲突两种常见的方法是：闭散列和开散列

闭散列：当发生哈希冲突时，如果哈希表未被装满，说明在哈希表中必然还有空位置，那么可以把key存放到冲突位置中的“下一个” 空位置中去。

开散列：开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。

这里主要用的是通过开散列(哈希桶)来解决冲突

从上图可以看出，开散列中每个桶中放的都是发生哈希冲突的元素。

开散列，可以认为是把一个在大集合中的搜索问题转化为在小集合中做搜索了。

哈希桶的实现

从上图哈希桶图所示，我们可以把它看成是数组+链表的形式，这样我们就可以定义相关变量了。

//定义相关变量 static class Node{ public int val; public int key; public Node next; public Node(int val, int key){ this.val = val; this.key = key; } public Node[] elem = new Node[10]; public int useSize; }

插入数据

插入数据的第一步是要在数组中找到它所在的位置，然后进行链表的插入，头插法

public void push(int key, int val){ int index = key % array.length; Node cur = array[index]; while(cur != null){ if(cur.key == key){ cur.val = val; return; } cur = cur.next; } //没有找到当前链表中有这个key的节点 //头插法 Node node = new Node(val, key); node.next = array[index]; array[index] = node; useSize++; }

不过，这里有个重点，要注意负载因子，计算负载因子。

以代码的数据为例，如果数组中的所放数据个数大于7，那么就会有很大概率产生冲突，这时我们要解决冲突，就要对哈希表进行扩容，这里并不是简单地把数组扩大两倍，在扩大后还要把前面整个数组的数据遍历一遍，然后再次进行对应位置的存储。

像是没扩容之前，array[4] 中可能放着 4和14两个数据，现在数组长度从10扩容到20，那么4还应该放在array[4]里面，而14应该放在array[14]里面。

故要包括扩容以及再次哈希来进行

插入完整代码如下

public void push(int key, int val){ int index = key % array.length; Node cur = array[index]; while(cur != null){ if(cur.key == key){ cur.val = val; return; } cur = cur.next; } //没有找到当前链表中有这个key的节点 //头插法 Node node = new Node(val, key); node.next = array[index]; array[index] = node; useSize++; if(doLoadFactor() >= DEFAULT_LOAD_FACTOR){ //扩容 resize(); } } public void resize(){ //array = Arrays.copyOf(array, 2*array.length); Node[] newArray = new Node[2*array.length]; for (int i = 0; i < array.length; i++) { Node cur = array[i]; while(cur != null){ int newIndex = cur.key % newArray.length; Node curN = cur.next; cur.next = newArray[newIndex]; newArray[newIndex] = cur; cur = curN; } } array = newArray; } private double doLoadFactor() { return useSize*1.0 / array.length; }

注意：这里的 DEFAULT_LOAD_FACTOR 是在定义在相关变量里的，其完整代码为：

//定义相关变量 static class Node{ public int val; public int key; public Node next; public Node(int val, int key){ this.val = val; this.key = key; } public Node[] elem = new Node[10]; public int useSize; public static final double DEFAULT_LOAD_FACTOR = 0.75f; }

这里我们可以简单进行调试，

Test类代码为：

public class Test { public static void main(String[] args) { HashBusk hashBusk = new HashBusk(); hashBusk.push(1, 9); hashBusk.push(11, 9); hashBusk.push(14, 9); hashBusk.push(4, 9); hashBusk.push(2, 9); hashBusk.push(15, 9); hashBusk.push(6, 9); hashBusk.push(5, 9); } }

调试的断点放在了第7个数的位置，因为再往下走需要进行扩容了，可以看到代码是按照上面的数组+链表的方式进行存储的。

然后是扩容的部分

可以看到，扩容后数组的长度来到15，证明扩容部分也是可以正常进行的。

getVal方法

通过key的值，来得到val值，这部分代码，其实和插入里部分代码有些相同的部分:

通过key值来找到数据的位置，如果相同返回val值，没找到返回-1。

public int getVal(int key){ int index = key % array.length; Node cur = array[index]; while(cur != null) { if(cur.key == key){ return cur.val; } cur = cur.next; } return -1; }

完整代码

public class HashBusk { //定义相关变量 static class Node { public int val; public int key; public Node next; public Node(int val, int key) { this.val = val; this.key = key; } } public Node[] array = new Node[10]; public int useSize; public static final double DEFAULT_LOAD_FACTOR = 0.75f; public void push(int key, int val){ int index = key % array.length; Node cur = array[index]; while(cur != null){ if(cur.key == key){ cur.val = val; return; } cur = cur.next; } //没有找到当前链表中有这个key的节点 //头插法 Node node = new Node(val, key); node.next = array[index]; array[index] = node; useSize++; if(doLoadFactor() >= DEFAULT_LOAD_FACTOR){ //扩容 resize(); } } public void resize(){ Node[] newArray = new Node[2*array.length]; for (int i = 0; i < array.length; i++) { Node cur = array[i]; while(cur != null){ int newIndex = cur.key % newArray.length; Node curN = cur.next; cur.next = newArray[newIndex]; newArray[newIndex] = cur; cur = curN; } } array = newArray; } private double doLoadFactor() { return useSize*1.0 / array.length; } public int getVal(int key){ int index = key % array.length; Node cur = array[index]; while(cur != null) { if(cur.key == key){ return cur.val; } cur = cur.next; } return -1; } }

Java：关于哈希表

Ne0inhk

哈希表

概念

冲突

负载因子调节

冲突的解决

哈希桶的实现

完整代码

Read more

Flutter 三方库 jwt_io 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、全能的 JSON Web Token (JWT) 加解密与身份安全验证引擎

Ubuntu 22.04 中禁用 `unattended-upgrades` 完全指南

【Linux 网络】理解并应用应用层协议：HTTP（附简单HTTP服务器C++代码）

Flutter 三方库 http_core_client 的鸿蒙化适配指南 - 打造极简、健壮的 OpenHarmony 网络请求核心组件