C++ 哈希表详解：开散列与闭散列 | 极客日志

C++算法

C++ 哈希表详解：开散列与闭散列

C++ 中哈希表的核心概念，包括哈希函数设计（除法、乘法、全域散列）、负载因子及哈希冲突处理。重点讲解了两种解决冲突的方法：开放定址法（闭散列，含线性探测、二次探测、双重散列）和链地址法（开散列/哈希桶）。文章提供了闭散列与开散列的完整 C++ 代码实现，涵盖插入、查找、删除、扩容等关键操作，并讨论了素数表扩容策略及仿函数在类型转换中的应用。

芝士奶盖发布于 2026/3/27更新于 2026/7/2654 浏览

C++ 哈希表详解

1. 哈希的概念

哈希 (hash) 又称散列，是一种组织数据的方式。从译名来看，有散乱排列的意思。本质就是通过哈希函数把关键字 Key 跟存储位置建立一个映射关系，查找时通过这个哈希函数计算出 Key 存储的位置，进行快速查找。

1.1 直接定址法

当关键字的范围比较集中时，直接定址法就是非常简单高效的方法。比如一组关键字都在 [0,99] 之间，那么我们开一个 100 个数的数组，每个关键字的值直接就是存储位置的下标。再比如一组关键字值都在 [a,z] 的小写字母，那么我们开一个 26 个数的数组，每个关键字 ascii 码 -a ascii 码就是存储位置的下标。

也就是说直接定址法本质就是用关键字计算出一个绝对位置或者相对位置。

直接定址法的缺点也非常明显：当关键字的范围比较分散时，就很浪费内存甚至内存不够用。

假设我们只有数据范围是 [0, 9999] 的 N 个值，我们要映射到一个 M 个空间的数组中 (一般情况下 M >= N)，那么就要借助哈希函数 (hash function) hf，关键字 key 被放到数组的 h(key) 位置，这里要注意的是 h(key) 计算出的值必须在 [0, M) 之间。

1.2 哈希冲突

这里存在的一个问题就是，两个不同的 key 可能会映射到同一个位置去，这种问题我们叫做哈希冲突，或者哈希碰撞。

理想情况是找出一个好的哈希函数避免冲突，但是实际场景中，冲突是不可避免的，所以我们尽可能设计出优秀的哈希函数，减少冲突的次数，同时也要去设计出解决冲突的方案。

1.3 负载因子

假设哈希表中已经映射存储了 N 个值，哈希表的大小为 M，那么负载因子 = N/M（M 分之 N），负载因子越大，哈希冲突的概率越高，空间利用率越高；负载因子越小，哈希冲突的概率越低，空间利用率越低。

负载因子的大小最好是 <=0.7。

1.4 哈希函数

一个好的哈希函数应该让 N 个关键字被等概率的均匀的散列分布到哈希表的 M 个空间中，但是实际中却很难做到，但是我们要尽量往这个方向去考量设计。

1.4.1 除法散列法/除留余数法

除法散列法也叫做除留余数法，顾名思义，假设哈希表的空间大小为 M，那么通过 Key%M k*ey(数据个数) 除以 M(表的空间大小）得到的余数作为映射位置的下标。也就是哈希函数为：h(key) = key % M
当使用除法散列法时，要避免 M 为某些值，如 2 的冥，10 的冥等。如果是 2X，那么 key % 本质相当于保留 key 的后 X 位，那么后 x 位相同的值，计算出的哈希值都是一样的，就冲突了。如：{63 , 31} 看起来没有关联的值，如果 M 是 16，也就是 2^4，那么计算出的哈希值都是 15，因为 63 的二进制后 8 位是 00111111，31 的二进制后 8 位是 00011111。如果是 10X，就更明显了，保留的都是 10 进值的后 x 位，如：{112, 12312}，如果 M 是 100，也就是 10^2，那么计算出的哈希值都是 12。
当使用除法散列法时，建议 M 取不太接近 2 的整数次幂的一个质数 (素数)。

1.4.2 乘法散列法

乘法散列法对哈希表大小 M 没有要求，他的大思路第一步： a. 用关键字 K 乘上常数 A (0<A<1)，并抽取出 kA 的小数部分 b. 再用 M 乘以 kA 的小数部分，再向下取整本质就是用 M*(0~1) 之间的小数
h(key) = floor(M × ((A × key)%1.0)) ，其中 floor 表示对表达式进行下取整，A∈(0,1)，这里最重要的是 A 的值应该如何设定，Knuth 认为 A = (√5 − 1)/2 = 0.6180339887.... (黄金分割点) 比较好
乘法散列法对哈希表大小 M 是没有要求的，假设 M 为 1024，key 为 1234，A = 0.6180339887, Akey= 762.6539420558，取小数部分为 0.6539420558, M×((A×key)%1.0) = 0.65394205581024 =669.6366651392，那么 h(1234) = 669

1.4.3 全域散列法

如果存在一个恶意的对手，他针对我们提供的散列函数，特意构造出一个发生严重冲突的数据集。比如，让所有关键字全部落入同一个位置中。这种情况是可以存在的，只要散列函数是公开且确定的，就可以实现此攻击。解决方法自然是见招拆招，给散列函数增加随机性，攻击者就无法找出确定可以导致最坏情况的数据。这种方法叫做全域散列。
hab (key) = ((a × key + b)%P)%M，P 需要选一个足够大的质数，a 可以随机选 [1,P-1] 之间的任意整数，b 可以随机选 [0,P-1] 之间的任意整数，这些函数构成了一个 P*(P-1) 组全域散列函数组。假设 P=17，M=6，a = 3，b = 4, 则 h34 (8) = ((3 × 8 + 4)%17)%6 = 5

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

//定义一个枚举来记录数组的三个状态
enum State { EXIST,//存在 EMPTY,//空 DELETE//删除 };
template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    State _state = EMPTY;//状态为空
};
template<class K, class V>
class HashTable {
public:
private:
    vector<HashData<K, V>> _tables;//表的空间大小
    size_t _n; // 记录数据个数
};

//素数表
inline unsigned long __stl_next_prime(unsigned long n) {
    // Note: assumes long is at least 32 bits.
    static const int __stl_num_primes = 28;
    static const unsigned long __stl_prime_list[__stl_num_primes] = {
        53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
        49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
        6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
        402653189, 805306457, 1610612741, 3221225473, 4294967291
    };
    const unsigned long* first = __stl_prime_list;
    const unsigned long* last = __stl_prime_list + __stl_num_primes;
    const unsigned long* pos = lower_bound(first, last, n);
    return pos == last ? *(last - 1) : *pos;
}

//扩容
// 负载因子 >= 0.7 扩容 n/m 数据个数/表的空间大小
//为了方便计算分子 n*10
if (_n * 10 / _tables.size() >= 7) {
    //创建一个新的哈希表 newht 哈希表里本来就有 vector
    HashTable<K, V> newht;
    //*2 是无法一直保持素数的
    //newht._tables.resize(_tables.size() * 2);
    //使用素数表来获取比素数表的值大一点的值
    newht._tables.resize(__stl_next_prime(_tables.size() + 1));
    for (auto& data : _tables) {
        // 遍历旧表，旧表的数据映射到新表
        if (data._state == EXIST) {
            //使用新对象去调用插入，把旧表的数据插入到新表
            newht.Insert(data._kv);
        }
    }
    //交换新旧表的空间
    _tables.swap(newht._tables);
}

bool Insert(const pair<K, V>& kv) {
    //如果值已经存在
    if (Find(kv.first)) return false;
    Hash hash;//仿函数，用于转换成为无符号整形
    //插入值之后从起始位置 hash0 去用插入的值对表的大小取模算出值对应的位置
    size_t hash0 = hash(kv.first) % _tables.size();//hash0 是第一次算出来的位置
    size_t hashi = hash0;
    size_t i = 1;
    int flag = 1;
    while (_tables[hashi]._state == EXIST)//如果 hashi 的状态为存在
    {
        //进行线性探测
        //如果到达表的最后一个位置那么就模一下表的空间大小
        hashi = (hash0 + i) % _tables.size();
        ++i;
        //二次探测
        /*hashi = (hash0 + (i*i*flag)) % _tables.size();
        if (hashi < _tables.size()) hashi += _tables.size();
        if (flag == 1) {
            flag = -1;
        } else {
            ++i;
            flag = 1;
        }*/
    }
    //当遇到空的位置就插入
    _tables[hashi].kv = kv;
    _tables[hashi]._state = EXIST;//将插入的位置标记为存在
    ++_n;
    return true;
}

HashData<K, V>* Find(const K& key) {
    Hash hash;
    size_t hash0 = hash(key) % _tables.size();
    size_t hashi = hash0;
    size_t i = 1;
    while (_tables[hashi]._state != EMPTY) {
        if (_tables[hashi]._state == EXIST//如果状态是存在并且是那个值
            && _tables[hashi]._kv.first == key) {
            return &_tables[hashi];
        }
        // 线性探测
        hashi = (hash0 + i) % _tables.size();
        ++i;
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashData<K, V>* ret = Find(key);
    if (ret) {
        ret->_state = DELETE;
        return true;
    } else {
        return false;
    }
}

//定义一个枚举来记录数组的三个状态
enum State { EXIST,//存在 EMPTY,//空 DELETE//删除 };
template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    State _state = EMPTY;//状态为空
};
template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};
/* 1. 将 string 类型转换成无符号整形 (BKDR_Hash)
   2. 字符串转换成整形，可以把字符 ascii 码相加即可
   3. 但是直接相加的话，类似"abcd"和"bcad"这样的字符串计算出是相同的
   4. 这里我们使用 BKDR 哈希的思路，用上次的计算结果去 乘以一个质数，这个质数一般去 31, 131 等效果会比较好 */
template<>
struct HashFunc<string> {
    size_t operator()(const string& s) {
        // BKDR
        size_t hash = 0;
        for (auto ch : s) {
            hash += ch;
            hash *= 131;
        }
        return hash;
    }
};

inline unsigned long __stl_next_prime(unsigned long n) {
    // Note: assumes long is at least 32 bits.
    static const int __stl_num_primes = 28;
    static const unsigned long __stl_prime_list[__stl_num_primes] = {
        53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
        49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
        6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
        402653189, 805306457, 1610612741, 3221225473, 4294967291
    };
    const unsigned long* first = __stl_prime_list;
    const unsigned long* last = __stl_prime_list + __stl_num_primes;
    const unsigned long* pos = lower_bound(first, last, n);
    return pos == last ? *(last - 1) : *pos;
}

namespace open_address//开发定址法
{
    //加上一个仿函数 Hash，用于转换成为无符号整形
    template<class K, class V, class Hash = HashFunc<K>>
    class HashTable {
    public:
        HashTable() :_tables(__stl_next_prime(0))//给一个 0 去获取>=0 的素数
            , _n(0)//数据个数 {}

        bool Insert(const pair<K, V>& kv) {
            //如果值已经存在
            if (Find(kv.first)) return false;
            //扩容
            // 负载因子 >= 0.7 扩容 n/m 数据个数/表的空间大小
            //为了方便计算分子 n*10
            if (_n * 10 / _tables.size() >= 7) {
                //创建一个新的哈希表 newht 哈希表里本来就有 vector
                HashTable<K, V> newht;
                //*2 是无法一直保持素数的
                //newht._tables.resize(_tables.size() * 2);
                //使用素数表来获取比素数表的值大一点的值
                newht._tables.resize(__stl_next_prime(_tables.size() + 1));
                for (auto& data : _tables) {
                    // 遍历旧表，旧表的数据映射到新表
                    if (data._state == EXIST) {
                        //使用新对象去调用插入，把旧表的数据插入到新表
                        newht.Insert(data._kv);
                    }
                }
                //交换新旧表的空间
                _tables.swap(newht._tables);
            }
            Hash hash;//仿函数，用于转换成为无符号整形
            //插入值之后从起始位置 hash0 去用插入的值对表的大小取模算出值对应的位置
            size_t hash0 = hash(kv.first) % _tables.size();//hash0 是第一次算出来的位置
            size_t hashi = hash0;
            size_t i = 1;
            int flag = 1;
            while (_tables[hashi]._state == EXIST)//如果 hashi 的状态为存在
            {
                //进行线性探测
                //如果到达表的最后一个位置那么就模一下表的空间大小
                hashi = (hash0 + i) % _tables.size();
                ++i;
                //二次探测
                /*hashi = (hash0 + (i*i*flag)) % _tables.size();
                if (hashi < _tables.size()) hashi += _tables.size();
                if (flag == 1) {
                    flag = -1;
                } else {
                    ++i;
                    flag = 1;
                }*/
            }
            //当遇到空的位置就插入
            _tables[hashi].kv = kv;
            _tables[hashi]._state = EXIST;//将插入的位置标记为存在
            ++_n;
            return true;
        }

        HashData<K, V>* Find(const K& key) {
            Hash hash;
            size_t hash0 = hash(key) % _tables.size();
            size_t hashi = hash0;
            size_t i = 1;
            while (_tables[hashi]._state != EMPTY) {
                if (_tables[hashi]._state == EXIST//如果状态是存在并且是那个值
                    && _tables[hashi]._kv.first == key) {
                    return &_tables[hashi];
                }
                // 线性探测
                hashi = (hash0 + i) % _tables.size();
                ++i;
            }
            return nullptr;
        }

        bool Erase(const K& key) {
            auto* ret = Find(key);
            if (ret) {
                ret->_state = DELETE;
                return true;
            }
            return false;
        }

    private:
        vector<HashData<K, V>> _tables;//表的空间大小
        size_t _n; // 记录数据个数
    };
}

//将普通类型转换成无符号整形
template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};
/* 1. 将 string 类型转换成无符号整形 (BKDR_Hash)
   2. 字符串转换成整形，可以把字符 ascii 码相加即可
   3. 但是直接相加的话，类似"abcd"和"bcad"这样的字符串计算出是相同的
   4. 这里我们使用 BKDR 哈希的思路，用上次的计算结果去 乘以一个质数，这个质数一般去 31, 131 等效果会比较好 */
template<>
struct HashFunc<string> {
    size_t operator()(const string& s) {
        // BKDR
        size_t hash = 0;
        for (auto ch : s) {
            hash += ch;
            hash *= 131;
        }
        return hash;
    }
};

namespace hash_bucket//哈希桶
{
    template<class K, class V>
    struct HashNode//给一个节点用来挂节点
    {
        pair<K, V> _kv;
        HashNode<K, V>* _next;
        HashNode(const pair<K, V>& kv) :_kv(kv), _next(nullptr) {}
    };

    template<class K, class V, class Hash = HashFunc<K>>
    class HashTable {
        typedef HashNode<K, V> Node;
    public:
        //构造
        HashTable() :_tables(11), _n(0) {}
    private:
        vector<Node*> _tables; // 指针数组
        size_t _n = 0;// 表中存储数据个数
    };
}

bool Insert(const pair<K, V>& kv) {
    Hash hs;
    size_t hashi = kv.first % _tables.size();
    // 头插
    //让新节点变成哈希表里的第一个也就是说要让哈希表里存储新节点的地址
    Node* newnode = new Node(kv);//创建一个新节点 new Node
    //将新节点的下一个节点指向原来的第一个节点的地址
    //第一个节点的地址在哈希表里
    newnode->_next = _tables[hashi];
    _tables[hashi] = newnode;//再把新节点给与_tables[hashi] 里存储的指针
    ++_n;
    return true;
}

// 负载因子 == 1 时扩容
if (_n == _tables.size()) {
    vector<Node*> newTatble(_tables.size() * 2);
    //遍历旧表
    for (size_t i = 0; i < _tables.size(); i++) {
        Node* cur = _tables[i];
        while (cur) {
            Node* next = cur->_next;
            // 旧表数据头插到新表
            size_t hashi = cur->_kv.first % newTatble.size();
            cur->_next = newTatble[hashi];
            newTatble[hashi] = cur;
            cur = next;
        }
        //交换
        _tables[i] = nullptr;
    }
    _tables.swap(newTatble);
}

Node* Find(const K& key) {
    Hash hash;
    size_t hashi = hash(key) % _tables.size();
    Node* cur = _tables[hashi];
    while (cur) {
        if (cur->_kv.first == key) {
            return &cur->_kv.first;
        } else {
            cur = cur->_next;
        }
    }
    return nullptr;
}

bool Erase(const K& key) {
    Hash hash;
    size_t hashi = hash(key) % _tables.size();
    Node* cur = _tables[hashi];
    Node* prev = nullptr;
    while (cur) {
        if (cur->_kv.first == key) {
            if (prev == nullptr) {
                _tables[hashi] = cur->_next;
            } else {
                prev->_next = cur->_next;
            }
            delete cur;
            return true;
        } else {
            prev = cur;
            cur = cur->_next;
        }
    }
    return false;
}

namespace hash_bucket//哈希桶
{
    template<class K, class V>
    struct HashNode//给一个节点用来挂节点
    {
        pair<K, V> _kv;
        HashNode<K, V>* _next;
        HashNode(const pair<K, V>& kv) :_kv(kv), _next(nullptr) {}
    };

    template<class K, class V, class Hash = HashFunc<K>>
    class HashTable {
        typedef HashNode<K, V> Node;
    public:
        //构造
        HashTable() :_tables(11), _n(0) {}

        bool Insert(const pair<K, V>& kv) {
            // 负载因子 == 1 时扩容
            if (_n == _tables.size()) {
                vector<Node*> newTatble(_tables.size() * 2);
                //遍历旧表
                for (size_t i = 0; i < _tables.size(); i++) {
                    Node* cur = _tables[i];
                    while (cur) {
                        Node* next = cur->_next;
                        // 旧表数据头插到新表
                        size_t hashi = cur->_kv.first % newTatble.size();
                        cur->_next = newTatble[hashi];
                        newTatble[hashi] = cur;
                        cur = next;
                    }
                    //交换
                    _tables[i] = nullptr;
                }
                _tables.swap(newTatble);
            }
            size_t hashi = kv.first % _tables.size();
            // 头插
            //让新节点变成哈希表里的第一个也就是说要让哈希表里存储新节点的地址
            Node* newnode = new Node(kv);//创建一个新节点 new Node
            //将新节点的下一个节点指向原来的第一个节点的地址
            //第一个节点的地址在哈希表里
            newnode->_next = _tables[hashi];
            _tables[hashi] = newnode;//再把新节点给与_tables[hashi] 里存储的指针
            ++_n;
            return true;
        }

        Node* Find(const K& key) {
            Hash hash;
            size_t hashi = hash(key) % _tables.size();
            Node* cur = _tables[hashi];
            while (cur) {
                if (cur->_kv.first == key) {
                    return &cur->_kv.first;
                } else {
                    cur = cur->_next;
                }
            }
            return nullptr;
        }

        bool Erase(const K& key) {
            Hash hash;
            size_t hashi = hash(key) % _tables.size();
            Node* cur = _tables[hashi];
            Node* prev = nullptr;
            while (cur) {
                if (cur->_kv.first == key) {
                    if (prev == nullptr) {
                        _tables[hashi] = cur->_next;
                    } else {
                        prev->_next = cur->_next;
                    }
                    delete cur;
                    return true;
                } else {
                    prev = cur;
                    cur = cur->_next;
                }
            }
            return false;
        }

    private:
        vector<Node*> _tables; // 指针数组
        size_t _n = 0;// 表中存储数据个数
    };
}

C++ 哈希表详解：开散列与闭散列

C++ 哈希表详解

1. 哈希的概念

1.1 直接定址法

1.2 哈希冲突

1.3 负载因子

1.4 哈希函数

1.4.1 除法散列法/除留余数法

1.4.2 乘法散列法

1.4.3 全域散列法

更多推荐文章

相关免费在线工具

1.5 处理哈希冲突

1.5.1 开放定址法（闭散列）

1. 线性探测（挨着查找）

2. 二次探测（跳跃着查找）

3. 双重散列

2. 闭散列实现哈希表

2.1 开发地址法的基础构架

2.2 扩容

2.3 插入

2.4 查找

2.5 删除

2.6 闭散列代码

3. key 不能取模的问题

4. 链地址法（开散列/哈希桶）

4.1 链地址法的基础框架

4.2 插入

4.3 扩容

4.4 查找

4.5 删除

4.6 开散列代码

更多推荐文章

相关免费在线工具

C++ 哈希表详解：开散列与闭散列

C++ 哈希表详解

1. 哈希的概念

1.1 直接定址法

1.2 哈希冲突

1.3 负载因子

1.4 哈希函数

1.4.1 除法散列法/除留余数法

1.4.2 乘法散列法

1.4.3 全域散列法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.5 处理哈希冲突

1.5.1 开放定址法（闭散列）

1. 线性探测（挨着查找）

2. 二次探测（跳跃着查找）

3. 双重散列

2. 闭散列实现哈希表

2.1 开发地址法的基础构架

2.2 扩容

2.3 插入

2.4 查找

2.5 删除

2.6 闭散列代码

3. key 不能取模的问题

4. 链地址法（开散列/哈希桶）

4.1 链地址法的基础框架

4.2 插入

4.3 扩容

4.4 查找

4.5 删除

4.6 开散列代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具