C++ 哈希表模拟实现：闭散列与冲突处理 | 极客日志

C++算法

C++ 哈希表模拟实现：闭散列与冲突处理

深入探讨了 C++ 哈希表的闭散列实现技术。重点讲解了线性探测法处理哈希冲突的原理，包括插入、查找及伪删除机制。详细分析了负载因子对性能的影响及扩容策略，并针对不同类型 Key（如 string、自定义结构体）提供了哈希函数设计方案，包含 BKDR 算法及模板特化应用。通过完整的代码模拟，展示了基于 vector 的哈希表构建流程及关键细节。

王者发布于 2026/3/21更新于 2026/6/2524 浏览

C++ 哈希表模拟实现：闭散列与冲突处理

在之前的讨论中，我们简要介绍了哈希方法及哈希表的基础概念。今天我们将深入探讨如何利用闭散列技术有效解决哈希冲突，并通过模拟实现哈希表的过程，解析这一关键技术。

线性探测示意图

一、闭散列基础

闭散列（Open Addressing）：也叫开放定址法。当发生哈希冲突时，如果哈希表未被装满，说明在哈希表中必然还有空位置，那么可以把 key 存放到冲突位置中的'下一个'空位置中去。

这种方式的核心逻辑是：如果我的位置没有了，就需要去抢夺别人位置，直到找到空位为止。

1.1 线性探测

这是闭散列中最常用的一种办法。

场景: 现在需要插入元素 44，先通过哈希函数计算哈希地址，hashAddr 为 4，因此 44 理论上应该插在该位置，但是该位置已经放了值为 4 的元素，即发生哈希冲突。

线性探测：从发生冲突的位置开始，依次向后探测，直到寻找到下一个空位置为止。

操作方面

插入: 通过哈希函数获取待插入元素在哈希表中的位置。如果该位置中没有元素则直接插入新元素；如果该位置中有元素发生哈希冲突，使用线性探测找到下一个空位置，插入新元素。
删除: 采用闭散列处理哈希冲突时，不能随便物理删除哈希表中已有的元素。若直接删除元素会影响其他元素的搜索。比如删除元素 4，如果直接删除掉，44 查找起来可能会受影响（因为查找 44 时会经过 4 的位置）。因此线性探测采用标记的伪删除法来删除一个元素。

状态标记

由于采用闭散列处理哈希冲突，如果直接删除元素会影响其他元素查找，同时在插入数据中我们需要一个状态标识判断该位置是否存在数据，是否可以在该位置进行插入逻辑。同时需要注意删除元素设置状态应该为删除，而不是为空，以满足实际的状态需求。

enum State { EMPTY, EXIST, DELETE };

二、实现哈希表

2.1 哈希基本构架

哈希是通过哈希函数使得元素的存储位置与它的关键码之间能够建立一一映射的关系，需要使用 pair<K, V> 类型进行存储。采用 vector 作为底层逻辑，存储元素类型为哈希节点类型 HashData<K, V>。

这里不采用 size 作为哈希表中有效元素个数，考虑到容器中结构的差异性，是由于 _size 一般用于序列式容器中表示有效元素个数，在关联式容器中命名约定一般规定 _n 作为记录有效元素个数。

template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    State _state = EMPTY;
};

template<class K, class >
  {
:
:
    vector<HashData<K, V>> _tables;
     _n = ;
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

bool Insert(const pair<K, V>& kv) {
    size_t hashi = kv.first % _tables.size();
    // 如何判断是否删除，是否继续查找，通过标记
    while (_tables[hashi]._state == EXIST) {
        hashi++;
        hashi %= _tables.size();
    }
    _tables[hashi]._kv = kv;
    _tables[hashi]._state = EXIST;
    _n++;
    return true;
}

bool Insert(const pair<K, V>& kv) {
    // 建立在空间充足及其目前不存在该数据基本上
    size_t hashi = kv.first % _tables.size();
    
    // 扩容逻辑，这里涉及到负载因子拉
    if (_n * 10 / _tables.size() >= 7) {
        HashTable<K, V> NewHT;
        // 插入逻辑，但是这里我们选择复用，不用我们去判断
        NewHT._tables.resize(_tables.size() * 2);
    }
    
    // 如何判断是否删除，是否继续查找，通过标记
    while (_tables[hashi]._state == EXIST) {
        hashi++;
        hashi %= _tables.size();
    }
    _tables[hashi]._kv = kv;
    _tables[hashi]._state = EXIST;
    _n++;
    return true;
}

HashData<K, V>* Find(const K& key) {
    size_t hashi = key % _tables.size();
    // 这里本身就是一个循环判断语句
    while (_tables[hashi]._state == EXIST) {
        if (key == _tables[hashi]._kv.first && _tables[hashi]._state == EXIST) {
            return &_tables[hashi];
        }
        hashi++;
        hashi %= _tables.size();
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashData<K, V>* ret = Find(key);
    if (ret) {
        ret->_state = DELETE;
        _n--;
        return true;
    } else {
        return false;
    }
}

// BKDR 算法核心思想示例
size_t hash = 0;
for (auto ch : key) {
    hash *= 131; 
    hash += ch;
}
return hash;

template<>
struct HashFunc<string> {
    size_t operator()(const string& key) {
        size_t hash = 0;
        for (auto ch : key) {
            hash *= 131;
            hash += ch;
        }
        return hash;
    }
};

struct Person {
    string _name;
    int _age;
};

#pragma once
#include <iostream>
using namespace std;
#include <vector>

template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<>
struct HashFunc<string> {
    size_t operator()(const string& key) {
        size_t hash = 0;
        for (auto ch : key) {
            hash *= 131;
            hash += ch;
        }
        return hash;
    }
};

namespace HashTable {
    enum State { EMPTY, EXIST, DELETE };

    template<class K, class V>
    struct HashData {
        pair<K, V> _kv;
        State _state = EMPTY;
    };

    template<class K, class V, class Hash = HashFunc<K>>
    class HashTable {
    public:
        // 这里只能构造成空的容器，等待数据插入。我们需要进入的元素是 pair 类型，K 和 V 是明面上的
        HashTable() {
            // 避免 size 和 capacity 问题
            _tables.resize(10);
        }

        bool Insert(const pair<K, V>& kv) {
            if (Find(kv.first) != nullptr) {
                return false;
            }
            Hash hs;
            // 建立在空间充足及其目前不存在该数据基本上
            size_t hashi = hs(kv.first) % _tables.size();
            
            // 扩容逻辑，这里涉及到负载因子拉
            if (_n * 10 / _tables.size() >= 7) {
                HashTable<K, V> NewHT;
                // 插入逻辑，但是这里我们选择复用，不用我们去判断
                NewHT._tables.resize(_tables.size() * 2);
            }
            
            // 如何判断是否删除，是否继续查找，通过标记
            while (_tables[hashi]._state == EXIST) {
                hashi++;
                hashi %= _tables.size();
            }
            _tables[hashi]._kv = kv;
            _tables[hashi]._state = EXIST;
            _n++;
            return true;
        }

        HashData<K, V>* Find(const K& key) {
            Hash hs;
            size_t hashi = hs(key) % _tables.size();
            // 这里本身就是一个循环判断语句
            while (_tables[hashi]._state == EXIST) {
                if (key == _tables[hashi]._kv.first && _tables[hashi]._state == EXIST) {
                    return &_tables[hashi];
                }
                hashi++;
                hashi %= _tables.size();
            }
            return nullptr;
        }

        bool Erase(const K& key) {
            HashData<K, V>* ret = Find(key);
            if (ret) {
                ret->_state = DELETE;
                _n--;
                return true;
            } else {
                return false;
            }
        }

    private:
        vector<HashData<K, V>> _tables;
        size_t _n = 0;
    };

    void TestHT1() {
        int a[] = { 10001, 11, 55, 24, 19, 12, 31 };
        HashTable<int, int> ht;
        for (auto e : a) {
            ht.Insert(make_pair(e, e));
        }
        cout << ht.Find(55) << endl;
        cout << ht.Find(31) << endl;
        ht.Erase(55);
        cout << ht.Find(55) << endl;
        cout << ht.Find(31) << endl;
    }
}

C++ 哈希表模拟实现：闭散列与冲突处理

C++ 哈希表模拟实现：闭散列与冲突处理

一、闭散列基础

1.1 线性探测

操作方面

状态标记

二、实现哈希表

2.1 哈希基本构架

更多推荐文章

相关免费在线工具

2.2 哈希表插入数据

2.3 哈希表扩容逻辑

2.4 哈希表扩容需要换表

2.5 复用插入逻辑

2.6 哈希表查找元素

2.7 哈希表删除数据

三、除留余数法出现类型问题

3.1 类型问题分析

3.2 简单类型做 key

3.3 string 类型做 key

BKDR 算法

string 模板特化

3.4 复杂类型做 key

散列表头文件

更多推荐文章

相关免费在线工具

C++ 哈希表模拟实现：闭散列与冲突处理

C++ 哈希表模拟实现：闭散列与冲突处理

一、闭散列基础

1.1 线性探测

操作方面

状态标记

二、实现哈希表

2.1 哈希基本构架

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 哈希表插入数据

2.3 哈希表扩容逻辑

2.4 哈希表扩容需要换表

2.5 复用插入逻辑

2.6 哈希表查找元素

2.7 哈希表删除数据

三、除留余数法出现类型问题

3.1 类型问题分析

3.2 简单类型做 key

3.3 string 类型做 key

BKDR 算法

string 模板特化

3.4 复杂类型做 key

散列表头文件

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具