C++ 哈希表核心解析：冲突解决与实现细节 | 极客日志

C++算法

C++ 哈希表核心解析：冲突解决与实现细节

综述由AI生成哈希通过哈希函数将数据映射为固定长度数值，实现 O(1) 查找。常见冲突解决方法包括闭散列（线性探测、二次探测）和开散列（链地址法）。闭散列需处理负载因子扩容及删除标记，开散列利用链表存储冲突元素。详细解析了 C++ 中哈希表的底层数据结构、插入查找删除逻辑及扩容机制，对比了不同方案的优劣。

292440837发布于 2026/3/26更新于 2026/5/1913 浏览

哈希通过哈希函数将任意大小的数据映射为固定长度的数值，其核心目标是高效地存储、查找和验证数据。在学哈希之前，我们对于数据的查找通常是建立于顺序表或树形结构的基础上进行的。随着数据量越来越庞大，数据的随机性和容量越发严峻，理想的搜索方法是不经过任何比较，一次直接从表中得到要搜索的元素。

如果构造一种存储结构，通过某种函数 (hashFunc) 使元素的存储位置与它的关键码之间能够建立一一映射的关系，那么在查找时通过该函数可以很快找到该元素。因此就在此基础上发展出了一种平均时间复杂度几乎为 O(1) 的数据查找方式，即哈希，也称为散列。

1. 什么是哈希？

哈希概念示意图

2. 哈希的常见实现方法

2.1 直接定址法

直接定址法示意图

对于一段相对集中的数据段，就可以使用直接定址法。这里最大的数是 30，最小的数是 15，创建一个大小为 15 的数组，将所有值映射到数组上。

优点： 简单、均匀 缺点： 需要事先知道关键字的分布情况 使用场景： 适合查找比较小且连续的情况，数据太分散就不适合了，开的数组会太大，造成空间浪费

2.2 除留余数法

除留余数法示意图

除留余数法是一种通过固定的哈希函数计算方式将数据放入哈希表的常用方法。设散列表中允许的地址数为 m，取一个不大于 m，但最接近或者等于 m 的质数 p 作为除数，按照哈希函数：Hash(key) = key % p (p <= m)，将关键码转换成哈希地址。

3. 哈希冲突

简单来说，通过除留余数法，将每个进来的值除以哈希表的大小得到的余数，必定是在所开哈希表的容器大小范围内的。但是有可能不同的 key 会除出相同的余数，造成同一位置的冲突，该种现象称为哈希冲突或哈希碰撞。

4. 哈希冲突的解决

4.1 闭散列

也叫开放定址法。当发生哈希冲突时，如果哈希表未被装满，说明在哈希表中必然还有空位置，那么可以把 key 存放到冲突位置中的下一个空位置中去。那如何寻找下一个空位置呢？

4.1.1 线性探测

下面将通过对借助哈希表的实现解析线性探测相关的知识。

4.1.1.1 哈希表的基本数据结构

enum STATE { EXIST, EMPTY, DELETE };

template<class K, class V>
struct  {
    pair<K, V> _kv;
    STATE _state = EMPTY;
};

< ,  ,   = DefaultHashFunc<K>>
 HashTable {
:
    () { _table.(); }
:
    vector<HashData<K, V>> _table;
     _n = ; 
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template<class K>
struct DefaultHashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<>
struct DefaultHashFunc<string> {
    size_t operator()(const string& str) {
        // BKDR hash
        size_t hash = 0;
        for (auto ch : str) {
            hash *= 131;
            hash += ch;
        }
        return hash;
    }
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>

bool Insert(const pair<K, V>& kv) {
    // 扩容
    if (_n * 10 / _table.size() >= 7) {
        size_t newSize = _table.size() * 2;
        // 遍历旧表，重新映射到新表
        HashTable<K, V, HashFunc> newHT;
        newHT._table.resize(newSize);
        // 遍历旧表的数据插入到新表即可
        for (size_t i = 0; i < _table.size(); i++) {
            if (_table[i]._state == EXIST) {
                newHT.Insert(_table[i]._kv);
            }
        }
        _table.swap(newHT._table);
    }

    // 线性探测
    HashFunc hf;
    size_t hashi = hf(kv.first) % _table.size();
    while (_table[hashi]._state == EXIST) {
        ++hashi;
        hashi %= _table.size();
    }
    _table[hashi]._kv = kv;
    _table[hashi]._state = EXIST;
    ++_n;
    return true;
}

HashData<const K, V>* Find(const K& key) {
    // 线性探测
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    while (_table[hashi]._state != EMPTY) {
        if (_table[hashi]._state == EXIST && _table[hashi]._kv.first == key) {
            return (HashData<const K, V>*)&_table[hashi];
        }
        ++hashi;
        hashi %= _table.size();
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashData<const K, V>* ret = Find(key);
    if (ret) {
        ret->_state = DELETE;
        --_n;
        return true;
    }
    return false;
}

核心计算公式 给定初始哈希位置 h₀ 和探测次数 i，下一个探测位置为：
```
h(i) = (h₀ + i²) % table_size
```
- h₀：初始哈希值（例如 hash(key) % table_size）
- i：探测次数，从 1 开始递增
- table_size：哈希表的大小（必须为素数，否则可能无法覆盖所有槽位）
计算步骤示例 假设哈希表大小 table_size = 7（素数），初始哈希位置 h₀ = 3，插入时发生冲突，则二次探测的位置序列为：

探测次数 i	计算公式	结果 h(i)
1	`(3 + 1²) % 7`	4
2	`(3 + 2²) % 7`	0
3	`(3 + 3²) % 7`	5
4	`(3 + 4²) % 7`	2
5	`(3 + 5²) % 7`	6
6	`(3 + 6²) % 7`	1

探测次数 i	计算公式	结果 h(i)
1	`(h₀ + 1²) % 4`	h₀ + 1
2	`(h₀ + 2²) % 4`	h₀
3	`(h₀ + 3²) % 4`	h₀ + 1

bool Insert(const pair<K, V>& kv) {
    // 扩容逻辑（略）
    HashFunc hf;
    size_t h0 = hf(kv.first) % _table.size();
    // 二次探测
    for (size_t i = 1; i < _table.size(); ++i) {
        size_t hashi = (h0 + i * i) % _table.size();
        if (_table[hashi]._state != EXIST) {
            _table[hashi]._kv = kv;
            _table[hashi]._state = EXIST;
            ++_n;
            return true;
        }
    }
    return false; // 表满（实际不会触发，因提前扩容）
}

特性	线性探测	二次探测
探测序列	`h₀, h₀+1, h₀+2, ...`	`h₀, h₀+1, h₀+4, h₀+9, ...`
聚集问题	严重（主聚集）	较轻（二次聚集）
空间利用率	低（易导致连续槽位被占用）	高（更均匀分布）
表满检测	遍历全量槽位即可检测	需遍历约一半槽位

template<class K, class V>
struct HashNode {
    pair<K, V> _kv;
    HashNode<K, V>* _next;
    HashNode(const pair<K, V>& _kv) : _kv(kv), _next(nullptr) {}
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>
class HashTable {
    typedef HashNode<K, V> Node;
public:
    HashTable() { _table.resize(10, nullptr); }
    ~HashTable() {
        for (size_t i = 0; i < _table.size(); i++) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                delete cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
    }
private:
    vector<Node*> _table; // 指针数组
    size_t _n = 0; // 存储了多少个有效数据
};

bool Insert(const pair<K, V>& kv) {
    if (Find(kv.first)) {
        return false;
    }
    HashFunc hf;
    // 负载因子到 1 就扩容
    if (_n == _table.size()) {
        size_t newSize = _table.size() * 2;
        vector<Node*> newTable;
        newTable.resize(newSize, nullptr);
        // 遍历旧表，顺手牵羊，把节点牵下来挂到新表
        for (size_t i = 0; i < _table.size(); i++) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                // 头插到新表
                size_t hashi = hf(cur->_kv.first) % newSize;
                cur->_next = newTable[hashi];
                newTable[hashi] = cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
        _table.swap(newTable);
    }
    size_t hashi = hf(kv.first) % _table.size();
    // 头插
    Node* newnode = new Node(kv);
    newnode->_next = _table[hashi];
    _table[hashi] = newnode;
    ++_n;
    return true;
}

Node* Find(const K& key) {
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    Node* cur = _table[hashi];
    while (cur) {
        if (cur->_kv.first == key) {
            return cur;
        }
        cur = cur->_next;
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    Node* prev = nullptr;
    Node* cur = _table[hashi];
    while (cur) {
        if (cur->_kv.first == key) {
            if (prev == nullptr) {
                _table[hashi] = cur->_next;
            } else {
                prev->_next = cur->_next;
            }
            delete cur;
            return true;
        }
        prev = cur;
        cur = cur->_next;
    }
    return false;
}

C++ 哈希表核心解析：冲突解决与实现细节

1. 什么是哈希？

2. 哈希的常见实现方法

2.1 直接定址法

2.2 除留余数法

3. 哈希冲突

4. 哈希冲突的解决

4.1 闭散列

4.1.1 线性探测

4.1.1.1 哈希表的基本数据结构

更多推荐文章

相关免费在线工具

4.1.1.2 哈希表的 key 转换

4.1.1.3 哈希表的插入

4.1.1.4 哈希表的查找

4.1.1.5 哈希表的删除

4.1.2 二次探测

4.1.3 线性探测和二次探测对比

4.2 开散列

4.2.1 哈希桶

4.2.1.1 哈希表的基本数据结构

4.2.1.2 哈希表的插入

4.2.1.3 哈希表的查找

4.2.1.4 哈希表的删除

4.3 开散列与闭散列比较

更多推荐文章

相关免费在线工具

C++ 哈希表核心解析：冲突解决与实现细节

1. 什么是哈希？

2. 哈希的常见实现方法

2.1 直接定址法

2.2 除留余数法

3. 哈希冲突

4. 哈希冲突的解决

4.1 闭散列

4.1.1 线性探测

4.1.1.1 哈希表的基本数据结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4.1.1.2 哈希表的 key 转换

4.1.1.3 哈希表的插入

4.1.1.4 哈希表的查找

4.1.1.5 哈希表的删除

4.1.2 二次探测

4.1.3 线性探测和二次探测对比

4.2 开散列

4.2.1 哈希桶

4.2.1.1 哈希表的基本数据结构

4.2.1.2 哈希表的插入

4.2.1.3 哈希表的查找

4.2.1.4 哈希表的删除

4.3 开散列与闭散列比较

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具