C++ 哈希表底层原理与实战实现详解

综述由AI生成本文深入解析了 C++ 哈希表的底层原理，涵盖哈希冲突解决方案（开放定址法与拉链法）、负载因子控制、动态扩容机制及仿函数设计。重点展示了如何使用模板编程实现通用的哈希表结构，包括自定义迭代器封装以支持 STL 风格遍历，并最终封装出 unordered_map 和 unordered_set 容器。内容包含完整的 C++ 代码实现，适合希望理解 STL 源码或提升数据结构底层能力的开发者阅读。

XiaoPingzi发布于 2026/3/22更新于 2026/6/1320 浏览

关联式容器中的哈希表

在 C++ STL 中，unordered_map 和 unordered_set 是典型的基于哈希表实现的关联式容器。它们的用法与 map、set 类似，但底层结构不同。简单来说，红黑树实现的 map/set 是有序的，而哈希表实现的 unordered 系列是无序的。

主要区别在于：

迭代器类型：unordered 系列通常只支持单向迭代器（Forward Iterator），不支持反向迭代器（如 rbegin/rend）。
遍历顺序：数据不会按大小排序，而是根据哈希值分布。

它们同样支持去重功能，也有对应的 multi 版本（如 unordered_multimap）。下面我们通过代码来直观感受一下差异。

哈希基础概念

什么是哈希？回顾一下搜索算法的发展：暴力查找效率太低；有序数组的二分查找虽然快，但增删操作涉及大量数据移动；平衡搜索树解决了部分问题，但仍有开销。哈希（散列）的本质是在存储的值与存储位置之间建立映射关系。

比如计数排序中，最小值 15 映射到索引 0，最大值 30 映射到索引 15，这就是直接定址法。它适用于数据范围集中的场景。如果数据分散，直接定址会浪费大量空间。此时常用除留余数法：index = key % table_size。

但这会引发哈希冲突（Collision），即不同的键映射到同一个位置。解决冲突主要有两种策略：闭散列（开放定址法）和拉链法（哈希桶）。

闭散列——开放定址法

当发生冲突时，闭散列会在表中寻找下一个可用位置。常见方法包括线性探测和二次探测。

以线性探测为例，如果计算出的位置被占用，就向后找下一个空位。这里有个细节：如果表满了怎么办？实际上我们不应该等到完全填满才扩容，而是通过负载因子（Load Factor）来控制。负载因子 = 已存元素个数 / 表长。通常控制在 0.7 左右，超过则扩容。

删除操作在闭散列中比较特殊。不能简单抹成空，否则会影响后续查找（因为查找遇到空位就会停止）。我们需要引入状态标记：EXIST（存在）、EMPTY（空）、DELETE（已删除）。查找时跳过 DELETE 状态，直到遇到 EMPTY 或目标值。

拉链法——哈希桶

另一种思路是避免互相干扰。将数组的每个元素设为指针，指向一个链表。冲突的元素挂在同一个链表中。这种方式对扩容更友好，且不需要处理复杂的探测逻辑。

实现哈希桶时，核心结构是一个指针数组。插入时计算哈希值，头插到对应链表。扩容时，需要重新计算所有元素的哈希位置并迁移到新表。注意，迁移时不能直接拷贝节点，因为新表的哈希函数模数变了，必须重新计算位置后插入。

仿函数与模板特化

哈希函数要求输入能转换为整型以便取模。对于内置类型（如 int），直接转换即可。但对于 string 等复杂类型，需要自定义哈希函数。我们可以使用仿函数（Functor）来实现多态。

默认情况下，DefaultHashFunc 将 key 转为 size_t。针对 string，可以特化该模板，采用多项式滚动哈希（如乘以 131 累加字符），以减少冲突概率。

迭代器封装

为了让哈希表符合 STL 标准，需要封装迭代器。迭代器需要知道当前节点指针以及所属的哈希表对象（用于查找下一个非空桶）。

begin()：找到第一个非空桶的第一个节点。
end()：返回空指针作为结束标志。
operator++()：如果当前链表有下一个节点，直接走；否则在哈希表中向后查找下一个非空桶。

此外，还需要区分普通迭代器和常量迭代器，确保 const 对象不能被修改。这通常通过模板参数控制返回值类型来实现。

封装 unordered_map 与 unordered_set

最后，基于哈希表封装标准的容器接口。

相关免费在线工具

加密/解密文本

使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online

Gemini 图片去水印

基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

Base64 字符串编码/解码

将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

Base64 文件转换器

将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

Markdown转HTML

将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

HTML转Markdown

将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

// HashTable.h #pragma once #include <vector> #include <string> #include <stdio.h> #include <iostream> template<class K> struct DefaultHashFunc { size_t operator()(const K& key) { return (size_t)key; } }; // 字符串哈希特化，减少冲突 template<> struct DefaultHashFunc<string> { size_t operator()(const string& str) { size_t hash = 0; for (auto ch : str) { hash *= 131; // 乘以一个质数增加随机性 hash += ch; } return hash; } }; namespace hash_bucket { template<class T> struct HashNode { T _data; HashNode<T>* _next; HashNode(const T& data) :_data(data), _next(nullptr) {} }; // 前置声明 template<class K, class T, class KeyOfT, class HashFunc> class HashTable; // 迭代器定义 template<class K, class T, class Ptr, class Ref, class KeyOfT, class HashFunc> struct HTIterator { typedef HashNode<T> Node; typedef HTIterator<K, T, Ptr, Ref, KeyOfT, HashFunc> Self; typedef HTIterator<K, T, T*, T&, KeyOfT, HashFunc> Iterator; Node* _node; const HashTable<K, T, KeyOfT, HashFunc>* _pht; HTIterator(Node* node, const HashTable<K, T, KeyOfT, HashFunc>* pht) :_node(node), _pht(pht) {} // 支持普通迭代器转 const 迭代器 HTIterator(const Iterator& it) :_node(it._node), _pht(it._pht) {} Ref operator*() { return _node->_data; } Ptr operator->() { return &_node->_data; } Self& operator++() { if (_node->_next) { _node = _node->_next; } else { // 当前链表走完，找下一个非空桶 KeyOfT kot; HashFunc hf; size_t hashi = hf(kot(_node->_data)) % _pht->_table.size(); ++hashi; while (hashi < _pht->_table.size()) { if (_pht->_table[hashi]) { _node = _pht->_table[hashi]; return *this; } else { ++hashi; } } _node = nullptr; } return *this; } bool operator!=(const Self& s) { return _node != s._node; } bool operator==(const Self& s) { return _node == s._node; } }; template<class K, class T, class KeyOfT, class HashFunc = DefaultHashFunc<K>> class HashTable { typedef HashNode<T> Node; // 友元声明，允许迭代器访问私有成员 template<class K, class T, class Ptr, class Ref, class KeyOfT, class HashFunc> friend struct HTIterator; public: typedef HTIterator<K, T, T*, T&, KeyOfT, HashFunc> iterator; typedef HTIterator<K, T, const T*, const T&, KeyOfT, HashFunc> const_iterator; iterator begin() { for (size_t i = 0; i < _table.size(); i++) { Node* cur = _table[i]; if (cur) { return iterator(cur, this); } } return iterator(nullptr, this); } iterator end() { return iterator(nullptr, this); } const_iterator begin() const { for (size_t i = 0; i < _table.size(); i++) { Node* cur = _table[i]; if (cur) { return const_iterator(cur, this); } } return const_iterator(nullptr, this); } const_iterator end() const { return const_iterator(nullptr, this); } HashTable() { _table.resize(10, nullptr); } ~HashTable() { for (size_t i = 0; i < _table.size(); i++) { Node* cur = _table[i]; while (cur) { Node* next = cur->_next; delete cur; cur = next; } _table[i] = nullptr; } } pair<iterator, bool> Insert(const T& data) { KeyOfT kot; iterator it = Find(kot(data)); if (it != end()) { return make_pair(it, false); } HashFunc hf; // 负载因子为 1 时扩容 if (_n == _table.size()) { size_t newSize = _table.size() * 2; vector<Node*> newTable(newSize, nullptr); // 迁移节点到新表 for (size_t i = 0; i < _table.size(); i++) { Node* cur = _table[i]; while (cur) { Node* next = cur->_next; size_t hashi = hf(kot(cur->_data)) % newSize; // 头插到新表 cur->_next = newTable[hashi]; newTable[hashi] = cur; cur = next; } _table[i] = nullptr; } _table.swap(newTable); } size_t hashi = hf(kot(data)) % _table.size(); Node* newnode = new Node(data); newnode->_next = _table[hashi]; _table[hashi] = newnode; ++_n; return make_pair(iterator(newnode, this), true); } iterator Find(const K& key) { HashFunc hf; KeyOfT kot; size_t hashi = hf(key) % _table.size(); Node* cur = _table[hashi]; while (cur) { if (kot(cur->_data) == key) { return iterator(cur, this); } cur = cur->_next; } return end(); } bool Erase(const K& key) { HashFunc hf; KeyOfT kot; size_t hashi = hf(key) % _table.size(); Node* prev = nullptr; Node* cur = _table[hashi]; while (cur) { if (kot(cur->_data) == key) { if (prev == nullptr) { _table[hashi] = cur->_next; } else { prev->_next = cur->_next; } delete cur; --_n; return true; } prev = cur; cur = cur->_next; } return false; } private: vector<Node*> _table; size_t _n = 0; }; }

C++ 哈希表底层原理与实战实现详解

关联式容器中的哈希表

哈希基础概念

闭散列——开放定址法

拉链法——哈希桶

仿函数与模板特化

迭代器封装

封装 unordered_map 与 unordered_set

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

C++ 哈希表底层原理与实战实现详解

关联式容器中的哈希表

哈希基础概念

闭散列——开放定址法

拉链法——哈希桶

仿函数与模板特化

迭代器封装

封装 unordered_map 与 unordered_set

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具