C++ 哈希表与位图实战：unordered_map/set 底层原理及实现 | 极客日志

C++算法

C++ 哈希表与位图实战：unordered_map/set 底层原理及实现

深入解析 C++ 中 unordered_map 与 unordered_set 的底层哈希表实现，涵盖闭散列与开散列两种冲突解决策略的代码模拟。内容延伸至位图与布隆过滤器在海量数据存储与查询中的应用，以及哈希切割技术在大数据内存受限场景下的解决方案。结合 LeetCode 实战案例，提供从理论到工程落地的完整技术路径。

利刃发布于 2026/3/28更新于 2026/7/2334 浏览

unordered 系列关联式容器

在 C++ STL 中，unordered_map、unordered_set、unordered_multimap 和 unordered_multiset 是基于哈希表实现的关联容器。它们的接口设计与 set/map 类似，支持范围 for 遍历，但核心区别在于：

迭代器是单向的。
元素无序存储，遍历时不会自动排序。
性能通常优于红黑树实现的 set/map，但在处理有序数据插入时，树结构可能更优。

注意：性能对比建议在 Release 模式下进行。

哈希基础

哈希（散列）通过哈希函数建立键值与存储位置的映射关系，本质是用空间换取查询效率。常用的哈希构造方法包括：

直接定址法：适用于值分布集中的场景，如统计字符出现次数。
除留余数法：适用于值分布分散的场景，公式为 key % n。

哈希冲突及其解决

当不同键值映射到同一位置时发生冲突。主流解决方案有两种：

闭散列（开放定址法）

当目标位置被占用时，按特定规则寻找下一个空位。常见策略有线性探测和二次探测。

以线性探测为例，若当前位置满，则向后查找直到找到空位。为了处理删除操作，不能简单将位置置为空，而是标记为 DELETE，这样搜索时遇到 DELETE 可继续向后找，而插入时可复用该位置。

enum State { EXIST, EMPTY, DELETE };

template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    State _state = EMPTY;
};

template<class K>
struct DefaultHashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>
 HashTable {
:
    () { _table.(); }

    {
        
         (_n *  / _table.() >= ) {
             newSize = _table.() * ;
            HashTable<K, V, HashFunc> newHT;
            newHT._table.(newSize);
            
             ( i = ; i < _table.(); ++i) {
                 (_table[i]._state == EXIST) {
                    newHT.(_table[i]._kv);
                }
            }
            _table.(newHT._table);
        }

        HashFunc hf;
         hashi = (kv.first) % _table.();
         (_table[hashi]._state == EXIST) {
            ++hashi;
            hashi %= _table.();
        }
        _table[hashi]._kv = kv;
        _table[hashi]._state = EXIST;
        ++_n;
         ;
    }

    {
        HashFunc hf;
         hashi = (key) % _table.();
         (_table[hashi]._state != EMPTY) {
             (_table[hashi]._state == EXIST && _table[hashi]._kv.first == key) {
                 (HashData< K, V>*)&_table[hashi];
            }
            ++hashi;
            hashi %= _table.();
        }
         ;
    }

    {
        HashData< K, V>* ret = (key);
         (ret) {
            ret->_state = DELETE;
            --_n;
             ;
        }
         ;
    }

:
    vector<HashData<K, V>> _table;
     _n = ;
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template<class K, class T, class KeyOfT, class HashFunc = DefaultHashFunc<K>>
class HashTable {
    struct HashNode {
        T _data;
        HashNode* _next;
        HashNode(const T& data) : _data(data), _next(nullptr) {}
    };

    typedef HashNode<T> Node;

    template<class K, class T, class Ptr, class Ref, class KeyOfT, class HashFunc>
    friend struct HTIterator;

public:
    typedef HTIterator<K, T, T*, T&, KeyOfT, HashFunc> iterator;
    typedef HTIterator<K, T, const T*, const T&, KeyOfT, HashFunc> const_iterator;

    iterator begin() {
        for (size_t i = 0; i < _table.size(); ++i) {
            Node* cur = _table[i];
            if (cur) return iterator(cur, this);
        }
        return iterator(nullptr, this);
    }

    iterator end() { return iterator(nullptr, this); }

    ~HashTable() {
        for (size_t i = 0; i < _table.size(); ++i) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                delete cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
    }

    pair<iterator, bool> Insert(const T& data) {
        KeyOfT kot;
        iterator it = Find(kot(data));
        if (it != end()) return make_pair(it, false);

        HashFunc hf;
        if (_n == _table.size()) {
            size_t newSize = _table.size() * 2;
            vector<Node*> newTable(newSize, nullptr);
            
            for (size_t i = 0; i < _table.size(); ++i) {
                Node* cur = _table[i];
                while (cur) {
                    Node* next = cur->_next;
                    size_t hashi = hf(kot(cur->_data)) % newSize;
                    cur->_next = newTable[hashi];
                    newTable[hashi] = cur;
                    cur = next;
                }
                _table[i] = nullptr;
            }
            _table.swap(newTable);
        }

        size_t hashi = hf(kot(data)) % _table.size();
        Node* newnode = new Node(data);
        newnode->_next = _table[hashi];
        _table[hashi] = newnode;
        ++_n;
        return make_pair(iterator(newnode, this), true);
    }

    iterator Find(const K& key) {
        HashFunc hf;
        KeyOfT kot;
        size_t hashi = hf(key) % _table.size();
        Node* cur = _table[hashi];
        while (cur) {
            if (kot(cur->_data) == key) return iterator(cur, this);
            cur = cur->_next;
        }
        return end();
    }

    bool Erase(const K& key) {
        HashFunc hf;
        KeyOfT kot;
        size_t hashi = hf(key) % _table.size();
        Node* prev = nullptr;
        Node* cur = _table[hashi];
        while (cur) {
            if (kot(cur->_data) == key) {
                if (!prev) _table[hashi] = cur->_next;
                else prev->_next = cur->_next;
                delete cur;
                --_n;
                return true;
            }
            prev = cur;
            cur = cur->_next;
        }
        return false;
    }

private:
    vector<Node*> _table;
    size_t _n = 0;
};

namespace hash_lib {
template<class K>
class unordered_set {
    struct SetKeyOfT {
        const K& operator()(const K& key) { return key; }
    };
public:
    typedef typename hash_bucket::HashTable<K, K, SetKeyOfT>::const_iterator iterator;
    iterator begin() { return _ht.begin(); }
    iterator end() { return _ht.end(); }
    pair<const_iterator, bool> insert(const K& key) {
        pair<typename hash_bucket::HashTable<K, K, SetKeyOfT>::iterator, bool> ret = _ht.Insert(key);
        return pair<const_iterator, bool>(ret.first, ret.second);
    }
private:
    hash_bucket::HashTable<K, K, SetKeyOfT> _ht;
};

template<class K, class V>
class unordered_map {
    struct MapKeyOfT {
        const K& operator()(const pair<K, V>& kv) { return kv.first; }
    };
public:
    typedef typename hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT>::iterator iterator;
    iterator begin() { return _ht.begin(); }
    iterator end() { return _ht.end(); }
    pair<iterator, bool> insert(const pair<K, V>& kv) { return _ht.Insert(kv); }
    V& operator[](const K& key) {
        pair<iterator, bool> ret = _ht.Insert(make_pair(key, V()));
        return ret.first->second;
    }
private:
    hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT> _ht;
};
}

template<size_t N>
class bitset {
public:
    bitset() { _a.resize(N / 32 + 1); }
    void set(size_t x) {
        size_t i = x / 32;
        size_t j = x % 32;
        _a[i] |= (1 << j);
    }
    void reset(size_t x) {
        size_t i = x / 32;
        size_t j = x % 32;
        _a[i] &= (~(1 << j));
    }
    bool test(size_t x) {
        size_t i = x / 32;
        size_t j = x % 32;
        return _a[i] & (1 << j);
    }
private:
    vector<int> _a;
};

template<size_t N, class K, class Hash1, class Hash2, class Hash3>
class BloomFilter {
public:
    void Set(const K& key) {
        size_t hash1 = Hash1()(key) % N;
        _bs.set(hash1);
        size_t hash2 = Hash2()(key) % N;
        _bs.set(hash2);
        size_t hash3 = Hash3()(key) % N;
        _bs.set(hash3);
    }
    bool Test(const K& key) {
        size_t hash1 = Hash1()(key) % N;
        if (!_bs.test(hash1)) return false;
        size_t hash2 = Hash2()(key) % N;
        if (!_bs.test(hash2)) return false;
        size_t hash3 = Hash3()(key) % N;
        if (!_bs.test(hash3)) return false;
        return true;
    }
private:
    bitset<N> _bs;
};

class Solution {
public:
    vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
        unordered_map<int, int> hash1, hash2;
        vector<int> v;
        for (auto e : nums1) hash1[e]++;
        for (auto e : nums2) hash2[e]++;
        for (auto e : nums1) {
            if (hash1.count(e) && hash2.count(e)) {
                int count = min(hash1[e], hash2[e]);
                for (int i = 0; i < count; ++i) v.push_back(e);
                hash1[e] = 0;
                hash2[e] = 0;
            }
        }
        return v;
    }
};

class Solution {
public:
    vector<string> uncommonFromSentences(string s1, string s2) {
        unordered_map<string, int> hash1, hash2;
        auto parse = [&](string& s, unordered_map<string, int>& m) {
            string a;
            for (char c : s) {
                if (c == ' ') {
                    m[a]++;
                    a.clear();
                } else {
                    a += c;
                }
            }
            m[a]++;
        };
        parse(s1, hash1);
        parse(s2, hash2);
        vector<string> v;
        for (auto& p : hash1) {
            if (p.second == 1 && hash2.find(p.first) == hash2.end()) v.push_back(p.first);
        }
        for (auto& p : hash2) {
            if (p.second == 1 && hash1.find(p.first) == hash1.end()) v.push_back(p.first);
        }
        return v;
    }
};

C++ 哈希表与位图实战：unordered_map/set 底层原理及实现

unordered 系列关联式容器

哈希基础

哈希冲突及其解决

闭散列（开放定址法）

更多推荐文章

相关免费在线工具

开散列（链地址法）

封装 unordered_set 与 unordered_map

位图与布隆过滤器

位图（BitMap）

布隆过滤器（Bloom Filter）

哈希切割与大数据处理

实战案例

两数组的交集 II

不常见单词

更多推荐文章

相关免费在线工具

C++ 哈希表与位图实战：unordered_map/set 底层原理及实现

unordered 系列关联式容器

哈希基础

哈希冲突及其解决

闭散列（开放定址法）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

开散列（链地址法）

封装 unordered_set 与 unordered_map

位图与布隆过滤器

位图（BitMap）

布隆过滤器（Bloom Filter）

哈希切割与大数据处理

实战案例

两数组的交集 II

不常见单词

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具