C++ 哈希表核心原理与 STL 实现解析 | 极客日志

C++算法

C++ 哈希表核心原理与 STL 实现解析

综述由AI生成哈希表是 C++ STL 中 unordered_map 和 unordered_set 的底层数据结构，以 O(1) 平均时间复杂度提供高效的查找能力。文章详细解析了哈希函数的设计原则、冲突处理策略（开放定址法与链地址法）以及扩容机制。通过对比 set/map 与 unordered_set/unordered_map 的差异，结合 C++ 源码实现，深入探讨了负载因子、质数扩容及哈希仿函数的具体应用，为高性能数据结构选型提供理论支撑与实践参考。

魔尊发布于 2026/3/20更新于 2026/6/218 浏览

C++ 哈希表核心原理与 STL 实现解析

unordered_map 和 unordered_set 的使用

在深入哈希表底层之前，先对比一下 C++ STL 中常用的容器。unordered_map 和 unordered_set 基于哈希表实现，而 map 和 set 基于红黑树。

unordered_set 类介绍

unordered_set 与 set 功能高度相似，但底层结构不同。它默认要求 Key 支持转换为无符号整型且支持相等比较。如果 Key 类型不支持（如自定义结构体），需要自行实现仿函数传入模板参数。

template<class Key,
           class Hash = hash<Key>,
           class Pred = equal_to<Key>,
           class Alloc = allocator<Key>>
class unordered_set;

底层使用哈希桶实现，增删查平均效率为 O(1)。迭代器遍历无序，因此命名为 unordered_set。

unordered_set 与 set 的差异

Key 的要求：set 要求 Key 支持小于比较；unordered_set 要求 Key 支持转成整形且支持等于比较。
迭代器差异：set 是双向迭代器，遍历有序；unordered_set 是单向迭代器，遍历无序。
性能差异：整体而言，unordered_set 的增删查改更快。红黑树操作复杂度为 O(logN)，而哈希表平均为 O(1)。

以下代码演示了两者在插入、查找和删除上的性能对比：

#include <unordered_set>
#include <set>
#include <iostream>
#include <vector>
#include <ctime>
using namespace std;

int test_set_performance() {
      N = ;
    unordered_set<> us;
    set<> s;
    vector<> v;
    v.(N);
    (());
     ( i = ; i < N; ++i) {
        v.(() + i); 
    }

    
     begin1 = ();
     ( e : v) s.(e);
     end1 = ();
    cout <<  << end1 - begin1 << endl;

     begin2 = ();
    us.(N);
     ( e : v) us.(e);
     end2 = ();
    cout <<  << end2 - begin2 << endl;

    
     m1 = , m2 = ;
     begin3 = ();
     ( e : v) {  (s.(e) != s.()) ++m1; }
     end3 = ();
    cout <<  << end3 - begin3 <<  << m1 << endl;

     begin4 = ();
     ( e : v) {  (us.(e) != us.()) ++m2; }
     end4 = ();
    cout <<  << end4 - begin4 <<  << m2 << endl;

     ;
}

{
    ();
     ;
}

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

// LeetCode 示例：字符串中的第一个唯一字符
class Solution {
public:
    int firstUniqChar(string s) {
        int count[26] = {0};
        for (auto ch : s) count[ch - 'a']++;
        for (size_t i = 0; i < s.size(); ++i) {
            if (count[s[i] - 'a'] == 1) return i;
        }
        return -1;
    }
};

enum State { EXIST, EMPTY, DELETE };

template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    State _state = EMPTY;
};

template<class K, class V, class HashFunc = HashFunc<K>>
class HashTable {
private:
    vector<HashData<K, V>> _tables;
    size_t _n = 0;
    HashFunc _hash_func;

    // 获取下一个质数
    inline unsigned long __stl_next_prime(unsigned long n) {
        static const int __stl_num_primes = 28;
        static const unsigned long __stl_prime_list[__stl_num_primes] = {
            53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
            49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
            6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
            402653189, 805306457, 1610612741, 3221225473, 4294967291
        };
        const unsigned long* first = __stl_prime_list;
        const unsigned long* last = __stl_prime_list + __stl_num_primes;
        const unsigned long* pos = lower_bound(first, last, n);
        return pos == last ? *(last - 1) : *pos;
    }

public:
    HashTable() : _tables(__stl_next_prime(0)), _n(0) {}

    bool insert(const pair<K, V>& kv) {
        if (Find(kv.first)) return false;
        // 负载因子大于 0.7 时扩容
        if (_n * 10 / _tables.size() >= 7) {
            HashTable newht;
            newht._tables.resize(__stl_next_prime(_tables.size() + 1));
            for (auto& e : _tables) {
                if (e._state == EXIST) newht.insert(e._kv);
            }
            _tables.swap(newht._tables);
        }

        size_t hash0 = _hash_func(kv.first) % _tables.size();
        size_t hashi = hash0;
        size_t i = 1;
        while (_tables[hashi]._state == EXIST) {
            hashi = (hash0 + i) % _tables.size();
            i++;
        }
        _tables[hashi]._kv = kv;
        _tables[hashi]._state = EXIST;
        ++_n;
        return true;
    }

    HashData<K, V>* Find(const K& key) {
        size_t hash0 = _hash_func(key) % _tables.size();
        size_t hashi = hash0;
        size_t i = 1;
        while (_tables[hashi]._state != EMPTY) {
            if (_tables[hashi]._state != DELETE && _tables[hashi]._kv.first == key) {
                return &_tables[hashi];
            }
            hashi = (hash0 + i) % _tables.size();
            i++;
        }
        return nullptr;
    }

    bool erase(const K& key) {
        HashData<K, V>* ret = Find(key);
        if (!ret) return false;
        ret->_state = DELETE;
        return true;
    }
};

template<class T>
struct Bucket_Node {
    T _data;
    Bucket_Node<T>* _next;
    Bucket_Node(const T& data) : _data(data), _next(nullptr) {}
};

template<class K, class T, class KeyOfT, class HashFunc>
class hash_bucket {
private:
    size_t _n = 0;
    vector<Bucket_Node<T>*> _tables;
    HashFunc _hash_func;
    KeyOfT _key_of_t;

    inline unsigned long __stl_next_prime(unsigned long n) {
        static const int __stl_num_primes = 28;
        static const unsigned long __stl_prime_list[__stl_num_primes] = {
            53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
            49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
            6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
            402653189, 805306457, 1610612741, 3221225473, 4294967291
        };
        const unsigned long* first = __stl_prime_list;
        const unsigned long* last = __stl_prime_list + __stl_num_primes;
        const unsigned long* pos = lower_bound(first, last, n);
        return pos == last ? *(last - 1) : *pos;
    }

public:
    hash_bucket() : _n(0), _tables(__stl_next_prime(0)) {}

    ~hash_bucket() {
        for (size_t i = 0; i < _tables.size(); i++) {
            Bucket_Node<T>* cur = _tables[i];
            while (cur) {
                Bucket_Node<T>* next = cur->_next;
                delete cur;
                cur = next;
            }
            _tables[i] = nullptr;
        }
    }

    bool insert(const T& data) {
        // 负载因子达到 1 时扩容
        if (_n / _tables.size() >= 1) {
            vector<Bucket_Node<T>*> newtables(__stl_next_prime(_tables.size() + 1));
            for (size_t i = 0; i < _tables.size(); i++) {
                Bucket_Node<T>* cur = _tables[i];
                while (cur) {
                    Bucket_Node<T>* next = cur->_next;
                    size_t hashi = _hash_func(_key_of_t(cur->_data)) % newtables.size();
                    cur->_next = newtables[hashi];
                    newtables[hashi] = cur;
                    cur = next;
                }
                _tables[i] = nullptr;
            }
            _tables.swap(newtables);
        }

        size_t hashi = _hash_func(_key_of_t(data)) % _tables.size();
        Bucket_Node<T>* newnode = new Bucket_Node<T>(data);
        newnode->_next = _tables[hashi];
        _tables[hashi] = newnode;
        ++_n;
        return true;
    }

    bool erase(const K& key) {
        size_t hashi = _hash_func(key) % _tables.size();
        Bucket_Node<T>* prev = nullptr;
        Bucket_Node<T>* cur = _tables[hashi];
        while (cur) {
            if (_key_of_t(cur->_data) == key) {
                if (prev) prev->_next = cur->_next;
                else _tables[hashi] = cur->_next;
                delete cur;
                --_n;
                return true;
            }
            prev = cur;
            cur = cur->_next;
        }
        return false;
    }
};

C++ 哈希表核心原理与 STL 实现解析

C++ 哈希表核心原理与 STL 实现解析

unordered_map 和 unordered_set 的使用

unordered_set 类介绍

unordered_set 与 set 的差异

更多推荐文章

相关免费在线工具

unordered_map 与 map 的差异

哈希表实现原理

哈希概念

直接定址法

哈希冲突

负载因子

将关键字转为整数

哈希函数设计

除法散列法

乘法散列法

哈希防御措施：全域散列

开放定址法

开放定址法代码实现

链地址法

更多推荐文章

相关免费在线工具

C++ 哈希表核心原理与 STL 实现解析

C++ 哈希表核心原理与 STL 实现解析

unordered_map 和 unordered_set 的使用

unordered_set 类介绍

unordered_set 与 set 的差异

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

unordered_map 与 map 的差异

哈希表实现原理

哈希概念

直接定址法

哈希冲突

负载因子

将关键字转为整数

哈希函数设计

除法散列法

乘法散列法

哈希防御措施：全域散列

开放定址法

开放定址法代码实现

链地址法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具