C++ 数据结构：哈希表原理与 STL 实现 | 极客日志

C++算法

C++ 数据结构：哈希表原理与 STL 实现

系统讲解了哈希表的数据结构原理，涵盖哈希值生成、常见哈希函数（如除留余数法、平方取中法）及哈希冲突处理方案（开放定址法、哈希桶）。重点剖析了 C++ STL 中 unordered_map 和 unordered_set 的底层实现，包括哈希桶模板类的复用机制、自定义类型键值的哈希转换策略（ExtractKey、Hash 仿函数）以及查找插入删除的具体逻辑。

莫名其妙发布于 2026/3/28更新于 2026/7/2450 浏览

哈希表

首先要理解哈希和哈希表有什么不同。哈希就是映射，是一种算法思想。哈希表就是映射表，是利用映射这种思想写出的一种数据结构。

所有的哈希表的算法流程都是类似的——拿到一个 key，利用哈希函数进行 hasher(key)，得到的空间位置存放我们想要存放的数据 Value。

或者——拿到一个 key，利用哈希函数进行 hasher(key)，从得到的空间位置取出我们想要查找的数据 Value。

理解哈希表

理解哈希表，我们可以分为三层去学习。第一层是理解哈希值，第二层是学习各种哈希函数，第三层是解决哈希冲突。

为什么要这么学习，因为 STL 哈希表中的底层哈希函数，其实都是对哈希值去进行 Hash。这个哈希值是一个整形，整形它本身就是哈希值；其他的自定义类型不管你 Key 的类型是 string，还是 vector。这些自定义类型，想要存储到哈希表中，上层最终都要让它们能够转为哈希值。

所以我们要先得到哈希值。然后再去使用哈希函数进行 hash 得到对应的映射位置。

另外，其实最基本的哈希表，逻辑上可以看作是一个数组。既然是数组，那么他就一定有大小。有大小，那么就一定存在 hash 的数据太多，数组空间不够的情况。这时再 hash，就有了哈希冲突。更不用提两个不同的自定义类型的数量远远大于哈希值的数量，自定义类型可能哈希值相同，就更会存在哈希冲突。所以，哈希是哈希表的功能。哈希冲突，是这个功能产生的一种可能存在的结果。所以两者存在因果的关系。

所以我们的理解链应该是：哈希值——》哈希函数——》哈希冲突

哈希值（整形）

为什么要有哈希值？是因为哈希函数都是对一个整形进行哈希，比如直接定址、除留余数、平方取中，基数转换等等。最重要的是 STL 里面使用的也是除留余数（只不过不是传统的除留余数，有其他优化）。

我们在用 STL 的时候，如果想要对一个自定义类型进行哈希，那么就必须提供这个自定义类型向哈希值的转换方法。本篇文章中我们以后称为'转换策略'。

有了这个转换策略，就可以将自定义类型转化为一个哈希值。然后再将这个哈希值交给 STL 底层的哈希函数进行哈希。得到的结果经过哈希冲突的处理得到映射位置，这个映射位置就是最后这一次哈希要存储的位置了。

转化哈希值一般要定义为一个仿函数，然后作为 unordered_map 的第三个模板参数传进去。这样就能让一个任意类型能够去进行哈希了。

要注意转化哈希值要注意速度快，离散高。常见的转化策略比如 string 类型向整形转化的 BKDR 哈希，DJB 哈希、多成员复杂结构，结构中含有整形和 string 的 hash_combine、以及对含少量成员的异或组合。里面有嵌套容器的递归哈希等等。

这里挑选熟悉的演示：

BKDR 哈希

优点：实现简单，计算快；离散高，冲突少；不同种子可以计算出不同哈希值。

实现方法是选取一个种子 seed，然后对字符串里面的每一个字符进行处理：

size_t BKDRHash(const string &str) {
    size_t seed = 131; // 31 131 1313 13131 131313
    size_t hash = 1;
    for (auto e : str) {
        hash *= seed;
        hash += e;
    }
    return hash & 0x7FFFFFFF; // 确保返回正数
}

这个种子的值可以是 31，131，1313，13131，131313...

异或组合

优点：实现简单，计算快。缺点：冲突率高

struct PointHash {
    {
         hash = ;
         ( e : vec) {
            hash ^= (e << );
        }
         hash;
    }
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template <typename T>
void hash_combine(std::size_t& seed, const T& val) {
    seed ^= std::hash<T>()(val) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
}

struct Person {
    std::string name;
    int age;
    // 重载==符号是为了在哈希桶的桶内 Find
    bool operator==(const Person& p) const {
        return name == p.name && age == p.age;
    }
};

struct PersonHash {
    std::size_t operator()(const Person& p) const {
        std::size_t seed = 0;
        hash_combine(seed, p.name);
        hash_combine(seed, p.age);
        return seed;
    }
};

template <class K, class V>
class HashData {
public:
    /*状态值为什么要有 DELETE？因为要进行查找 Key。查找 Key 的时候，遇到 DELETE 和 EXIST 不会停止，遇到 EMPTY 停止查找，说明没有找到。因为查找操作，应该是只要该位置有过数据，就要向后查找，直到遇到一个没有数据插入过的位置，就结束。因为会出现 Key 与这里的数据发生冲突，向后偏移了，但是之后这里的数据又删除了。这样如果没有 DELETE，查找到这里就停止了就错了。所以要有 DELETE。*/
    enum State { EMPTY, EXIST, DELETE };
public:
    pair<K, V> _kv;
    State _state;
};

template <class K, class V>
class HashTable {
public:
    bool insert(const pair<K, V> &kv) {
        /*使用开放定址法：会不会找不到合适的位置，不会。因为有负载因子。哈希表要判断负载因子，负载因子越大，哈希冲突越多，效率越低。负载因子越小，哈希冲突越小，效率越高，但是会占用大量空间。*/
        if (_tables.size() == 0 || (_n * 10) / _tables.size() >= 7) {
            /*超过了负载因子，那么就要扩容了。*/
            UpMemory();
        }
        if (Find(kv.first)) return false;
        /*插入主逻辑，就是向后去找，直到遇到没有数据的地方。*/
        int hashi = kv.first % _tables.size();
        while (_tables[hashi]._state == HashData<K, V>::State::EXIST) {
            hashi++;
            hashi %= _tables.size();
        }
        _tables[hashi]._kv = kv;
        _tables[hashi]._state = HashData<K, V>::State::EXIST;
        _n++;
    }

    HashData<K, V> *Find(const K &key) /*查找，如果找到了，就返回对应的地址，如果没找到，就返回 nullptr*/
    {
        /*这里不用循环遍历找？直接 hashi，直到 hashi 对应的值是 key*/
        int hashi = key % _tables.size();
        /*先映射，这个位置应该是原本应该在的位置，但是可能被别人占用了，这个时候就要向后遍历，只要一发现，这个位置不是空的，DELETE 也算，因为 DELETE 说明这个位置之前有数据，不知道这个数据在元数据之前是否插入的。就要继续向后找。*/
        int tmp = hashi;
        while (_tables[hashi]._state != HashData<K, V>::EMPTY) {
            if (_tables[hashi]._state == HashData<K, V>::EXIST && _tables[hashi]._kv.first == key) {
                return &_tables[hashi];
            }
            hashi++;
            hashi %= _tables.size();
            if (hashi == tmp) return nullptr;
        }
        return nullptr;
    }

    bool Erase(const K &key) /*删除操作，查找到对应的地址，然后就将对应的地址位置变成 Delete*/
    {
        HashData<K, V> *pdata = Find(key);
        if (pdata == nullptr) return false;
        /*找到了，不是空，那么久 false*/
        pdata->_state = HashData<K, V>::DELETE;
        --_n;
        return true;
    }

    void Order() {
        cout << _n << endl;
        for (int i = 0; i < _tables.size(); i++) {
            if (_tables[i]._state == HashData<K, V>::EXIST)
                cout << _tables[i]._kv.first << " : " << _tables[i]._kv.second << endl;
        }
    }

private:
    void UpMemory() {
        /*扩容步骤：创建一段新空间 重新映射 删除旧空间 */
        int newsize = (_tables.size() == 0) ? 5 : 2 * _tables.size();
        /*如果空间为零就初始化空间为 5，否则就扩容 2 倍。*/
        //*创建一个新的哈希表，让这个哈希表去扩容 newsize 个大小的空间并把是数据都重新插入一遍。*/
        HashTable<K, V> NewHT;
        NewHT._tables.resize(newsize);
        for (int i = 0; i < _tables.size(); i++) {
            if (_tables[i]._state == HashData<K, V>::EXIST) {
                NewHT.insert(_tables[i]._kv);
            }
        }
        /*新表处理完成后，新表的_tables 里面就是扩容后我们需要的哈希表。所以把新表的_tables 和哈希表的_tables 换一下位置。*/
        _tables.swap(NewHT._tables);
    }

private:
    vector<HashData<K, V>> _tables;
    size_t _n = 0;

public:
    static void Test1() {
        HashTable<int, int> hash;
        hash.insert({1, 1});
        hash.insert({12, 1});
        hash.insert({13, 1});
        hash.insert({16, 1});
        hash.insert({161, 1});
        hash.insert({162, 1});
        hash.insert({163, 1});
        hash.insert({164, 1});
        hash.insert({165, 1});
        hash.insert({16, 1});
        hash.insert({-16, 1});
        hash.Erase(16);
        hash.Erase(161);
        hash.Erase(162);
        hash.Erase(163);
        hash.insert({16, 1});
        hash.Erase(16);
        hash.insert({16, 1});
        hash.Order();
    }
};

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
/*unordered_set*/
template<class Key, class Hash, class Pred.......
/*unordered_map*/
template<class Key, class T, class Hash, class Pred......>

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    typedef HashBucket<Key, Key, ....> //省略......
};

template<class Key, class T, class Hash, class Pred.....>
class unordered_map {
    //省略...........
    typedef HashBucket<Key, pair<Key, T>, ....> //省略......
};

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
class HashBucket {
    /*省略.........*/
    Find(const Key &key);
    Erase(const Key &key);
    /*省略.........*/
};

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    typedef HashBucket<Key, Key, ....> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    //省略......
};

template<class Key, class T, class Hash, class Pred.....>
class unordered_map {
    //省略...........
    typedef HashBucket<Key, pair<Key, T>, ....> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    //省略......
};

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
class HashBucket {
    /*省略.........*/
    Find(const Key &key);
    Erase(const Key &key);
    Insert(const Value &data);
    /*省略.........*/
};

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    typedef HashBucket<Key, Key, ....> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 Key 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const Key &data) { return _ht.Insert(data); }
    //省略......
};

template<class Key, class T, class Hash, class Pred.....>
class unordered_map {
    //省略...........
    typedef HashBucket<Key, pair<Key, T>, ....> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 pair<Key, T> 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const pair<K, T> &data) { return _ht.Insert(data); }
    //省略......
};

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
class HashBucket {
    /*省略.........*/
    Find(const Key &key);
    Erase(const Key &key);
    Insert(const Value &data);
    /*省略.........*/
};

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    ///////
    struct KeyOfValue {
        const K &operator()(const K &key) { return key; }
    };
    ///////
    typedef HashBucket<Key, Key, Alloc, KeyOfValue..> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 Key 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const Key &data) { return _ht.Insert(data); }
    //省略......
};

template<class Key, class T, class Hash, class Pred.....>
class unordered_map {
    //省略...........
    ////////////
    struct KeyOfValue {
        const K& operator()(const pair<K, V> &_kv) { return _kv.first; }
    };
    /////////////
    typedef HashBucket<Key, pair<Key, T>, Alloc, KeyOfValue, ...> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 pair<Key, T> 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const pair<K, T> &data) { return _ht.Insert(data); }
    //省略......
};

insert(const Value &data) {
    KeyOfT key; //_tables 是整个数组，里面存放了一串串的桶，_tables.size() 是桶的个数
    int hashi = key(data) % _tables.size(); /*得到存储的桶*/
    //头插将新数据链入桶内
    Node* newnode = new Node(data);
    newnode->_next = _tables[hashi];
    _tables[hashi] = newnode;
}

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
class HashBucket {
    /*省略.........*/
    Find(const Key &key);
    Erase(const Key &key);
    Insert(const Value &data);
    /*省略.........*/
};

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    ///////
    struct KeyOfValue {
        const K &operator()(const K &key) { return key; }
    };
    ///////
    typedef HashBucket<Key, Key, Alloc, KeyOfValue, Hash, ...> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 Key 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const Key &data) { return _ht.Insert(data); }
    //省略......
};

template<class Key, class T, class Hash, class Pred.....>
class unordered_map {
    //省略...........
    ////////////
    struct KeyOfValue {
        const K& operator()(const pair<K, V> &_kv) { return _kv.first; }
    };
    /////////////
    typedef HashBucket<Key, pair<Key, T>, Alloc, KeyOfValue, Hash, ...> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 pair<Key, T> 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const pair<K, T> &data) { return _ht.Insert(data); }
    //省略......
};

/*哈希桶*/
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred, .....>
class HashBucket {
    /*省略.........*/
    Find(const Key &key);
    Erase(const Key &key);
    Insert(const Value &data);
    /*省略.........*/
};

template<class Key, class Hash, class Pred.....>
class unordered_set {
    //省略...........
    ///////
    struct KeyOfValue {
        const K &operator()(const K &key) { return key; }
    };
    ///////
    typedef HashBucket<Key, Key, Alloc, KeyOfValue, Hash, Pred, ...> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 Key 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const Key &data) { return _ht.Insert(data); }
    //省略......
};

template<class Key, class T, class Hash, class Pred....>
class unordered_map {
    //省略...........
    ////////////
    struct KeyOfValue {
        const K& operator()(const pair<K, V> &_kv) { return _kv.first; }
    };
    /////////////
    typedef HashBucket<Key, pair<Key, T>, Alloc, KeyOfValue, Hash, Pred, ...> HT;
    HT _ht; /*定义一个哈希桶对象*/
    Find(const Key &key) { return _ht.Find(key); }
    Erase(const Key &key) { return _ht.Erase(key); }
    /*调用的哈希桶的 Insert，传的是 pair<Key, T> 类型数据，此时哈希桶的 Insert 用的也是 unordermap 传给他的 pair<Key, T>*/
    Insert(const pair<K, T> &data) { return _ht.Insert(data); }
    //省略......
};

C++ 数据结构：哈希表原理与 STL 实现

哈希表

理解哈希表

哈希值（整形）

BKDR 哈希

异或组合

更多推荐文章

相关免费在线工具

hash_combine

哈希函数

直接定址法

除留余数法

平方取中法

基数转换法

哈希冲突

开放定址法

哈希桶

unordered_map 和 unordered_set 如何共用一个哈希桶模板类

STL 的哈希桶中 Insert 如何得到的键值

键为自定义类型的处理

更多推荐文章

相关免费在线工具

C++ 数据结构：哈希表原理与 STL 实现

哈希表

理解哈希表

哈希值（整形）

BKDR 哈希

异或组合

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

hash_combine

哈希函数

直接定址法

除留余数法

平方取中法

基数转换法

哈希冲突

开放定址法

哈希桶

unordered_map 和 unordered_set 如何共用一个哈希桶模板类

STL 的哈希桶中 Insert 如何得到的键值

键为自定义类型的处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具