C++ 数据结构：哈希表原理与 STL 实现详解 | 极客日志

C++算法

C++ 数据结构：哈希表原理与 STL 实现详解

综述由AI生成哈希表通过哈希函数将 Key 映射为数组下标，核心在于处理冲突。理解路径分为哈希值转换、哈希函数选择及冲突解决策略。常见冲突处理方式包括开放定址法（线性/二次探测）与哈希桶（链地址法）。C++ STL 中 unordered_map 与 unordered_set 底层均基于哈希桶模板类，通过提取键值的仿函数（ExtractKey）及自定义哈希策略（Hash）支持任意类型键。本文详细解析了哈希原理、经典算法及 STL 源码层面的封装逻辑。

RedisGeek发布于 2026/3/16更新于 2026/6/1121 浏览

C++ 数据结构：哈希表原理与 STL 实现详解

哈希表基础

首先需要明确哈希（Hash）与哈希表（Hash Table）的区别。哈希是一种映射算法思想，而哈希表则是基于这种思想构建的数据结构。

哈希表的核心流程是统一的：获取一个 Key，通过哈希函数计算 Hasher(Key)，得到存储位置并存放 Value；或者从该位置取出对应的 Value。

理解哈希表的三个层次

要深入理解哈希表，建议从以下三个层面递进学习：

哈希值：这是最基础的整数表示。
哈希函数：将哈希值映射到具体空间位置的方法。
哈希冲突：当多个 Key 映射到同一位置时的处理机制。

STL 底层哈希函数的本质是对哈希值进行二次 Hash。无论 Key 是 string、vector 还是其他自定义类型，最终都需要转换为整形哈希值才能被处理。因此，先获得哈希值，再使用哈希函数确定映射位置，是理解的关键逻辑链。

此外，哈希表在逻辑上可视为数组。数组有大小限制，当数据量超过容量或不同自定义类型的哈希值相同，必然产生哈希冲突。哈希是功能，冲突是结果，两者存在因果关系。

哈希值与转换策略

哈希函数通常针对整形数据进行操作（如除留余数法）。在使用 STL 时，若要对自定义类型进行哈希，必须提供将其转换为哈希值的策略（仿函数）。

转换策略需满足速度快、离散度高的要求。常见的策略包括：

BKDR 哈希：适用于字符串。
异或组合：适用于简单容器。
hash_combine：适用于多成员复杂结构。

BKDR 哈希

优点是实现简单、计算快、离散度高。通过选取种子（如 131），对字符串每个字符进行处理。

size_t BKDRHash(const std::string &str) {
    size_t seed = 131; // 常用种子：31, 131, 1313...
    size_t hash = 1;
    for (auto e : str) {
        hash *= seed;
        hash += e;
    }
    return hash & 0x7FFFFFFF; // 确保返回正数
}

异或组合

适用于 vector<int> 等简单场景，实现简单但冲突率相对较高。

struct PointHash {
    size_t operator()(const std::vector<int> &vec)  {
         hash = ;
         ( e : vec) {
            hash ^= (e << );
        }
         hash;
    }
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template <typename T>
void hash_combine(std::size_t& seed, const T& val) {
    seed ^= std::hash<T>()(val) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
}

struct Person {
    std::string name;
    int age;
    bool operator==(const Person& p) const {
        return name == p.name && age == p.age;
    }
};

struct PersonHash {
    std::size_t operator()(const Person& p) const {
        std::size_t seed = 0;
        hash_combine(seed, p.name);
        hash_combine(seed, p.age);
        return seed;
    }
};

template <class K, class V>
class HashData {
public:
    enum State { EMPTY, EXIST, DELETE };
    std::pair<K, V> _kv;
    State _state;
};

template <class K, class V>
class HashTable {
private:
    std::vector<HashData<K, V>> _tables;
    size_t _n = 0;

public:
    bool insert(const std::pair<K, V> &kv) {
        if (_tables.empty() || (_n * 10) / _tables.size() >= 7) {
            UpMemory();
        }
        if (Find(kv.first)) return false;

        int hashi = kv.first % _tables.size();
        while (_tables[hashi]._state == HashData<K, V>::State::EXIST) {
            hashi++;
            hashi %= _tables.size();
        }
        _tables[hashi]._kv = kv;
        _tables[hashi]._state = HashData<K, V>::State::EXIST;
        _n++;
        return true;
    }

    HashData<K, V>* Find(const K &key) {
        int hashi = key % _tables.size();
        int tmp = hashi;
        while (_tables[hashi]._state != HashData<K, V>::EMPTY) {
            if (_tables[hashi]._state == HashData<K, V>::EXIST && 
                _tables[hashi]._kv.first == key) {
                return &_tables[hashi];
            }
            hashi++;
            hashi %= _tables.size();
            if (hashi == tmp) return nullptr;
        }
        return nullptr;
    }

    bool Erase(const K &key) {
        HashData<K, V> *pdata = Find(key);
        if (!pdata) return false;
        pdata->_state = HashData<K, V>::State::DELETE;
        --_n;
        return true;
    }

private:
    void UpMemory() {
        int newsize = _tables.empty() ? 5 : _tables.size() * 2;
        HashTable<K, V> NewHT;
        NewHT._tables.resize(newsize);
        for (int i = 0; i < _tables.size(); ++i) {
            if (_tables[i]._state == HashData<K, V>::State::EXIST) {
                NewHT.insert(_tables[i]._kv);
            }
        }
        _tables.swap(NewHT._tables);
    }
};

// 哈希桶定义
template<class Key, class Value, class Alloc, class ExtractKey, class Hash, class __Pred>
class HashBucket {
    // ... Find, Erase, Insert 实现 ...
};

// unordered_set 封装
template<class Key, class Hash, class Pred>
class unordered_set {
    typedef HashBucket<Key, Key, ..., KeyOfValue, Hash, Pred> HT;
    HT _ht;
    struct KeyOfValue { const Key& operator()(const Key& key) { return key; } };
    // ... 调用 _ht.Insert(data) ...
};

// unordered_map 封装
template<class Key, class T, class Hash, class Pred>
class unordered_map {
    typedef HashBucket<Key, std::pair<Key, T>, ..., KeyOfValue, Hash, Pred> HT;
    HT _ht;
    struct KeyOfValue { const Key& operator()(const std::pair<Key, T>& kv) { return kv.first; } };
    // ... 调用 _ht.Insert(data) ...
};

insert(const Value &data) {
    KeyOfT key;
    int hashi = key(data) % _tables.size(); // 利用提取的 Key 计算哈希
    Node* newnode = new Node(data);
    newnode->_next = _tables[hashi];
    _tables[hashi] = newnode;
}

C++ 数据结构：哈希表原理与 STL 实现详解

C++ 数据结构：哈希表原理与 STL 实现详解

哈希表基础

理解哈希表的三个层次

哈希值与转换策略

BKDR 哈希

异或组合

更多推荐文章

相关免费在线工具

hash_combine

常见哈希函数

直接定址法

除留余数法

平方取中法

基数转换法

哈希冲突解决

开放定址法

哈希桶（链地址法）

unordered_map 与 unordered_set 的复用

自定义类型键的处理

更多推荐文章

相关免费在线工具

C++ 数据结构：哈希表原理与 STL 实现详解

C++ 数据结构：哈希表原理与 STL 实现详解

哈希表基础

理解哈希表的三个层次

哈希值与转换策略

BKDR 哈希

异或组合

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

hash_combine

常见哈希函数

直接定址法

除留余数法

平方取中法

基数转换法

哈希冲突解决

开放定址法

哈希桶（链地址法）

unordered_map 与 unordered_set 的复用

自定义类型键的处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具