哈希桶的模拟实现（开散列） | 极客日志

C++算法

哈希桶的模拟实现（开散列）

哈希表作为数据结构核心组件，哈希桶（开散列）利用数组结合单链表有效解决哈希冲突。内容涵盖 HashNode 节点定义、HashFunc 仿函数设计、迭代器跳转逻辑及 HashTable 主体架构。重点解析了插入操作的负载因子控制与素数扩容机制，采用零拷贝方式迁移节点以提升效率。同时阐述了查找与删除操作中前驱指针维护及头尾节点处理细节，展示了基于 KeyOfT 泛型萃取实现 set 与 map 底层复用的设计思路。

古灵精怪发布于 2026/3/17更新于 2026/7/2332 浏览

前言

哈希表是数据结构中的核心组件，而**哈希桶（开散列）**则是解决哈希冲突最实用的方法之一。本文将深入剖析一份完整的哈希桶实现代码，从节点定义到迭代器实现，再到核心操作的源码级解读。

一、整体架构概览

在深入代码之前，我们先了解整个哈希桶的架构设计：

整个实现包含四个核心部分：

HashNode：哈希桶的节点定义 HashFunc：哈希仿函数（支持自定义类型的哈希转换） __HashIterator：迭代器实现（支持范围 for 循环） HashTable：主体实现（包含所有核心操作）

二、基础组件详解

1. 节点定义：HashNode

template<class T>
struct HashNode {
    T _data; // 存储的数据
    HashNode<T>* _next; // 指向下一个节点的指针
    HashNode(const T& data) : _data(data), _next(nullptr) {}
};

设计思路：

单向链表结构：每个桶本质上就是一个不带头结点的单链表。 终极泛型设计 T：注意这里存的不是 Key 和 Value，而是泛型 T。当封装 set 时 T 就是 Key；封装 map 时 T 就是 pair<const Key, Value>。这是 STL 复用代码的精髓。

2. 哈希仿函数：HashFunc

template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

// 字符串特化版本 (BKDR 哈希算法)
template<>
struct HashFunc<string> {
      {
         val = ;
         ( ch : key) {
            val *= ; 
            val += ch;
        }
         val;
    }
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template<class K, class T, class Hash, class KeyOfT>
struct __HashIterator {
    typedef HashNode<T> Node;
    typedef HashTable<K, T, Hash, KeyOfT> HT;
    typedef __HashIterator<K, T, Hash, KeyOfT> Self;
    Node* _node; // 当前指向的节点
    HT* _pht; // 指向哈希表的指针（关键！）

    __HashIterator(Node* node, HT* pht) : _node(node), _pht(pht) {}
};

Self& operator++() {
    if (_node->_next) {
        // 情况 1：当前桶的链表还没走完，直接走向下一个节点
        _node = _node->_next;
    } else {
        // 情况 2：当前桶走完了，去数组里找下一个非空的桶
        Hash hash;
        KeyOfT kot;
        // 难点：如何知道当前是在几号桶？
        // 只能通过当前节点的数据重新计算一次哈希值来定位！
        size_t i = hash(kot(_node->_data)) % _pht->_tables.size();
        ++i; // 从下一个桶开始找
        // 遍历数组找非空桶
        for (; i < _pht->_tables.size(); ++i) {
            if (_pht->_tables[i]) {
                _node = _pht->_tables[i];
                return *this;
            }
        }
        // 找遍了也没找到，说明遍历彻底结束，指向 end()
        _node = nullptr;
    }
    return *this;
}

vector<Node*> _tables; // 指针数组，每个元素是链表的头指针
size_t _size = 0; // 存储的有效元素个数

iterator begin() {
    for (size_t i = 0; i < _tables.size(); i++) {
        if (_tables[i]) {
            return iterator(_tables[i], this);
        }
    }
    return end();
}

iterator end() {
    return iterator(nullptr, this);
}

pair<iterator, bool> Insert(const T& data) {
    Hash hash;
    KeyOfT kot;
    // 步骤 1：去重检查 (利用 KeyOfT 提取 Key 进行查找)
    iterator ret = Find(kot(data));
    if (ret != end()) {
        return make_pair(ret, false); // 已经存在，插入失败
    }
    // 步骤 2：负载因子控制与极速扩容
    if (_size == _tables.size()) {
        // 负载因子达到 1 时扩容
        vector<Node*> newTables;
        // 获取比当前容量大的下一个质数作为新容量 (质数能有效降低哈希冲突)
        newTables.resize(__stl_next_prime(_tables.size()), nullptr);
        // 核心优化：直接迁移旧节点，不进行任何 new 和 delete
        for (size_t i = 0; i < _tables.size(); ++i) {
            Node* cur = _tables[i];
            while (cur) {
                Node* next = cur->_next; // 提前保存下一个节点
                // 重新计算在新表中的位置
                size_t hashi = hash(kot(cur->_data)) % newTables.size();
                // 头插法接入新表
                cur->_next = newTables[hashi];
                newTables[hashi] = cur;
                cur = next;
            }
            _tables[i] = nullptr;
        }
        _tables.swap(newTables); // 瞬间接管新表
    }
    // 步骤 3：计算哈希位置并头插新节点
    size_t hashi = hash(kot(data)) % _tables.size();
    Node* newnode = new Node(data);
    newnode->_next = _tables[hashi];
    _tables[hashi] = newnode;
    ++_size;
    return make_pair(iterator(newnode, this), true);
}

if (_size == _tables.size()) { // 负载因子 == 1
    vector<Node*> newTables;
    // 获取下一个质数作为新容量
    newTables.resize(__stl_next_prime(_tables.size()), nullptr);
    // 重新映射所有节点
    for (size_t i = 0; i < _tables.size(); i++) {
        Node* cur = _tables[i];
        while (cur) {
            Node* next = cur->_next;
            // 重新计算在新表中的位置
            size_t hashi = hash(kot(cur->_data)) % newTables.size();
            // 头插到新表
            cur->_next = newTables[hashi];
            newTables[hashi] = cur;
            cur = next;
        }
        _tables[i] = nullptr;
    }
    _tables.swap(newTables);
}

iterator Find(const K& key) {
    if (_tables.empty()) return end();
    KeyOfT kot;
    Hash hash;
    size_t hashi = hash(key) % _tables.size(); // 计算桶位置
    Node* cur = _tables[hashi];
    while (cur) {
        // 遍历单链表，对比 Key
        if (kot(cur->_data) == key) {
            return iterator(cur, this);
        }
        cur = cur->_next;
    }
    return end();
}

bool Erase(const K& key) {
    if (_tables.empty()) return false;
    KeyOfT kot;
    Hash hash;
    size_t hashi = hash(key) % _tables.size();
    Node* prev = nullptr;
    Node* cur = _tables[hashi];
    while (cur) {
        if (kot(cur->_data) == key) {
            // 情况 A：要删除的是桶的第一个节点（头节点）
            if (prev == nullptr) {
                _tables[hashi] = cur->_next;
            }
            // 情况 B：要删除的是中间节点
            else {
                prev->_next = cur->_next;
            }
            delete cur; // 释放内存
            --_size;
            return true;
        }
        prev = cur;
        cur = cur->_next;
    }
    return false; // 没找到
}

哈希桶的模拟实现（开散列）

前言

一、整体架构概览

二、基础组件详解

1. 节点定义：HashNode

2. 哈希仿函数：HashFunc

更多推荐文章

相关免费在线工具

三、迭代器实现：__HashIterator

1. 为什么需要持有哈希表指针？

2. operator++ 的核心逻辑

四、哈希表主体：HashTable

1. 成员变量

2. 迭代器接口

五、核心操作深度剖析

1. 插入操作 Insert() - 重中之重

负载因子与扩容机制

2. 查找操作 Find()

3. 删除操作 Erase()

六、总结

更多推荐文章

相关免费在线工具

哈希桶的模拟实现（开散列）

前言

一、整体架构概览

二、基础组件详解

1. 节点定义：HashNode

2. 哈希仿函数：HashFunc

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、迭代器实现：__HashIterator

1. 为什么需要持有哈希表指针？

2. operator++ 的核心逻辑

四、哈希表主体：HashTable

1. 成员变量

2. 迭代器接口

五、核心操作深度剖析

1. 插入操作 Insert() - 重中之重

负载因子与扩容机制

2. 查找操作 Find()

3. 删除操作 Erase()

六、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具