C++ 哈希表原理与线性探测、哈希桶模拟实现 | 极客日志

C++算法

C++ 哈希表原理与线性探测、哈希桶模拟实现

哈希表通过哈希函数将键映射为数组索引，实现 O(1) 查找。核心涉及负载因子控制与冲突处理。本文详解线性探测开放寻址法与哈希桶链地址法的 C++ 模拟实现，涵盖扩容、删除逻辑及迭代器设计，并基于此构建 unordered_map 与 unordered_set。

laoliangsh发布于 2026/3/16更新于 2026/8/137 浏览

C++ 哈希表原理与模拟实现

哈希表基础

哈希表（Hash Table）是一种通过键（Key）直接访问值（Value）的数据结构。其核心思想是利用哈希函数将任意大小的键映射为固定大小的整数（哈希值），再将其作为数组索引存储数据。理想情况下，查找、插入和删除的时间复杂度接近 O(1)。

负载因子与扩容

哈希表的效率高度依赖负载因子（Load Factor），即已存元素数量与数组总大小的比值。

负载因子低：空位多，冲突少，速度快。
负载因子高：空位少，冲突增加，性能下降。

通常设定阈值（如 0.75）。当超过阈值时，需进行扩容（Rehashing）：创建更大的新数组（通常为原大小两倍），将所有旧元素重新计算哈希并插入新表，以维持常数级操作效率。

哈希冲突处理

由于输入空间远大于输出空间，不同键可能映射到同一位置，即哈希冲突。主流解决策略有两种：

开放寻址法（Open Addressing）：冲突时在数组内寻找下一个空闲槽位。典型代表是线性探测法，所有数据存储在数组中，缓存友好，但删除较复杂。
链地址法（Separate Chaining）：每个数组位置挂一个链表（或树）。冲突元素存入链表，删除方便，但需要额外指针空间，内存不连续。

线性探测法模拟实现

线性探测属于开放寻址法。当发生冲突时，依次向后检查直到找到空位。为了支持删除操作，我们需要标记节点状态：EXIST（存在）、EMPTY（空）、DELETE（逻辑删除）。

数据结构定义

#pragma once
#include <vector>
#include <string>
using namespace std;

enum STATE { EXIST, EMPTY, DELETE };

template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    STATE _state = EMPTY;
};

哈希函数设计

针对不同类型键，哈希函数需适配。对于整数可直接转换，字符串则需专用算法（如 BKDR）以保证分布均匀。

template<class K>
struct DefaultHashFunc {
    {
         ()key;
    }
};

<>
 <string> {
    {
         hash = ;
         ( ch : str) {
            hash *= ;
            hash += ch;
        }
         hash;
    }
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template<class K, class V, class HashFunc = DefaultHashFunc<K>>
class HashTable {
public:
    HashTable() { _table.resize(10); }

    bool Insert(const pair<K, V>& kv) {
        if (_n * 10 / _table.size() >= 7) {
            size_t newSize = _table.size() * 2;
            HashTable<K, V, HashFunc> newHT;
            newHT._table.resize(newSize);
            for (size_t i = 0; i < _table.size(); ++i) {
                if (_table[i]._state == EXIST)
                    newHT.Insert(_table[i]._kv);
            }
            _table.swap(newHT._table);
        }

        HashFunc hf;
        size_t hashi = hf(kv.first) % _table.size();
        while (_table[hashi]._state == EXIST) {
            ++hashi;
            hashi %= _table.size();
        }
        _table[hashi]._kv = kv;
        _table[hashi]._state = EXIST;
        ++_n;
        return true;
    }

    // Find 和 Erase 实现略，遵循线性探测规则
private:
    vector<HashData<K, V>> _table;
    size_t _n = 0;
};

namespace hash_bucket {
template <class K, class V>
struct HashNode {
    pair<K, V> _kv;
    HashNode* _next;
    HashNode(const pair<K, V>& kv) : _kv(kv), _next(nullptr) {}
};

template <class K, class V, class HashFunc = DefaultHashFunc<K>>
class HashTable {
    typedef HashNode<K, V> Node;
public:
    HashTable() { _table.resize(10, nullptr); }
    ~HashTable() {
        for (size_t i = 0; i < _table.size(); ++i) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                delete cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
    }
private:
    vector<Node*> _table;
    size_t _n = 0;
};
}

bool Insert(const pair<K, V>& kv) {
    if (Find(kv.first)) return false;
    
    if (_n == _table.size()) {
        size_t newSize = _table.size() * 2;
        vector<Node*> newTable(newSize, nullptr);
        for (size_t i = 0; i < _table.size(); ++i) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                size_t hashi = hf(cur->_kv.first) % newSize;
                cur->_next = newTable[hashi];
                newTable[hashi] = cur;
                cur = next;
            }
        }
        _table.swap(newTable);
    }

    size_t hashi = hf(kv.first) % _table.size();
    Node* newnode = new Node(kv);
    newnode->_next = _table[hashi];
    _table[hashi] = newnode;
    ++_n;
    return true;
}

template<class K, class T, class Ptr, class Ref, class KeyOfT, class HashFunc>
struct HTIterator {
    typedef HashNode<T> Node;
    Node* _node;
    const HashTable<K, T, KeyOfT, HashFunc>* _pht;

    Self& operator++() {
        if (_node->_next) {
            _node = _node->_next;
        } else {
            KeyOfT kot;
            HashFunc hf;
            size_t hashi = hf(kot(_node->_data)) % _pht->_table.size();
            ++hashi;
            while (hashi < _pht->_table.size()) {
                if (_pht->_table[hashi]) {
                    _node = _pht->_table[hashi];
                    return *this;
                }
                ++hashi;
            }
            _node = nullptr;
        }
        return *this;
    }
    // ... operator!=, operator* 等省略
};

namespace mySTL {
template<class K, class V>
class unordered_map {
    struct MapKeyOfT {
        const K& operator()(const pair<const K, V>& kv) { return kv.first; }
    };
public:
    typedef typename hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT>::iterator iterator;
    iterator begin() { return _ht.begin(); }
    iterator end() { return _ht.end(); }
    pair<iterator, bool> insert(const pair<K, V>& kv) {
        return _ht.Insert(kv);
    }
    V& operator[](const K& key) {
        pair<iterator, bool> ret = _ht.Insert(make_pair(key, V()));
        return ret.first->second;
    }
private:
    hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT> _ht;
};
}

namespace mySTL {
template<class K>
class unordered_set {
    struct SetKeyOfT {
        const K& operator()(const K& key) { return key; }
    };
public:
    typedef typename hash_bucket::HashTable<K, K, SetKeyOfT>::const_iterator iterator;
    pair<iterator, bool> insert(const K& key) {
        auto ret = _ht.Insert(key);
        return pair<iterator, bool>(ret.first, ret.second);
    }
private:
    hash_bucket::HashTable<K, K, SetKeyOfT> _ht;
};
}

C++ 哈希表原理与线性探测、哈希桶模拟实现

C++ 哈希表原理与模拟实现

哈希表基础

负载因子与扩容

哈希冲突处理

线性探测法模拟实现

数据结构定义

哈希函数设计

更多推荐文章

相关免费在线工具

核心操作实现

插入与扩容

删除逻辑

哈希桶（链地址法）模拟实现

节点与类结构

插入与扩容

删除操作

模拟 STL 容器

迭代器设计

unordered_map 实现

unordered_set 实现

更多推荐文章

相关免费在线工具

C++ 哈希表原理与线性探测、哈希桶模拟实现

C++ 哈希表原理与模拟实现

哈希表基础

负载因子与扩容

哈希冲突处理

线性探测法模拟实现

数据结构定义

哈希函数设计

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

核心操作实现

插入与扩容

删除逻辑

哈希桶（链地址法）模拟实现

节点与类结构

插入与扩容

删除操作

模拟 STL 容器

迭代器设计

unordered_map 实现

unordered_set 实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具