C++ 哈希表原理与实现

C++ 哈希表原理与实现 | 极客日志

enum STATE { EXIST, EMPTY, DELETE };
template<class K, class V>
struct HashData {
    pair<K, V> _kv;
    STATE _state = EMPTY;
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>
class HashTable {
public:
    HashTable() { _table.resize(10); }
private:
    vector<HashData<K, V>> _table;
    size_t _n = 0; // 存储有效数据的个数
};

template<class K>
struct DefaultHashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<>
struct DefaultHashFunc<string> {
    size_t operator()(const string& str) {
        // BKDR
        size_t hash = 0;
        for(auto ch : str) {
            hash *= 131;
            hash += ch;
        }
        return hash;
    }
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>

bool Insert(const pair<K, V>& kv) {
    // 扩容
    if (_n * 10 / _table.size() >= 7) {
        size_t newSize = _table.size() * 2;
        // 遍历旧表，重新映射到新表
        HashTable<K, V, HashFunc> newHT;
        newHT._table.resize(newSize);
        // 遍历旧表的数据插入到新表即可
        for(size_t i = 0; i < _table.size(); i++) {
            if(_table[i]._state == EXIST) {
                newHT.Insert(_table[i]._kv);
            }
        }
        _table.swap(newHT._table);
    }
    // 线性探测
    HashFunc hf;
    size_t hashi = hf(kv.first) % _table.size();
    while(_table[hashi]._state == EXIST) {
        ++hashi;
        hashi %= _table.size();
    }
    _table[hashi]._kv = kv;
    _table[hashi]._state = EXIST;
    ++_n;
    return true;
}

HashData<const K, V>* Find(const K& key) {
    // 线性探测
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    while(_table[hashi]._state != EMPTY) {
        if(_table[hashi]._state == EXIST && _table[hashi]._kv.first == key) {
            return (HashData<const K, V>*)& _table[hashi];
        }
        ++hashi;
        hashi %= _table.size();
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashData<const K, V>* ret = Find(key);
    if(ret) {
        ret->_state = DELETE;
        --_n;
        return true;
    }
    return false;
}

h(i) = (h₀ + i²) % table_size

探测次数 i	计算公式	结果 h(i)
1	`(3 + 1²) % 7`	4
2	`(3 + 2²) % 7`	0
3	`(3 + 3²) % 7`	5
4	`(3 + 4²) % 7`	2
5	`(3 + 5²) % 7`	6
6	`(3 + 6²) % 7`	1

探测次数 i	计算公式	结果 h(i)
1	`(h₀ + 1²) % 4`	h₀ + 1
2	`(h₀ + 2²) % 4`	h₀
3	`(h₀ + 3²) % 4`	h₀ + 1

bool Insert(const pair<K, V>& kv) {
    // 扩容逻辑（略）
    HashFunc hf;
    size_t h0 = hf(kv.first) % _table.size();
    // 二次探测
    for(size_t i = 1; i < _table.size(); ++i) {
        size_t hashi = (h0 + i * i) % _table.size();
        if(_table[hashi]._state != EXIST) {
            _table[hashi]._kv = kv;
            _table[hashi]._state = EXIST;
            ++_n;
            return true;
        }
    }
    return false; // 表满（实际不会触发，因提前扩容）
}

特性	线性探测	二次探测
探测序列	`h₀, h₀+1, h₀+2, ...`	`h₀, h₀+1, h₀+4, h₀+9, ...`
聚集问题	严重（主聚集）	较轻（二次聚集）
空间利用率	低（易导致连续槽位被占用）	高（更均匀分布）
表满检测	遍历全量槽位即可检测	需遍历约一半槽位

template<class K, class V>
struct HashNode {
    pair<K, V> _kv;
    HashNode<K, V>* _next;
    HashNode(const pair<K, V>& _kv):_kv(kv),_next(nullptr){}
};

template<class K, class V, class HashFunc = DefaultHashFunc<K>>
class HashTable {
    typedef HashNode<K, V> Node;
public:
    HashTable() { _table.resize(10, nullptr); }
    ~HashTable() {
        for(size_t i = 0; i < _table.size(); i++) {
            Node* cur = _table[i];
            while(cur) {
                Node* next = cur->_next;
                delete cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
    }
private:
    vector<Node*> _table; // 指针数组
    size_t _n = 0; // 存储了多少个有效数据
};

bool Insert(const pair<K, V>& kv) {
    if(Find(kv.first)) {
        return false;
    }
    HashFunc hf;
    // 负载因子到 1 就扩容
    if(_n == _table.size()) {
        size_t newSize = _table.size() * 2;
        vector<Node*> newTable;
        newTable.resize(newSize, nullptr);
        // 遍历旧表，顺手牵羊，把节点牵下来挂到新表
        for(size_t i = 0; i < _table.size(); i++) {
            Node* cur = _table[i];
            while(cur) {
                Node* next = cur->_next;
                // 头插到新表
                size_t hashi = hf(cur->_kv.first) % newSize;
                cur->_next = newTable[hashi];
                newTable[hashi] = cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
        _table.swap(newTable);
    }
    size_t hashi = hf(kv.first) % _table.size();
    // 头插
    Node* newnode = new Node(kv);
    newnode->_next = _table[hashi];
    _table[hashi] = newnode;
    ++_n;
    return true;
}

Node* Find(const K& key) {
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    Node* cur = _table[hashi];
    while(cur) {
        if(cur->_kv.first == key) {
            return cur;
        }
        cur = cur->_next;
    }
    return nullptr;
}

bool Erase(const K& key) {
    HashFunc hf;
    size_t hashi = hf(key) % _table.size();
    Node* prev = nullptr;
    Node* cur = _table[hashi];
    while(cur) {
        if(cur->_kv.first == key) {
            if(prev == nullptr) {
                _table[hashi] = cur->_next;
            } else {
                prev->_next = cur->_next;
            }
            delete cur;
            return true;
        }
        prev = cur;
        cur = cur->_next;
    }
    return false;
}

C++ 哈希表原理与实现

C++ 哈希表原理与实现

1.什么是哈希？

2.哈希的常见实现方法

2.1 直接定址法

2.2 除留余数法

3.哈希冲突

4.哈希冲突的解决

4.1 闭散列

4.1.1 线性探测

4.1.1.1 哈希表的基本数据结构

更多推荐文章

相关免费在线工具

4.1.1.2 哈希表的 key 转换

4.1.1.3 哈希表的插入

4.1.1.4 哈希表的查找

4.1.1.5 哈希表的删除

4.1.2 二次探测

4.1.3 线性探测和二次探测对比

4.2 开散列

4.2.1 哈希桶

4.2.1.1 哈希表的基本数据结构

4.2.1.2 哈希表的插入

4.2.1.3 哈希表的查找

4.2.1.4 哈希表的删除

4.3 开散列与闭散列比较

更多推荐文章

相关免费在线工具

C++ 哈希表原理与实现

C++ 哈希表原理与实现

1.什么是哈希？

2.哈希的常见实现方法

2.1 直接定址法

2.2 除留余数法

3.哈希冲突

4.哈希冲突的解决

4.1 闭散列

4.1.1 线性探测

4.1.1.1 哈希表的基本数据结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4.1.1.2 哈希表的 key 转换

4.1.1.3 哈希表的插入

4.1.1.4 哈希表的查找

4.1.1.5 哈希表的删除

4.1.2 二次探测

4.1.3 线性探测和二次探测对比

4.2 开散列

4.2.1 哈希桶

4.2.1.1 哈希表的基本数据结构

4.2.1.2 哈希表的插入

4.2.1.3 哈希表的查找

4.2.1.4 哈希表的删除

4.3 开散列与闭散列比较

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具