哈希表原理与实现：线性探测及链地址法

哈希表原理与实现：线性探测及链地址法 | 极客日志

h(19) = 19 % 11 = 8
h(30) = 30 % 11 = 8 -> h(30) = (8 + 1) % 11 = 9
h(5) = 5 % 11 = 5
h(36) = 36 % 11 = 3
h(13) = 13 % 11 = 2
h(20) = 20 % 11 = 9 -> h(20) = (9 + 1) % 11 = 10
h(21) = 21 % 11 = 10 -> h(21) = (10 + 1) % 11 = 0
h(12) = 12 % 11 = 1

h(19) = 19 % 11 = 8
h(30) = 30 % 11 = 8 -> h(30, 1) = (8 + 1) % 11 = 9
h(52) = 52 % 11 = 8 -> h(52, 1) = (8 + 1) % 11 = 9 -> h(52, -1) = (8 - 1) % 11 = 7
h(63) = 63 % 11 = 8 -> h(63, 1) = (8 + 1) % 11 = 9 -> h(63, -1) = (8 - 1) % 11 = 7 -> h(63, 4) = (8 + 4) % 11 = 1
h(11) = 11 % 11 = 0
h(22) = 22 % 11 = 0 -> h(22, 1) = (0 + 1) % 11 = 1 -> h(22, -1) = (0 - 1) % 11 = -1，再 -1 + 11 = 10

19 % 11 = 8，30 % 11 = 8，5 % 11 = 5，36 % 11 = 3，13 % 11 = 2
20 % 11 = 9，21 % 11 = 10，12 % 11 = 1，24 % 11 = 2，96 % 11 = 8

enum State {
    EXIST,   // 表示有数据
    EMPTY,   // 表示无数据
    DELETE   // 表示数据已删除
};

template<class K, class V>
struct HashData {
    pair<K, V> _data; // 数据
    State _state;     // 标识
};

template<class K, class V, class Hash = HashFunc<K>>
class HashTable {
public:
    // ...
private:
    vector<HashData<K, V>> _table; // 存储数据的顺序表
    size_t _n;                     // 有效元素个数
};

template<class K>
class HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

// 处理字符串的特化类
template<>
class HashFunc<string> {
    size_t operator()(const string& str) {
        size_t key = 0;
        for (auto& e : str) {
            key += e;
            key *= 131;
        }
        return key;
    }
};

HashData<K, V>* Find(const K& key) {
    Hash hash;
    int hash0 = hash(key) % _table.size();
    int hashi = hash0;
    int i = 1;
    while (_table[hashi]._state != EMPTY) {
        if (_table[hashi]._state == EXIST && _table[hashi]._data.first == key) {
            return &_table[hashi];
        }
        hashi = (hash0 + i) % _table.size();
        i++;
    }
    return nullptr;
}

bool Insert(const pair<K, V>& kv) {
    // 已有元素则不进行插入
    if (Find(kv.first)) return false;

    // 负载因子大于 0.7 进行扩容
    if (_n * 10 / _table.size() >= 7) {
        HashTable<K, V, Hash> newTable;
        newTable._table.resize(__stl_next_prime(_table.size() + 1)); // +1 防止开的空间不变
        // 将旧表数据放入新表
        for (int i = 0; i < _table.size(); ++i) {
            if (_table[i]._state == EXIST) {
                newTable.Insert(_table[i]._data);
            }
        }
        // 交换新表和旧表
        swap(newTable._table, _table);
    }

    // 寻找位置插入
    Hash hash;
    int hash0 = hash(kv.first) % _table.size();
    int hashi = hash0;
    int i = 1;
    while (_table[hashi]._state == EXIST) {
        hashi = (hash0 + i) % _table.size();
        i++;
    }
    _table[hashi]._data = kv;
    _table[hashi]._state = EXIST;
    _n++;
    return true;
}

bool Erase(const K& key) {
    HashData<K, V>* ret = Find(key);
    if (!ret) return false;
    ret->_state = DELETE;
    _n--;
    return true;
}

template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<>
struct HashFunc<string> {
    size_t operator()(const string& str) {
        size_t key = 0;
        for (auto& e : str) {
            key += e;
            key *= 131;
        }
        return key;
    }
};

enum State {
    EXIST,   // 表示有数据
    EMPTY,   // 表示无数据
    DELETE   // 表示数据已删除
};

template<class K, class V>
struct HashData {
    pair<K, V> _data; // 数据
    State _state = EMPTY; // 标识
};

template<class K, class V, class Hash = HashFunc<K>>
class HashTable {
    // C++ 库中使用的扩容方案 -- 列举出多个质数
    inline unsigned long __stl_next_prime(unsigned long n) {
        static const int __stl_num_primes = 28;
        static const unsigned long __stl_prime_list[__stl_num_primes] = {
            53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
            49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
            6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
            402653189, 805306457, 1610612741, 3221225473, 4294967291
        };
        const unsigned long* first = __stl_prime_list;
        const unsigned long* last = __stl_prime_list + __stl_num_primes;
        const unsigned long* pos = lower_bound(first, last, n);
        return pos == last ? *(last - 1) : *pos;
    }

public:
    HashTable() {
        _table.resize(__stl_next_prime(0));
        _n = 0;
    }

    bool Insert(const pair<K, V>& kv) {
        // 已有元素则不进行插入
        if (Find(kv.first)) return false;

        // 负载因子大于 0.7 进行扩容
        if (_n * 10 / _table.size() >= 7) {
            HashTable<K, V, Hash> newTable;
            newTable._table.resize(__stl_next_prime(_table.size() + 1)); // +1 防止开的空间不变
            // 将旧表数据放入新表
            for (int i = 0; i < _table.size(); ++i) {
                if (_table[i]._state == EXIST) {
                    newTable.Insert(_table[i]._data);
                }
            }
            // 交换新表和旧表
            swap(newTable._table, _table);
        }

        // 寻找位置插入
        Hash hash;
        int hash0 = hash(kv.first) % _table.size();
        int hashi = hash0;
        int i = 1;
        while (_table[hashi]._state == EXIST) {
            hashi = (hash0 + i) % _table.size();
            i++;
        }
        _table[hashi]._data = kv;
        _table[hashi]._state = EXIST;
        _n++;
        return true;
    }

    HashData<K, V>* Find(const K& key) {
        Hash hash;
        int hash0 = hash(key) % _table.size();
        int hashi = hash0;
        int i = 1;
        // 查找到空为止
        while (_table[hashi]._state != EMPTY) {
            // 若存在值并且相等，返回该值的地址
            if (_table[hashi]._state == EXIST && _table[hashi]._data.first == key) {
                return &_table[hashi];
            }
            // 若存在值不相等或值已删除，则继续向后查找
            hashi = (hash0 + i) % _table.size();
            i++;
        }
        return nullptr;
    }

    bool Erase(const K& key) {
        HashData<K, V>* ret = Find(key);
        if (!ret) return false;
        ret->_state = DELETE;
        _n--;
        return true;
    }

private:
    vector<HashData<K, V>> _table;
    size_t _n;
};

template<class K, class V>
struct HashNode {
    HashNode(const pair<K, V>& kv) : _kv(kv), _next(nullptr) {}
    pair<K, V> _kv;
    HashNode<K, V>* _next; // 指向下一结点的指针
};

template<class K, class V, class Hash = HashFunc<K>>
class HashTable {
    typedef HashNode<K, V> Node;
public:
    // ...
private:
    vector<Node*> _table; // 使用 vector，因为 list 的迭代器不方便在这里使用
    size_t _n;            // 有效元素个数
};

~HashTable() {
    for (int i = 0; i < _table.size(); i++) {
        Node* cur = _table[i];
        while (cur) {
            Node* next = cur->_next;
            delete cur;
            cur = next;
        }
        _table[i] = nullptr;
    }
}

HashNode<K, V>* Find(const K& key) {
    Hash hash;
    size_t hashi = hash(key) % _table.size();
    Node* cur = _table[hashi];
    while (cur) {
        if (cur->_kv.first == key) return cur;
        cur = cur->_next;
    }
    return nullptr;
}

bool Insert(const pair<K, V>& kv) {
    if (Find(kv.first)) return false;
    Hash hash;

    // 负载因子为 1 进行扩容
    if (_n == _table.size()) {
        // 开新表
        vector<Node*> newTable;
        newTable.resize(__stl_next_prime(_table.size() + 1), nullptr);
        // 将原表的数据移动到新表内
        for (int i = 0; i < _table.size(); ++i) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                size_t hashi = hash(cur->_kv.first) % newTable.size();
                cur->_next = newTable[hashi];
                newTable[hashi] = cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
        swap(newTable, _table);
    }

    size_t hashi = hash(kv.first) % _table.size();
    Node* newNode = new Node(kv);
    newNode->_next = _table[hashi];
    _table[hashi] = newNode;
    ++_n;
    return true;
}

bool Erase(const K& key) {
    Hash hash;
    size_t hashi = hash(key) % _table.size();
    Node* cur = _table[hashi];
    Node* prev = nullptr;
    while (cur) {
        if (cur->_kv.first == key && prev == nullptr) {
            _table[hashi] = cur->_next;
            --_n;
            delete cur;
            return true;
        } else if (cur->_kv.first == key && prev) {
            prev->_next = cur->_next;
            --_n;
            delete cur;
            return true;
        }
        prev = cur;
        cur = cur->_next;
    }
    return false;
}

template<class K>
struct HashFunc {
    size_t operator()(const K& key) {
        return (size_t)key;
    }
};

template<>
struct HashFunc<string> {
    size_t operator()(const string& str) {
        size_t ret = 0;
        for (auto& ch : str) {
            ret += ch;
            ret *= 131;
        }
        return ret;
    }
};

// 数据
template<class K, class V>
struct HashNode {
    HashNode(const pair<K, V>& kv) : _kv(kv), _next(nullptr) {}
    pair<K, V> _kv;
    HashNode<K, V>* _next;
};

// 哈希表
template<class K, class V, class Hash = HashFunc<K>>
class HashTable {
    typedef HashNode<K, V> Node;
    inline unsigned long __stl_next_prime(unsigned long n) {
        static const int __stl_num_primes = 28;
        static const unsigned long __stl_prime_list[__stl_num_primes] = {
            53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
            49157, 98317, 196613, 393241, 786433, 1572869, 3145739,
            6291469, 12582917, 25165843, 50331653, 100663319, 201326611,
            402653189, 805306457, 1610612741, 3221225473, 4294967291
        };
        const unsigned long* first = __stl_prime_list;
        const unsigned long* last = __stl_prime_list + __stl_num_primes;
        const unsigned long* pos = lower_bound(first, last, n);
        return pos == last ? *(last - 1) : *pos;
    }

public:
    HashTable() {
        _table.resize(11, nullptr);
        _n = 0;
    }

    ~HashTable() {
        for (int i = 0; i < _table.size(); i++) {
            Node* cur = _table[i];
            while (cur) {
                Node* next = cur->_next;
                delete cur;
                cur = next;
            }
            _table[i] = nullptr;
        }
    }

    // 插入
    bool Insert(const pair<K, V>& kv) {
        if (Find(kv.first)) return false;
        Hash hash;
        // 负载因子为 1 进行扩容
        if (_n == _table.size()) {
            // 开新表
            vector<Node*> newTable;
            newTable.resize(__stl_next_prime(_table.size() + 1), nullptr);
            // 将原表的数据移动到新表内
            for (int i = 0; i < _table.size(); ++i) {
                Node* cur = _table[i];
                while (cur) {
                    Node* next = cur->_next;
                    size_t hashi = hash(cur->_kv.first) % newTable.size();
                    cur->_next = newTable[hashi];
                    newTable[hashi] = cur;
                    cur = next;
                }
                _table[i] = nullptr;
            }
            swap(newTable, _table);
        }
        size_t hashi = hash(kv.first) % _table.size();
        Node* newNode = new Node(kv);
        newNode->_next = _table[hashi];
        _table[hashi] = newNode;
        ++_n;
        return true;
    }

    // 查找
    HashNode<K, V>* Find(const K& key) {
        Hash hash;
        size_t hashi = hash(key) % _table.size();
        Node* cur = _table[hashi];
        while (cur) {
            if (cur->_kv.first == key) return cur;
            cur = cur->_next;
        }
        return nullptr;
    }

    // 删除
    bool Erase(const K& key) {
        Hash hash;
        size_t hashi = hash(key) % _table.size();
        Node* cur = _table[hashi];
        Node* prev = nullptr;
        while (cur) {
            if (cur->_kv.first == key && prev == nullptr) {
                _table[hashi] = cur->_next;
                --_n;
                delete cur;
                return true;
            } else if (cur->_kv.first == key && prev) {
                prev->_next = cur->_next;
                --_n;
                delete cur;
                return true;
            }
            prev = cur;
            cur = cur->_next;
        }
        return false;
    }

private:
    vector<Node*> _table;
    size_t _n;
};

哈希表原理与实现：线性探测及链地址法

1 哈希表的概念

1.1 哈希的含义

1.2 哈希冲突

1.3 负载因子

2 哈希表的映射方法

2.1 直接定址法

2.1.1 概念

2.1.2 缺点

2.2 除法散列法（除留余数法）

2.3 乘法散列法

2.4 全域散列法

更多推荐文章

相关免费在线工具

3 处理哈希冲突的办法

3.1 开放定址法

3.1.1 线性探测法

3.1.2 二次探测法

3.2 链地址法

4 线性探测法的实现

4.1 枚举类型 State

4.2 数据类型 HashData

4.3 本体 HashTable

4.4 仿函数 HashFunc

4.5 查找（Find）

4.6 插入（Insert）

4.7 删除

4.8 完整代码

5 链地址法的实现

5.1 结点 HashNode

5.2 本体 HashTable

5.3 析构函数

5.4 查找（Find）

5.5 插入（Insert）

5.6 删除（Erase）

5.7 完整代码

更多推荐文章

相关免费在线工具

哈希表原理与实现：线性探测及链地址法

1 哈希表的概念

1.1 哈希的含义

1.2 哈希冲突

1.3 负载因子

2 哈希表的映射方法

2.1 直接定址法

2.1.1 概念

2.1.2 缺点

2.2 除法散列法（除留余数法）

2.3 乘法散列法

2.4 全域散列法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3 处理哈希冲突的办法

3.1 开放定址法

3.1.1 线性探测法

3.1.2 二次探测法

3.2 链地址法

4 线性探测法的实现

4.1 枚举类型 State

4.2 数据类型 HashData

4.3 本体 HashTable

4.4 仿函数 HashFunc

4.5 查找（Find）

4.6 插入（Insert）

4.7 删除

4.8 完整代码

5 链地址法的实现

5.1 结点 HashNode

5.2 本体 HashTable

5.3 析构函数

5.4 查找（Find）

5.5 插入（Insert）

5.6 删除（Erase）

5.7 完整代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具