LFU 缓存算法详解：双哈希 + 双向链表实现 O(1) 操作 | 极客日志

C++算法

LFU 缓存算法详解：双哈希 + 双向链表实现 O(1) 操作

LFU 缓存算法依据历史访问频率淘汰数据，优先保留长期热点。核心实现采用双哈希表配合频率双向链表，确保查询、更新、淘汰均为 O(1) 时间复杂度。主要优势是稳定保护高频数据，劣势包括新数据冷启动困难及旧高频数据霸占缓存。可通过频率衰减、初始频率加成或与 LRU 混合策略进行优化。适用于 CDN 热门视频、电商爆款商品等访问模式稳定的场景。

星星泡饭发布于 2026/3/30更新于 2026/5/2529 浏览

LFU 缓存算法详解

一、核心原理

基础规则：优先淘汰历史访问频率最低的数据（长期统计维度）。

每个缓存条目维护两个核心属性：键值对数据 + 访问频率计数器。当缓存容量达到上限时，系统会选择当前所有数据中访问频率最低的条目进行淘汰；若多个数据的频率相同，则进一步淘汰其中最久未被访问的（类似 LRU 的兜底逻辑）。

操作流程：

访问数据时：命中缓存后，该数据的访问频率 +1，并调整其在频率排序中的位置（确保高频数据优先保留，也就是在双向链表头部）。
写入新数据时：若缓存未满，直接插入（初始频率通常为 1 或 0+1）；若缓存已满，先淘汰频率最低的数据，再写入新条目（新数据频率初始化为 1）；如果对应 key 值存在，那就更新对应 value，最后再调整对应频率。

二、关键特性与实现机制

1. 数据结构设计（高效实现的核心）

LFU 通常通过双哈希表 + 频率双向链表的组合实现 O(1) 时间复杂度的操作：

存储哈希表（Key-Node）：存储键到缓存条目数据集的映射（快速定位数据，方便及时更新频率操作）。
频率哈希表：以频率值为键，而 key 类型的双向链表为值，维护该频率下的所有数据节点（通常用双向链表存储，支持快速插入/删除）。
最小频率计数器：记录当前缓存中最低的频率值，淘汰时直接定位到该频率链表。

例如：当数据 A 被访问时，其频率从 1→2，需从原频率 1 的链表移除，并插入到频率 2 的链表头部；若新数据 B 写入，初始频率为 1，插入频率 1 链表。

2. 频率动态更新

每次访问（读/写）缓存数据时，触发频率 +1 的更新操作：

从原频率对应的链表中移除该数据节点；
将频率值 +1，并插入到新频率对应的链表头部（保证最近访问的数据在链表前端）；
更新全局最小频率（若原最小频率链表为空，则最小频率 +1）。

3. 实现思想及代码测试

我们下面要设计的这个 LFU 算法逻辑和上面的演示图是差不多，只不过我们存储的不是自定义节点的地址，而是这个 Node 对象，当然地址也行，其他都差不多。

对应的节点结构如下：

// 定义对应的节点结构：template<class K, class V>
struct Node {
    Node() {}
    // 表明对应的默认对象必须存在，hash[key] = Node()！！
    Node(const K& key, const V& value, int access_count)
        : key(key), value(value), access_count(access_count) {}
    
    K key;
    V value; // 存储对应 key 的访问次数
    int access_count;
    // 对应节点的 key 值所在的 list 处的迭代器
    typename std::list<K>::iterator it;
};

然后我们只要的就是维护两个哈希，以及容量和对应最小频率计数器即可：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

std::unordered_map<K, Node<K, V>> _hash_map;      // 储存对应 key 值与对应的上述节点的 hash
std::unordered_map<int, std::list<K>> _access_map; // 储存对应的访问次数的存放 key 的那个 list
size_t _capacity;                                  // 缓存最大容量，根据它进行决定进行对应的 LFU 策略更新
int _min_access_count;                             // 储存最少的访问次数，方便进行删除

// 对于 put 或者 get 后进行对应的数据的访问次数等操作进行统一处理（比如进行 LFU 策略删除等）
void accessCountAdd(const K& key) {
    // 获取对应节点
    Node<K, V>& node = _hash_map[key];
    int old_access_cnt = node.access_count;
    std::list<int>& cur_list = _access_map[old_access_cnt];
    cur_list.erase(node.it); // 删除后进行判断，如果访问的 hash 对应 list 空了，直接删除这个 hash 槽即可
    if (cur_list.empty()) {
        _access_map.erase(old_access_cnt);
        // 如果恰好是最少的，更新下最小的即可
        if (old_access_cnt == _min_access_count)
            // 如果删除完对应的之前的 key 所在的 list 后，为空了而且此时对应的 min_cnt 也是当前 key 的 cnt，此时说明 min_cnt 必须要 +1 完成更新了
            _min_access_count++;
    }
    // 此时除了有可能它俩相同，就是 cur_list 不为空的情况，或者不等：
    // 进行更新访问次数：
    int new_access_cnt = old_access_cnt + 1;
    node.access_count = new_access_cnt;
    // 再次更新下，这里保险起见：
    _min_access_count = std::min(_min_access_count, new_access_cnt);
    // 把对应的 key 加入到新的 list 中：
    auto& new_list = _access_map[new_access_cnt];
    // 这里需要引用，因为后续会进行修改
    new_list.push_front(node.key);
    // 务必要更新对应迭代器：
    node.it = new_list.begin();
}

V get(const K& key) {
    // 先判断是否存在这个 key：
    if (_hash_map.find(key) == _hash_map.end())
        return V(); // 有点瑕疵，一般都是 int int，直接返回 -1
    // 存在这个 key，进行访问次数 +1：
    accessCountAdd(key);
    return _hash_map[key].value;
}

bool put(const K& key, const V& val) {
    // 1. 判断容量是否为 0：
    if (_capacity <= 0) return false;
    // 进行查找：
    auto it = _hash_map.find(key);
    if (it != _hash_map.end()) {
        // 存在这个 key，直接更新对应的值并根据对应 LFU 策略进行对应处理：
        _hash_map[key].value = val;
        // 2. 更新访问次数：
        accessCountAdd(key);
        return true;
    }
    // 不存在，检查容量（根据 LFU 策略更新),插入新的：
    // it==_hash_map.end()
    if (_capacity <= _hash_map.size()) {
        // 容量已满，执行 LFU 策略：
        // 找到访问次数最少的 list，也就是是最不经常使用的那一批数据：
        auto& min_list = _access_map[_min_access_count];
        // 根据 LRU 策略删除最近最少使用的 key：
        auto evict_key = min_list.back();
        min_list.pop_back();
        // 判断是否这个 list 为空了，进行删除：
        if (min_list.empty()) _access_map.erase(_min_access_count);
        _hash_map.erase(evict_key);
    }
    // 不存在直接构造插入：
    // 3. 插入新节点：
    auto& new_list = _access_map[1]; // 这里是 1，因为是新插入的节点，访问次数为 1
    _hash_map[key] = Node<K, V>(key, val, 1);
    // 这里也需要告诉编译器是个类型不是变量！！
    // 4. 更新访问次数 hash：
    new_list.push_front(key);
    // 更新对应的 key 的 node 的迭代器
    _hash_map[key].it = new_list.begin();
    _min_access_count = 1;
    return true;
}

场景类型	具体例子	为什么适合 LFU？
长期稳定热点	CDN 热门视频缓存、经典文档/教程页	这些内容长期被高频访问，频率持续累积，LFU 能确保其长期驻留缓存。
爆款商品/内容	电商平台的限时爆款、社交媒体的热帖	爆款期间访问频率极高，LFU 会优先保留，支撑高并发请求。
低更新频率服务	在线词典的热门词条、百科经典词条	词条热度长期稳定，高频词条（如'人工智能'）会被持续缓存。

维度	LFU（最不经常使用）	LRU（最近最少使用）
判断依据	历史访问频率（总次数）	最近一次访问时间（时间戳）
核心优势	保护长期高频热点数据，命中率高	快速响应新流量，适应突发热点
主要劣势	新数据易被淘汰，旧高频数据可能霸占	旧高频数据可能被误淘汰，不保护长期热点
实现复杂度	较高（需维护频率结构）	较低（只需维护访问时间顺序）
典型场景	经典内容、爆款商品、CDN 稳定热点	浏览器缓存、数据库 Buffer Pool、新热点
变种优化	LFU-LRU 混合、频率衰减、初始频率加成	LRU-K（考虑最近 K 次访问）、ARC（自适应）

LFU 缓存算法详解：双哈希 + 双向链表实现 O(1) 操作

LFU 缓存算法详解

一、核心原理

二、关键特性与实现机制

1. 数据结构设计（高效实现的核心）

2. 频率动态更新

3. 实现思想及代码测试

更多推荐文章

相关免费在线工具

4. 为什么 LFU 用双哈希表 + 双向链表？

三、典型优势与劣势

优势场景

劣势与挑战

四、典型问题与优化策略

1. 新数据冷启动优化

2. 频率衰减（避免历史权重过高）

五、适用场景与典型用例

六、LFU vs LRU 对比

总结

更多推荐文章

相关免费在线工具

LFU 缓存算法详解：双哈希 + 双向链表实现 O(1) 操作

LFU 缓存算法详解

一、核心原理

二、关键特性与实现机制

1. 数据结构设计（高效实现的核心）

2. 频率动态更新

3. 实现思想及代码测试

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 为什么 LFU 用双哈希表 + 双向链表？

三、典型优势与劣势

优势场景

劣势与挑战

四、典型问题与优化策略

1. 新数据冷启动优化

2. 频率衰减（避免历史权重过高）

五、适用场景与典型用例

六、LFU vs LRU 对比

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具