高性能定时器：时间轮算法的工程实践 | 极客日志

C++算法

高性能定时器：时间轮算法的工程实践

基于时间轮的高性能定时器在 C++ 网络服务中的工程实践。通过智能指针管理任务生命周期，利用 timerfd 驱动时间轮转动，结合 EventLoop 保证线程安全。核心优化包括使用 shared_ptr 引用计数实现任务刷新而非删除重加，析构函数自动触发回调，以及批量处理 timerfd 超时事件，有效解决僵尸连接清理问题。

无尘发布于 2026/3/26更新于 2026/5/3127 浏览

从零实现高性能定时器：时间轮算法的工程实践

一、定时器要解决什么问题？

在长连接服务中，有一个绕不开的需求：连接如果长时间没有活动，必须主动断开。

原因很现实：

客户端可能已经断网，但 TCP 层感知不到（比如手机突然没信号、异常退出）；
这些'僵尸连接'会一直占用 fd、内存、带宽等服务器资源；
不及时清理，服务器迟早被这些无效连接拖垮。

所以我们需要一个简单直接的机制。

二、为什么选择时间轮？

常见的定时器实现有三种，各有优劣，我们先看一张对比表，一目了然：

方案	插入复杂度	删除复杂度	适用场景
有序链表	O(n)	O(1)	任务数量极少（几百个以内）
最小堆	O(log n)	O(log n)	通用场景，任务量中等
时间轮	O(1)	O(1)	大量短超时任务（网络服务核心场景）

网络服务通常有以下特点：

连接数量大（几万甚至几十万，高并发场景下更甚）；
超时时间短且相近（比如大部分连接超时都设置为 30 秒）；
频繁刷新（每次收到客户端数据，都要重置该连接的超时时间）。

这种场景下，时间轮的 O(1) 增删复杂度优势被无限放大——不管有多少任务，添加、删除、刷新的耗时都是固定的。

三、时间轮的基本原理（极简版）

一句话概括：一个循环转动的'钟表'，每个刻度放对应时间要执行的任务，指针转一格，执行一格的任务。

3.1 想象一个钟表

假设表盘有 60 个格子，指针每秒走一格，每个格子里存放'这一秒要执行的所有任务'。

比如指针现在在第 10 格，我们要添加一个 5 秒后超时的任务，目标位置就是 (10 + 5) % 60 = 15，把任务放到第 15 格即可。

每过一秒，指针前进一格，清空当前格子的所有任务——清空的过程，就是任务超时、执行回调的过程。

3.2 核心操作（3 步搞定）

添加任务：计算目标格子 = (当前指针位置 + 超时时长) % 表盘容量，任务入格；
时间流逝：指针每秒前进一格，清空当前格子（执行所有超时任务）；
刷新任务：核心是'延长任务的生命周期'，而非删除再添加。

四、核心设计：让析构触发回调（最巧妙的一步）

这是整个定时器实现中，最能简化代码、规避坑点的设计。

4.1 传统思路 vs 我的思路

传统思路：时间到了 → 遍历当前格子的所有任务 → 逐个调用回调函数 → 手动清理任务；
我的思路：时间到了 → 销毁任务对象 → 让任务的析构函数自动执行回调 → 无需手动调用、无需手动清理。

4.2 核心代码（关键析构函数）

~TimerTask() {
    if (!_canceled) _task_cb(); // 析构时，未取消则执行回调
    _release(); // 清理映射表，避免内存泄漏
}

4.3 为什么这样设计？

核心依赖 C++ 的 shared_ptr 引用计数机制，我们可以用 shared_ptr 来自动管理任务的生命周期：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

// 先定义回调函数类型（简化代码）
using TaskFunc = std::function<void()>;
using ReleaseFunc = std::function<void()>;

class TimerTask {
private:
    uint64_t _id; // 任务 ID（通常是连接 ID，唯一标识）
    uint32_t _timeout; // 超时时长（单位：秒，如 30 秒）
    bool _canceled; // 是否被取消（取消后不执行回调）
    TaskFunc _task_cb; // 超时回调（通常是关闭连接）
    ReleaseFunc _release; // 销毁时的清理回调（清理映射表）
public:
    // 构造函数：初始化任务
    TimerTask(uint64_t id, uint32_t delay, const TaskFunc &cb) : _id(id), _timeout(delay), _task_cb(cb), _canceled(false) {}

    // 析构函数：自动执行回调和清理
    ~TimerTask() {
        if (!_canceled) _task_cb(); // 未取消则执行回调
        _release(); // 执行清理逻辑
    }

    // 取消任务（标记为取消，不影响清理）
    void Cancel() { _canceled = true; }

    // 设置清理回调（由 TimerWheel 绑定）
    void SetRelease(const ReleaseFunc &cb) { _release = cb; }

    // 获取基础超时时长（用于刷新任务）
    uint32_t DelayTime() { return _timeout; }
};

成员变量	作用	典型值/场景
_id	唯一标识任务，关联长连接	连接 ID（uint64_t，避免重复）
_timeout	基础超时时长，刷新时复用	30 秒（长连接默认超时时间）
_canceled	取消标记，避免已取消任务执行回调	默认 false，取消后设为 true
_task_cb	超时核心逻辑（如关闭连接）	conn->Shutdown()
_release	清理 TimerWheel 中的映射表	删除_timers 中对应 ID 的记录

class TimerWheel {
private:
    using WeakTask = std::weak_ptr<TimerTask>; // 弱引用，仅用于查找
    using PtrTask = std::shared_ptr<TimerTask>; // 强引用，控制生命周期
    int _tick; // 当前指针位置（刻度）
    int _capacity; // 表盘容量（如 60，对应最大 60 秒超时）
    // 时间轮本体：每个刻度对应一个任务列表
    std::vector<std::vector<PtrTask>> _wheel;
    // 任务快速查找表：ID → 弱引用（不影响生命周期，避免内存泄漏）
    std::unordered_map<uint64_t, WeakTask> _timers;
    EventLoop *_loop; // 绑定的事件循环（与 epoll 配合）
    int _timerfd; // Linux 时钟驱动（替代 sleep/poll）
    std::unique_ptr<Channel> _timer_channel; // epoll 事件封装（监听 timerfd）
};

// 线程安全接口（外部调用）
void TimerAdd(uint64_t id, uint32_t delay, const TaskFunc &cb) {
    // 投递到 EventLoop 线程执行，保证线程安全
    _loop->RunInLoop([=] { TimerAddInLoop(id, delay, cb); });
}

// 内部实际实现（仅在 EventLoop 线程执行）
void TimerAddInLoop(uint64_t id, uint32_t delay, const TaskFunc &cb) {
    // 1. 创建任务对象（shared_ptr 控制生命周期）
    PtrTask pt(new TimerTask(id, delay, cb));
    // 2. 绑定清理回调：任务销毁时，从_timers 中删除自身
    pt->SetRelease(std::bind(&TimerWheel::RemoveTimer, this, id));
    // 3. 计算目标刻度（避免越界）
    int pos = (_tick + delay) % _capacity;
    // 4. 任务入轮 + 入查找表
    _wheel[pos].push_back(pt);
    _timers[id] = WeakTask(pt);
}

// 清理映射表（由 TimerTask 的析构函数调用）
void RemoveTimer(uint64_t id) {
    _timers.erase(id);
}

// 线程安全接口（外部调用）
void TimerRefresh(uint64_t id) {
    _loop->RunInLoop([=] { TimerRefreshInLoop(id); });
}

// 内部实际实现（仅在 EventLoop 线程执行）
void TimerRefreshInLoop(uint64_t id) {
    // 1. 查找任务（弱引用转换为强引用）
    auto it = _timers.find(id);
    if (it == _timers.end()) { return; } // 任务不存在（可能已超时销毁）
    PtrTask pt = it->second.lock(); // weak_ptr → shared_ptr（成功则任务还存在）
    if (!pt) { _timers.erase(it); return; }
    // 2. 计算新的目标刻度（复用基础超时时长）
    int delay = pt->DelayTime();
    int pos = (_tick + delay) % _capacity;
    // 3. 关键操作：再放一份到新刻度（引用计数 +1）
    _wheel[pos].push_back(pt);
}

// 线程安全接口（外部调用）
void TimerCancel(uint64_t id) {
    _loop->RunInLoop([=] { TimerCancelInLoop(id); });
}

// 内部实际实现（仅在 EventLoop 线程执行）
void TimerCancelInLoop(uint64_t id) {
    auto it = _timers.find(id);
    if (it == _timers.end()) { return; }
    PtrTask pt = it->second.lock();
    if (pt) { pt->Cancel(); } // 仅标记为取消，不删除任务
}

static int CreateTimerfd() {
    // 创建 timerfd，CLOCK_MONOTONIC：系统启动后流逝的时间（不受系统时间修改影响）
    int timerfd = timerfd_create(CLOCK_MONOTONIC, 0);
    if (timerfd < 0) {
        // 错误处理（实际工程中需添加日志）
        perror("timerfd_create error");
        exit(EXIT_FAILURE);
    }
    // 设置定时周期：首次 1 秒后触发，后续每 1 秒触发一次
    struct itimerspec itime;
    memset(&itime, 0, sizeof(itime));
    itime.it_value.tv_sec = 1; // 第一次超时：1 秒后
    itime.it_value.tv_nsec = 0;
    itime.it_interval.tv_sec = 1; // 之后每隔 1 秒触发一次（周期）
    itime.it_interval.tv_nsec = 0;
    // 应用定时设置
    timerfd_settime(timerfd, 0, &itime, NULL);
    return timerfd;
}

// 读取 timerfd 的超时次数（自上次读取后，超时了几次）
int ReadTimefd() {
    uint64_t times;
    ssize_t n = read(_timerfd, &times, sizeof(times));
    if (n != sizeof(times)) {
        // 错误处理（实际工程中需添加日志）
        perror("read timerfd error");
        return 0;
    }
    return static_cast<int>(times);
}

// timerfd 可读事件回调（由 EventLoop 触发）
void OnTime() {
    int times = ReadTimefd(); // 获取累积超时次数
    // 批量处理所有超时（避免 epoll 阻塞导致的时间堆积）
    for (int i = 0; i < times; i++) {
        RunTimerTask();
    }
}

// 驱动指针转动，执行当前刻度的超时任务
void RunTimerTask() {
    // 指针前进一格（循环转动，避免越界）
    _tick = (_tick + 1) % _capacity;
    // 清空当前刻度：销毁所有 shared_ptr → 任务析构 → 执行回调
    _wheel[_tick].clear();
}

// 新连接创建成功后，添加 30 秒超时定时器
timer_wheel->TimerAdd(conn_id, 30, [conn] { conn->Shutdown(); }); // 超时回调：关闭连接

// 连接收到客户端数据，刷新定时器（重置为 30 秒超时）
timer_wheel->TimerRefresh(conn_id);

设计目标	实现方式
高效增删改	时间轮 O(1) 复杂度
自动执行回调	TimerTask 析构函数触发
刷新超时	增加 shared_ptr 引用计数
取消任务	标记 _canceled，不删除任务
线程安全	所有操作统一在 Loop 线程执行
时间驱动	timerfd + epoll 融入 EventLoop

高性能定时器：时间轮算法的工程实践

从零实现高性能定时器：时间轮算法的工程实践

一、定时器要解决什么问题？

二、为什么选择时间轮？

三、时间轮的基本原理（极简版）

3.1 想象一个钟表

3.2 核心操作（3 步搞定）

四、核心设计：让析构触发回调（最巧妙的一步）

4.1 传统思路 vs 我的思路

4.2 核心代码（关键析构函数）

4.3 为什么这样设计？

更多推荐文章

相关免费在线工具

五、TimerTask：定时任务的封装（可直接复用）

5.1 完整类实现

5.2 各成员作用（避坑说明）

六、TimerWheel：时间轮的完整实现（核心代码）

6.1 核心数据结构

6.2 添加任务（TimerAdd）

6.3 刷新任务（TimerRefresh）——高频核心操作

6.4 取消任务（TimerCancel）

6.5 时间驱动：timerfd + epoll（核心心跳）

6.5.1 创建 timerfd

6.5.2 处理超时事件（驱动指针转动）

七、和 EventLoop 的配合（线程安全保障）

解决方案：统一在 Loop 线程执行

八、完整工作流程（串联所有逻辑）

8.1 连接建立（添加定时器）

8.2 收到数据（刷新定时器）

8.3 正常超时（无活动）

8.4 有活动（超时延长）

九、工程落地细节与避坑总结

9.1 为什么 _capacity 选 60？

9.2 为什么用 vector 而非 list？

9.3 内存开销（是否可控？）

9.4 常见坑点汇总

十、总结

更多推荐文章

相关免费在线工具

高性能定时器：时间轮算法的工程实践

从零实现高性能定时器：时间轮算法的工程实践

一、定时器要解决什么问题？

二、为什么选择时间轮？

三、时间轮的基本原理（极简版）

3.1 想象一个钟表

3.2 核心操作（3 步搞定）

四、核心设计：让析构触发回调（最巧妙的一步）

4.1 传统思路 vs 我的思路

4.2 核心代码（关键析构函数）

4.3 为什么这样设计？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

五、TimerTask：定时任务的封装（可直接复用）

5.1 完整类实现

5.2 各成员作用（避坑说明）

六、TimerWheel：时间轮的完整实现（核心代码）

6.1 核心数据结构

6.2 添加任务（TimerAdd）

6.3 刷新任务（TimerRefresh）——高频核心操作

6.4 取消任务（TimerCancel）

6.5 时间驱动：timerfd + epoll（核心心跳）

6.5.1 创建 timerfd

6.5.2 处理超时事件（驱动指针转动）

七、和 EventLoop 的配合（线程安全保障）

解决方案：统一在 Loop 线程执行

八、完整工作流程（串联所有逻辑）

8.1 连接建立（添加定时器）

8.2 收到数据（刷新定时器）

8.3 正常超时（无活动）

8.4 有活动（超时延长）

九、工程落地细节与避坑总结

9.1 为什么 _capacity 选 60？

9.2 为什么用 vector 而非 list？

9.3 内存开销（是否可控？）

9.4 常见坑点汇总

十、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具