MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进 | 极客日志

Javajava

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

MySQL 单表数据量达到亿级时，索引膨胀、备份恢复慢及 DDL 锁表等问题频发。基于 4 亿数据表案例，探讨按时间维度进行水平分表的完整方案。内容涵盖分表前的数据评估与命名规范，提供平滑迁移（联合视图）与触发器过渡两种实施路径。重点讲解 Java 应用层适配，包括动态表名路由、MyBatis 插件拦截及 Spring 定时任务自动建表策略。同时总结跨分页查询、分布式事务及全局 ID 生成的常见坑点，并给出性能对比数据与未来演进方向，为高并发场景下的数据库架构优化提供参考。

苹果系统发布于 2025/11/5更新于 2026/7/2439 浏览

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

引言

在互联网应用快速发展的今天，数据量呈现爆炸式增长。作为后端开发者，我们常常会遇到单表数据量过亿导致的性能瓶颈问题。本文将以一个真实的 4 亿数据表分表案例为基础，详细介绍如何在不影响线上业务的情况下，完成按时间维度分表的完整过程，包含架构设计、具体实施方案、Java 代码适配以及注意事项等全方位内容。

一、为什么我们需要分表？

1.1 单表数据量过大的问题

当 MySQL 单表数据量达到 4 亿级别时，会面临诸多挑战：

索引膨胀，B+ 树层级加深，查询效率下降
备份恢复时间呈指数级增长
DDL 操作（如加字段、改索引）锁表时间不可接受
高频写入导致锁竞争加剧

1.2 分表方案选型

常见的分表策略有：

水平分表：按行拆分，如按 ID 范围、哈希、时间等
垂直分表：按列拆分，将不常用字段分离
分区表：MySQL 内置分区功能

本文选择 按时间水平分表，因为：

业务查询大多带有时间条件
天然符合数据冷热特征
便于历史数据归档

二、分表前的准备工作

2.1 数据评估分析

在动手之前，先看看数据的时间分布情况：

-- 分析数据时间分布
SELECT DATE_FORMAT(create_time, '%Y-%m') AS month, COUNT(*) AS count 
FROM original_table 
GROUP BY month 
ORDER BY month;

2.2 分表命名规范设计

制定明确的分表命名规则，避免后续维护混乱：

主表：original_table
月度分表：original_table_202301
年度分表：original_table_2023
归档表：archive_table_2022

2.3 应用影响评估

检查所有涉及该表的 SQL：

是否都有时间条件
是否存在跨时间段的复杂查询
事务是否涉及多表关联

三、分表实施方案详解

3.1 方案一：平滑迁移方案（推荐）

第一步：创建分表结构

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

-- 创建 2023 年 1 月的分表
CREATE TABLE original_table_202301 LIKE original_table;

-- 为分表添加同样的索引
ALTER TABLE original_table_202301 ADD INDEX idx_user_id(user_id);

public class DataMigrator {
    private static final int BATCH_SIZE = 5000;

    public void migrateByMonth(String month) throws SQLException {
        String sourceTable = "original_table";
        String targetTable = "original_table_" + month;
        try (Connection conn = dataSource.getConnection()) {
            long maxId = getMaxId(conn, sourceTable);
            long currentId = 0;
            while (currentId < maxId) {
                String sql = String.format(
                    "INSERT INTO %s SELECT * FROM %s WHERE create_time BETWEEN '%s-01' AND '%s-31' AND id > %d ORDER BY id LIMIT %d",
                    targetTable, sourceTable, month, month, currentId, BATCH_SIZE);
                try (Statement stmt = conn.createStatement()) {
                    stmt.executeUpdate(sql);
                    currentId = getLastInsertedId(conn, targetTable);
                }
                Thread.sleep(100); // 控制迁移速度，防止 IO 阻塞
            }
        }
    }
}

CREATE VIEW original_table_unified AS
SELECT * FROM original_table_202301 UNION ALL
SELECT * FROM original_table_202302 UNION ALL
... -- 根据实际月份补充
SELECT * FROM original_table; -- 当前表作为最新数据

DELIMITER //
CREATE TRIGGER tri_original_table_insert AFTER INSERT ON original_table FOR EACH ROW
BEGIN
    IF NEW.create_time >= '2023-01-01' THEN
        INSERT INTO original_table_new (id, user_id, create_time) VALUES (NEW.id, NEW.user_id, NEW.create_time);
    END IF;
END//
DELIMITER ;

public class TableRouter {
    private static final DateTimeFormatter MONTH_FORMAT = DateTimeFormatter.ofPattern("yyyyMM");

    public static String routeTable(LocalDateTime createTime) {
        String month = createTime.format(MONTH_FORMAT);
        return "original_table_" + month;
    }
}

<select id="queryByTime" resultType="com.example.Entity">
    SELECT * FROM ${tableName} 
    WHERE user_id = #{userId} AND create_time BETWEEN #{start} AND #{end}
</select>

public List<Entity> queryByTime(Long userId, LocalDate start, LocalDate end) {
    List<String> tableNames = getTableNamesBetween(start, end);
    return tableNames.stream()
        .flatMap(table -> mapper.queryByTime(table, userId, start, end).stream())
        .collect(Collectors.toList());
}

@Intercepts(@Signature(type = StatementHandler.class, method = "prepare", args = {Connection.class, Integer.class}))
public class TableShardInterceptor implements Interceptor {
    @Override
    public Object intercept(Invocation invocation) throws Throwable {
        BoundSql boundSql = ((StatementHandler) invocation.getTarget()).getBoundSql();
        String originalSql = boundSql.getSql();
        if (originalSql.contains("original_table")) {
            Object param = boundSql.getParameterObject();
            LocalDateTime createTime = getCreateTime(param);
            String newSql = originalSql.replace("original_table", "original_table_" + createTime.format(MonthFormat));
            resetSql(invocation, newSql);
        }
        return invocation.proceed();
    }
}

@Scheduled(cron = "0 0 0 1 * ?") // 每月 1 号执行
public void autoCreateNextMonthTable() {
    LocalDate nextMonth = LocalDate.now().plusMonths(1);
    String tableName = "original_table_" + nextMonth.format(DateTimeFormatter.ofPattern("yyyyMM"));
    jdbcTemplate.execute("CREATE TABLE IF NOT EXISTS " + tableName + " LIKE original_table_template");
}

public void archiveOldData(int keepMonths) {
    LocalDate archivePoint = LocalDate.now().minusMonths(keepMonths);
    String archiveTable = "archive_table_" + archivePoint.getYear();
    
    // 创建归档表
    jdbcTemplate.execute("CREATE TABLE IF NOT EXISTS " + archiveTable + " LIKE original_table_template");
    
    // 迁移数据
    jdbcTemplate.update("INSERT INTO " + archiveTable + " SELECT * FROM original_table WHERE create_time < ?", archivePoint.atStartOfDay());
    
    // 删除原数据
    jdbcTemplate.update("DELETE FROM original_table WHERE create_time < ?", archivePoint.atStartOfDay());
}

指标	分表前	分表后
单条查询平均耗时	320ms	45ms
批量写入 QPS	1,200	3,500
备份时间	6 小时	30 分钟

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

引言

一、为什么我们需要分表？

1.1 单表数据量过大的问题

1.2 分表方案选型

二、分表前的准备工作

2.1 数据评估分析

2.2 分表命名规范设计

2.3 应用影响评估

三、分表实施方案详解

3.1 方案一：平滑迁移方案（推荐）

第一步：创建分表结构

更多推荐文章

相关免费在线工具

第二步：分批迁移数据

第三步：建立联合视图

3.2 方案二：触发器过渡方案

四、Java 应用层适配

4.1 动态表名路由

4.2 MyBatis 分表适配

方案一：动态 SQL

方案二：插件拦截（高级）

五、分表后的运维管理

5.1 自动建表策略

5.2 数据归档策略

六、踩坑与经验总结

6.1 遇到的典型问题

6.2 性能对比数据

七、未来演进方向

结语

更多推荐文章

相关免费在线工具

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

MySQL 亿级数据表平滑分表实践：基于时间分片的架构演进

引言

一、为什么我们需要分表？

1.1 单表数据量过大的问题

1.2 分表方案选型

二、分表前的准备工作

2.1 数据评估分析

2.2 分表命名规范设计

2.3 应用影响评估

三、分表实施方案详解

3.1 方案一：平滑迁移方案（推荐）

第一步：创建分表结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

第二步：分批迁移数据

第三步：建立联合视图

3.2 方案二：触发器过渡方案

四、Java 应用层适配

4.1 动态表名路由

4.2 MyBatis 分表适配

方案一：动态 SQL

方案二：插件拦截（高级）

五、分表后的运维管理

5.1 自动建表策略

5.2 数据归档策略

六、踩坑与经验总结

6.1 遇到的典型问题

6.2 性能对比数据

七、未来演进方向

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具