从 MySQL 迁移到国产数据库的真实笔记：坑点与优化 | 极客日志

SQLjava算法

从 MySQL 迁移到国产数据库的真实笔记：坑点与优化

记录从 MySQL 迁移至国产数据库的实战经验，涵盖 TCO 成本分析、自动化迁移工具链应用及性能对比。重点分享 SQL 改造难点、割接风险控制、数据一致性校验脚本编写以及团队管理中的软性挑战。通过真实案例展示如何平衡停机时间、保障业务平稳过渡，总结测试策略与运维适配的关键教训。

Pythonist发布于 2026/3/23更新于 2026/6/1917 浏览

从 MySQL 迁移到国产数据库的真实笔记

一个不愿回忆的三个月

说实话，我本来不想写这些东西。

那时候我刚接手这个迁移任务，觉得自己技术还行，各种数据库也玩过不少，心想换个库能有多难？结果现实狠狠地给了我一巴掌。第一周还在兴致勃勃地做技术调研，第二周就开始各种报错，第三周就已经是天天加班到凌晨的状态。那段时间，只要一听到"迁移"两个字，我就条件反射般地头疼。

我试过各种方案，翻过无数文档，写过几百个脚本。每次以为找到解决办法了，一测试就发现又有新问题冒出来。那种感觉就像是打地鼠，敲下去一个，又冒出来三个，永远打不完。

后来有个朋友推荐说，可以试试电科金仓的方案。我当时心里是拒绝的——国产数据库？我之前也不是没踩过坑，兼容性差、文档不全、社区没人，各种坑爹的经历让我对这些东西没什么好感。

但是当时的处境很尴尬，前面的路都堵死了，总不能跟老板说"我搞不定"。于是抱着死马当活马医的心态，我联系了他们的技术团队。

接下来发生的事情，说实话有点出乎意料。

不是什么一夜之间所有问题都解决了的神话故事，而是一个逐步摸索、逐步磨合的过程。中间也踩过坑，也摔过跟头，但至少能感觉到路是通的，有问题的解决方向是清晰的。

三个月后，系统终于稳定运行了。我松了一口气，坐在椅子上想了很久，觉得有些东西值得记录下来。

这些东西不是什么官方指南，也不是什么最佳实践，就是一个技术人员在坑坑洼洼的道路上摸索出来的真实经验。如果你也在类似的困境里，希望这些笔记能给你一些参考，至少让你知道——这条路有人走过，能走通。

TCO 全景账本：决策者真正算的那本账

说实话，好多团队做迁移预算的时候，真的是只看表面那些成本——采购新数据库要花多少钱、硬件要升级多少钱、实施服务费多少钱。但实际搞下来你就会发现，超支的那些钱，几乎全是因为下面这些隐性成本。

人力成本：SQL 改造真的是个无底洞

如果是手工迁移的话，那流程真的是痛苦：先导出 DDL，然后一条条去看语法有啥不一样，然后手动改，改完了跑测试，测试不通过又报错，报错了再改。我跟你讲，一个中等规模的库，大概 128 张表，存储过程几十个，有经验的 DBA 纯手工搞下来至少要一到两周，这还不算后面联调和回归测试的时间。

如果兼容性不好的话，那这个时间成本会成倍增加。每一处不兼容，都要经历这么个流程：开发人员先去排查问题，然后提需求给 DBA，DBA 改脚本，改完重新测试。这么一个来回，短的话半天，长的话得好几天。

停机成本：割接时间的每一分钟都在烧钱

要是用传统的手工迁移方式，割接流程基本上是这样的：先停掉业务写入，然后导全量数据，切换应用连接，验证，最后恢复写入。我跟你说，如果是 60TB 的数据量，光导数据这一步就要 72 小时以上，整个割接窗口可能要 4 到 8 个小时，这种停机时间对于核心系统来说根本没法接受。

隐性成本的算账公式：

真实迁移成本 = 授权费差价 + 人力工时 × 日均成本 + 停机小时数 × 业务损失 + 出错返工成本 + 后期运维学习成本

这么算下来，一个中型项目的隐性成本比显性成本还要多出两到三倍，真的不夸张。

效率对比：自动化和手工的差距真的很大

成本维度	手工迁移	工具链表现	节省幅度
60TB 全量迁移耗时	72 小时以上	3.5 小时	节省 95%
业务割接停机时长	4~8 小时	8 分钟	节省 97%
数据校验人工投入	数人天逐表核对	全自动报告，近零人工	节省 90%+
异常回退时间	无标准方案，数小时	一键回退，10 分钟内	风险近乎归零
应用代码改造量	视兼容性差异，可能大量重写	99% 兼容，仅微调少量边缘语法	节省 80%+

这组数据背后，实际上是在两个方面做了系统性投入：一个是 MySQL 兼容性的深度，这个决定了需要改造的量；另一个是迁移工具链的成熟度，这个决定了效率和风险控制能力。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

兼容性分析结果：
- 完全兼容对象：98.7%
- 需要调整对象：1.3%
- 高风险问题：12 个（主要集中在存储过程和自定义函数）
- 中风险问题：47 个（主要是数据类型映射和索引策略）
- 低风险问题：132 个（语法糖和习惯用法）
预估工作量：
- DBA 投入：15 人日
- 开发投入：8 人日
- 测试投入：10 人日

-- 比如它发现这个 MySQL 特有的语法
SELECT SQL_CALC_FOUND_ROWS * FROM products LIMIT 10;
SELECT FOUND_ROWS() AS total;

-- KDMS 建议的改写方案
-- 方案 1：分两次查询
SELECT COUNT(*) AS total FROM products; -- 先查总数
SELECT * FROM products LIMIT 10;        -- 再查数据

-- 方案 2：用窗口函数（如果版本支持）
SELECT *, COUNT(*) OVER () AS total FROM products LIMIT 10;

#!/bin/bash
# 实际生产环境中使用的迁移脚本（精简版）
set -e

# 配置参数
SOURCE_MYSQL="mysql-prod:3306"
TARGET_KES="kes-cluster:3308"
MIGRATION_LOG="/logs/migration_$(date +%Y%m%d_%H%M%S).log"

echo "=== 开始数据迁移 ===" | tee -a $MIGRATION_LOG

# 1. 结构迁移
echo "$(date) 阶段 1: 结构迁移开始" | tee -a $MIGRATION_LOG
kdts migrate-schema \
  --source-type mysql \
  --source-host $SOURCE_MYSQL \
  --source-db production \
  --target-type kingbase \
  --target-host $TARGET_KES \
  --target-db kes_production \
  --exclude-tables "temp_*,backup_*,archive_*" \
  --parallel 8 \
  --log-level INFO 2>&1 | tee -a $MIGRATION_LOG

if [ ${PIPESTATUS[0]} -ne 0 ]; then
  echo "结构迁移失败!" | tee -a $MIGRATION_LOG
  exit 1
fi

# 2. 全量数据迁移
echo "$(date) 阶段 2: 全量数据迁移开始" | tee -a $MIGRATION_LOG
kdts migrate-data \
  --source-type mysql \
  --source-host $SOURCE_MYSQL \
  --source-db production \
  --target-type kingbase \
  --target-host $TARGET_KES \
  --target-db kes_production \
  --table-batch-size 50 \
  --row-batch-size 5000 \
  --parallel 16 \
  --enable-checksum \
  --checksum-sample-rate 0.01 \
  --retry-count 3 \
  --retry-interval 10 2>&1 | tee -a $MIGRATION_LOG

# 3. 增量同步准备
echo "$(date) 阶段 3: 启动增量同步" | tee -a $MIGRATION_LOG
kfs start-sync \
  --task-name mysql_to_kes_$(date +%Y%m%d) \
  --source-type mysql \
  --source-host $SOURCE_MYSQL \
  --source-db production \
  --target-type kingbase \
  --target-host $TARGET_KES \
  --target-db kes_production \
  --batch-size 1000 \
  --sync-interval 100 \
  --max-queue-size 100000 \
  --heartbeat-interval 30 2>&1 | tee -a $MIGRATION_LOG

echo "$(date) 迁移流程执行完毕" | tee -a $MIGRATION_LOG
echo "下一步："
echo "1. 监控增量同步状态：kfs status --task-name mysql_to_kes_*"
echo "2. 数据一致性验证：kdts verify-data ..."
echo "3. 性能基准测试" | tee -a $MIGRATION_LOG

-- 假设源库和目标库同时修改了同一条记录
-- MySQL 端执行：UPDATE orders SET status='shipped' WHERE order_id = 1001;
-- 目标库端（在割接前测试时）也执行了：UPDATE orders SET status='processing' WHERE order_id = 1001;
-- KFS 检测到冲突时，默认策略是"源库优先"
-- 但可以通过配置调整：
kfs configure \
  --task-name mysql_to_kes_20240311 \
  --conflict-policy "timestamp" \
  # 按时间戳，新的覆盖旧的
  --conflict-policy "target" \
  # 目标库优先
  --conflict-policy "source" \
  # 源库优先（默认）
  --conflict-policy "error" # 报错，人工处理

# 正向同步：MySQL -> 目标库
kfs start-sync --task-name mysql_to_kes ...

# 反向同步：目标库 -> MySQL（作为回退保障）
kfs start-sync --task-name kes_to_mysql \
  --source-type kingbase \
  --source-host $TARGET_KES \
  --target-type mysql \
  --target-host $SOURCE_MYSQL \
  --filter-rule "exclude:temp_*" \
  --filter-rule "exclude:backup_*"

# 第一步：统一评估
# 使用评估工具批量扫描所有系统
kdms batch-assess \
  --config-file systems_list.json \
  --output-dir ./reports \
  --format html \
  systems_list.json

[
  {"name":"社保系统", "host":"10.1.1.101", "port":3306, "version":"5.7", "priority":"high"},
  {"name":"公积金系统", "host":"10.1.1.102", "port":3306, "version":"8.0", "priority":"high"}
]

-- MySQL 5.7 的写法（某些系统还在用）
SELECT * FROM users ORDER BY id DESC LIMIT 10, 20;

-- MySQL 8.0+ 推荐写法
SELECT * FROM users ORDER BY id DESC LIMIT 20 OFFSET 10;

-- 目标库兼容方案：两种都支持
-- 但建议统一为 OFFSET 写法，更符合标准

# 使用字符集转换工具
kdb_convert_charset \
  --source-host 10.1.1.101 \
  --source-db social_security \
  --target-charset UTF8 \
  --collate zh_CN.utf8 \
  --dry-run true

# 先试运行
# 试运行通过后，正式转换
kdb_convert_charset \
  --source-host 10.1.1.101 \
  --source-db social_security \
  --target-charset UTF8 \
  --collate zh_CN.utf8 \
  --dry-run false \
  --backup-dir /backup/char_conversion

-- 计算每个账户的每日余额变动
WITH daily_transactions AS (
  SELECT account_id, effective_date,
    SUM(CASE WHEN transaction_type = 'DEPOSIT' THEN amount ELSE 0 END) AS daily_deposit,
    SUM(CASE WHEN transaction_type = 'WITHDRAW' THEN amount ELSE 0 END) AS daily_withdraw,
    SUM(CASE WHEN transaction_type = 'TRANSFER' AND amount > 0 THEN amount ELSE 0 END) AS transfer_in,
    SUM(CASE WHEN transaction_type = 'TRANSFER' AND amount < 0 THEN ABS(amount) ELSE 0 END) AS transfer_out
  FROM account_transactions
  WHERE status = 'SUCCESS' AND effective_date >= CURRENT_DATE - INTERVAL '30 days'
  GROUP BY account_id, effective_date
),
balance_calculation AS (
  SELECT account_id, effective_date, daily_deposit, daily_withdraw, transfer_in, transfer_out,
    (daily_deposit + transfer_in - daily_withdraw - transfer_out) AS net_flow,
    SUM(daily_deposit + transfer_in - daily_withdraw - transfer_out)
      OVER (PARTITION BY account_id ORDER BY effective_date ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS running_balance,
    AVG(daily_deposit + transfer_in - daily_withdraw - transfer_out)
      OVER (PARTITION BY account_id ORDER BY effective_date ROWS BETWEEN 6 PRECEDING AND CURRENT ROW) AS ma_7_days,
    ROW_NUMBER() OVER (PARTITION BY account_id ORDER BY effective_date DESC) AS recency_rank
  FROM daily_transactions
)
SELECT account_id, effective_date, daily_deposit, daily_withdraw, net_flow, running_balance, ma_7_days,
  ROUND((running_balance - LAG(running_balance, 1) OVER w) * 100.0 / NULLIF(LAG(running_balance, 1) OVER w, 0), 2) AS balance_change_pct,
  PERCENT_RANK() OVER (PARTITION BY effective_date ORDER BY running_balance) AS balance_percentile
FROM balance_calculation
WHERE recency_rank <= 30
WINDOW w AS (PARTITION BY account_id ORDER BY effective_date)
ORDER BY account_id, effective_date DESC;

-- 将 3 年前的数据归档到历史表
CREATE OR REPLACE PROCEDURE archive_old_transactions()
LANGUAGE plpgsql AS $$
DECLARE
  archive_date DATE;
  batch_size INT := 10000;
  affected_rows INT := 0;
  total_rows INT := 0;
BEGIN
  archive_date := CURRENT_DATE - INTERVAL '3 years';
  
  -- 创建归档表（如果不存在）
  CREATE TABLE IF NOT EXISTS account_transactions_archive AS TABLE account_transactions WITH NO DATA;
  
  -- 创建分区（按年）
  EXECUTE format('CREATE TABLE IF NOT EXISTS account_transactions_archive_%s PARTITION OF account_transactions_archive FOR VALUES FROM (%L) TO (%L)',
    EXTRACT(YEAR FROM archive_date), DATE_TRUNC('year', archive_date), DATE_TRUNC('year', archive_date) + INTERVAL '1 year');
  
  -- 分批归档
  LOOP
    -- 使用 CTE 确保原子性
    WITH moved_rows AS (
      DELETE FROM account_transactions
      WHERE effective_date < archive_date AND status IN ('SUCCESS','CANCELLED')
        AND NOT EXISTS (SELECT 1 FROM account_transactions_archive WHERE transaction_id = account_transactions.transaction_id)
      LIMIT batch_size RETURNING *
    )
    INSERT INTO account_transactions_archive SELECT * FROM moved_rows;
    GET DIAGNOSTICS affected_rows = ROW_COUNT;
    total_rows := total_rows + affected_rows;
    
    COMMIT;
    EXIT WHEN affected_rows = 0;
    PERFORM pg_sleep(0.1);
  END LOOP;
  
  RAISE NOTICE '归档完成，共迁移 % 行数据', total_rows;
  PERFORM cleanup_empty_partitions('account_transactions');
EXCEPTION
  WHEN OTHERS THEN
    RAISE NOTICE '归档过程出错：% ', SQLERRM;
    ROLLBACK;
END;
$$;

-- 创建定时任务（每月 1 号凌晨执行）
SELECT cron.schedule('archive-transactions', '0 2 1 * *', 'CALL archive_old_transactions()');

-- 源库和目标库数据比对
CREATE OR REPLACE FUNCTION verify_data_consistency(
  source_table TEXT,
  target_table TEXT,
  pkey_columns TEXT[],
  check_columns TEXT[],
  batch_size INT DEFAULT 1000
) RETURNS TABLE(
  mismatch_type VARCHAR(20),
  source_count BIGINT,
  target_count BIGINT,
  sample_keys TEXT
) LANGUAGE plpgsql AS $$
DECLARE
  pkey_list TEXT;
  check_list TEXT;
  where_clause TEXT;
  source_rec RECORD;
  target_rec RECORD;
  mismatch_count INT := 0;
BEGIN
  -- 构造列名列表
  pkey_list := array_to_string(pkey_columns, ', ');
  check_list := array_to_string(check_columns, ', ');
  
  -- 1. 检查行数是否一致
  EXECUTE format('SELECT COUNT(*) FROM %I', source_table) INTO source_rec;
  EXECUTE format('SELECT COUNT(*) FROM %I', target_table) INTO target_rec;
  IF source_rec.count != target_rec.count THEN
    RETURN QUERY SELECT 'COUNT_MISMATCH'::VARCHAR, source_rec.count, target_rec.count, '全表统计'::TEXT;
  END IF;
  
  -- 2. 分批检查数据内容
  FOR i IN 0..CEIL(source_rec.count / batch_size::FLOAT)::INT - 1 LOOP
    where_clause := format('ORDER BY %s LIMIT %s OFFSET %s', pkey_list, batch_size, i * batch_size);
    
    -- 获取源库批次数据
    EXECUTE format('SELECT %s, MD5(%s) AS row_hash FROM %I %s', pkey_list, check_list, source_table, where_clause) INTO source_rec;
    
    -- 获取目标库对应数据
    EXECUTE format('SELECT %s, MD5(%s) AS row_hash FROM %I WHERE (%s) IN (%s)', pkey_list, check_list, target_table, pkey_list, source_rec.pkey_values) INTO target_rec;
    
    -- 比较哈希值
    IF source_rec.row_hash != target_rec.row_hash THEN
      mismatch_count := mismatch_count + 1;
      RETURN QUERY SELECT 'DATA_MISMATCH'::VARCHAR, 1, 1, source_rec.pkey_values::TEXT;
      EXIT WHEN mismatch_count >= 10;
    END IF;
  END LOOP;
  
  -- 3. 检查索引一致性
  RETURN QUERY SELECT 'INDEX_CHECK'::VARCHAR, COUNT(DISTINCT indexname), COUNT(DISTINCT indexname), string_agg(indexname, ', ')
  FROM (
    SELECT indexname FROM pg_indexes WHERE tablename = source_table
    EXCEPT
    SELECT indexname FROM pg_indexes WHERE tablename = target_table
  ) missing_indexes;
  RETURN;
END;
$$;

-- 使用示例
SELECT * FROM verify_data_consistency('source_orders', 'target_orders', ARRAY['order_id'], ARRAY['customer_id','amount','status','created_at'], 5000);

从 MySQL 迁移到国产数据库的真实笔记：坑点与优化

从 MySQL 迁移到国产数据库的真实笔记

一个不愿回忆的三个月

TCO 全景账本：决策者真正算的那本账

人力成本：SQL 改造真的是个无底洞

停机成本：割接时间的每一分钟都在烧钱

效率对比：自动化和手工的差距真的很大

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

迁移工具链：从"手动折腾"到"自动化流水线"

评估工具：迁移前的"CT 扫描仪"

数据搬运：TB 级数据的"搬运工"

实时同步：增量同步的"守夜人"

冲突检测与处理

双向同步支持

实战案例：从金融到政务的迁移实录

政务系统：22 个子系统的"集团军作战"

我们的策略：分批次、差异化处理

发现的问题及解决方案

复杂查询：窗口函数的实战应用

数据维护：那些必须掌握的维护脚本

场景一：数据归档

场景二：数据一致性校验

行业洞察：争议与空白

迁移工程化落地：那些标准化流程之外的东西

迁移前的"软"准备

迁移中的"意外"处理

意外一：源库性能突然恶化

意外二：增量同步延迟激增

意外三：数据不一致告警

迁移后的"冷"启动

性能调优

运维适配

知识沉淀

性能对比：那些意外的发现

查询性能

写入性能

资源占用

最意外的发现

那些关于"测试"的教训

早期项目：功能测试为主

中期项目：增加性能测试

近期项目：全链路测试

那些关于"团队"的感悟

技术能力

沟通能力

抗压能力

学习能力

那些关于"成本"的算账

写在最后

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具