Diff-MTS：基于时序增强条件扩散的工业多变量时间序列生成模型

1 研究背景

1.1 MTS 的重要性

工业多变量时间序列（MTS）是理解设备状态的核心依据，它被广泛应用于异常检测、剩余寿命预测、故障诊断等，也是训练高精度深度学习模型和构建工业大模型的基础。

1.2 现有生成方法的局限性

MTS 数据因时间尺度、噪声水平及潜在特征差异而呈现异质性，加之各工业企业的数据隐私顾虑，特定场景下的工业时间序列数据稀缺，这一点制约了工业智能的发展。

目前主流的数据生成方法主要包括变分自编码器 (VAEs) 和生成对抗网络 (GANs)，但二者均存在显著不足。VAEs 主要依赖重构损失函数，其核心目标是实现高效编码和稳定重构，这导致生成样本的真实性欠佳，难以有效捕捉工业数据的复杂特征。GANs 采用生成器与判别器的对抗训练机制，但面临两个关键挑战：一是训练过程不稳定且收敛困难（工业数据噪声大、时序关系复杂，导致生成器难以学习有效规律，判别器则容易区分真假样本）；二是条件一致性较差（需要额外训练分类器或判别器来实现条件控制，造成生成数据与输入条件的匹配度不足）。

1.3 扩散模型的潜力与不足

去噪扩散模型（DDPM）通过加噪和去噪的过程学习数据分布，在图像生成领域表现优异。但由于工业 MTS 数据中具有非平稳性，且涉及复杂的时间依赖关系，DDPM 难以处理它的动态变化，生成的时序数据保真度不足。

因此，本文提出了一种时序增强型条件自适应模型——差分多时间序列（Diff-MTS），旨在解决 GANs 的训练不稳定性、条件一致性差，以及传统扩散模型时序捕捉能力弱的问题，生成高质量工业 MTS 数据。

2 核心思想与模型框架

2.1 整体设计思路

Diff-MTS 主要由三大部分组成：条件 DDPMs、条件自适应最大均值差异扩散方法（Ada- MMD）、时序分解重构网络（TDRUNet）。模型处理流程：首先，将工业传感器信号、条件信息与时间步经输入嵌入模块处理；接着，嵌入后的信息输入 TDR-UNet 模块，通过编码器进行特征提取，再使用 TDR 通过时序分解和注意力机制实现重建；随后，重建后的信息输入解码器；最后，结合 Ada-MMD 机制计算正则化损失以提升条件一致性，实现工业多元时间序列的生成。