1 研究背景
1.1 MTS 的重要性
工业多变量时间序列(MTS)是理解设备状态的核心依据,它被广泛应用于异常检测、剩余寿命预测、故障诊断等,也是训练高精度深度学习模型和构建工业大模型的基础。
1.2 现有生成方法的局限性
MTS 数据因时间尺度、噪声水平及潜在特征差异而呈现异质性,加之各工业企业的数据隐私顾虑,特定场景下的工业时间序列数据稀缺,这一点制约了工业智能的发展。
目前主流的数据生成方法主要包括变分自编码器 (VAEs) 和生成对抗网络 (GANs),但二者均存在显著不足。VAEs 主要依赖重构损失函数,其核心目标是实现高效编码和稳定重构,这导致生成样本的真实性欠佳,难以有效捕捉工业数据的复杂特征。GANs 采用生成器与判别器的对抗训练机制,但面临两个关键挑战:一是训练过程不稳定且收敛困难(工业数据噪声大、时序关系复杂,导致生成器难以学习有效规律,判别器则容易区分真假样本);二是条件一致性较差(需要额外训练分类器或判别器来实现条件控制,造成生成数据与输入条件的匹配度不足)。
1.3 扩散模型的潜力与不足
去噪扩散模型(DDPM)通过加噪和去噪的过程学习数据分布,在图像生成领域表现优异。但由于工业 MTS 数据中具有非平稳性,且涉及复杂的时间依赖关系,DDPM 难以处理它的动态变化,生成的时序数据保真度不足。
因此,本文提出了一种时序增强型条件自适应模型——差分多时间序列(Diff-MTS),旨在解决 GANs 的训练不稳定性、条件一致性差,以及传统扩散模型时序捕捉能力弱的问题,生成高质量工业 MTS 数据。
2 核心思想与模型框架
2.1 整体设计思路
Diff-MTS 主要由三大部分组成:条件 DDPMs、条件自适应最大均值差异扩散方法(Ada- MMD)、时序分解重构网络(TDRUNet)。模型处理流程:首先,将工业传感器信号、条件信息与时间步经输入嵌入模块处理;接着,嵌入后的信息输入 TDR-UNet 模块,通过编码器进行特征提取,再使用 TDR 通过时序分解和注意力机制实现重建;随后,重建后的信息输入解码器;最后,结合 Ada-MMD 机制计算正则化损失以提升条件一致性,实现工业多元时间序列的生成。
2.2 三大核心模块详细解析
2.2.1 去噪扩散概率模型(DDPM 基础)

该方法在传统 DDPM 的反向过程引入健康指标作为条件信息
,修改反向过程的概率公式如下:
定义
为扩散模型前向过程中所加的真实噪声,







