时间序列预测的全面综述:架构多样性与开放挑战

摘要
时间序列预测(Time Series Forecasting, TSF)是一个至关重要的任务,它为经济规划、供应链管理和医学诊断等各个领域的决策提供了关键信息。过去,传统统计方法和机器学习曾被广泛应用于时间序列预测问题,然而,随着多种基础的深度学习架构如多层感知机(MLP)、卷积神经网络(CNN)、递归神经网络(RNN)和图神经网络(GNN)的发展,这些架构被逐步应用于时间序列预测问题的解决。然而,由于每种深度学习架构的归纳偏置所带来的结构性限制,它们的性能也受到了制约。变换器模型(Transformer),擅长处理长期依赖关系,已经成为时间序列预测中的重要架构组件。然而,近期的研究表明,简单的线性层等替代方案能够超越变换器模型。这些发现为使用多样化架构提供了新的可能性。在探索各种模型的背景下,时间序列预测的架构建模已经进入了一个复兴阶段。本综述不仅为时间序列预测提供了历史背景,还对向架构多样化发展的趋势进行了全面而及时的分析。通过比较和重新审视多种深度学习模型,我们揭示了新的视角,并呈现了时间序列预测中的最新趋势,包括混合模型、扩散模型、Mamba 模型和基础模型的出现。通过聚焦时间序列数据的内在特性,我们还讨论了时间序列预测中受到关注的开放挑战,如通道依赖性、分布变化、因果关系和特征提取等。本综述探讨了通过多样化方法提升预测性能的关键要素。
关键词: 时间序列预测,深度学习,基础模型,分布变化,因果关系

1. 引言
时间序列预测(Time Series Forecasting, TSF)是一个基于历史数据序列预测未来值的任务。它作为各个领域的关键决策工具,广泛应用于经济与金融、供应链管理、交通运输、能源、气象和医疗保健等领域。这些应用提供了诸多机会,包括降低成本、提高效率和增强竞争力。然而,时间序列数据固有的多样性和复杂性使得预测变得极具挑战性。除了显而易见的信息外,各种隐藏的模式使得学习时间依赖关系变得更加困难,而在某些时候不规则的值进一步加剧了这一难题。在多变量问题中,诸如通道相关性等额外因素使得任务变得更加复杂。此外,时间序列数据因领域的不同而展现出不同的特征,数据采集的时间和环境也导致了显著不同的模式。因此,TSF 问题通常具有有限的模型泛化能力,需要多样化的架构和方法。日益复杂的 TSF 问题给研究人员带来了更大的挑战,近期这也促使了新方法和算法的积极发展,以应对这些问题。
在主要的人工智能和机器学习会议上接受的论文数量急剧增加,证明了 TSF 研究在人工智能和机器学习领域的重要性不断上升。随着越来越多的研究致力于解决时间序列预测问题,综述性论文也频繁发表。随着时间的推移,许多综述性论文系统地整理了 TSF 的广泛领域,提供了深入的研究,给研究人员提供了宝贵的指导和方向。然而,现有的综述论文仍有改进的空间,特别是在应对模型多样性日益增加和领域中的开放挑战方面。
TSF 模型经历了长时间的发展。过去,主要使用基于移动平均的统计方法,后来发展成了传统方法,如指数平滑和自回归综合滑动平均(ARIMA)。机器学习技术,如决策树模型和支持向量机(SVM),也曾被广泛应用,但它们在学习复杂的非线性模式方面存在局限性。随着可用数据量的增加和硬件计算能力的提升,各种深度学习架构如多层感知机(MLP)、递归神经网络(RNN)、卷积神经网络(CNN)和图神经网络(GNN)被开发出来,能够学习更复杂的模式。然而,这些早期的深度学习架构的性能受限于它们的内在设计。为了克服这些结构性限制,像长短期记忆网络(LSTM)和时序卷积网络(TCN)等变种被广泛应用。变换器(Transformer)因其处理长期依赖关系的能力,在自然语言处理领域表现出色,随后也自然地扩展到时间序列数据。尽管变换器在 TSF 中表现良好并且广泛流行,但近期的研究表明,简单的线性模型也可以超越变换器模型。因此,重新审视传统深度学习方法的兴趣显著增加,并且对各种架构(如基础模型、扩散模型和 Mamba 模型等)产生了越来越多的关注。变换器模型仍在持续改进,并在 TSF 中扮演着重要角色。因此,TSF 进入了一个建模的复兴阶段,各种方法正在积极竞争,且没有任何单一方法占据主导地位。
在这种背景下,本综述具有两个主要优点,使其与以往的 TSF 综述论文区别开来。首先,我们关注架构多样性的不可避免性,提供了一个及时和全面的视角,帮助理解当前架构多样化的趋势。现有的 TSF 综述论文主要集中在对特定架构的详细分析,但在广泛比较多样化架构,包括新兴架构方面存在局限性。本论文系统地比较了各种架构(MLP、CNN、RNN、GNN、Transformer、扩散模型、基础模型、Mamba)的发展进展,并分析了每种架构的优缺点和贡献。此外,本文还探讨了结合多种架构优点的混合模型的性能,清晰地展示了 TSF 中的关键趋势。通过这些贡献,读者能够有效地理解该领域不断发展的趋势和方向。
其次,我们从开放挑战的角度进行探讨。尽管许多先进的架构已经解决了许多问题,但 TSF 中的核心挑战仍然存在。特别是,通道相关性、分布变化、因果关系和特征提取等问题依然是需要解决的重要挑战。本综述探讨了旨在解决这些挑战的最新方法,并为读者提供了宝贵的解决问题的见解。尽管先前的综述提供了有关开放挑战的有用视角,但它们在这些问题的探讨深度上有所不足。本综述旨在弥补这一空白,提供更为全面的分析并提出新的解决方案。





