MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

综述由AI生成基于时间序列预测技术，MIT 与 IBM 联合团队提出 Inter-Series Transformer 模型，旨在解决供应链需求预测中的稀疏性和跨系列效应问题。该模型引入系列间注意力层捕捉产品间的动态关系，结合共享多任务网络避免过拟合。实验表明，该模型在私有数据集及 Walmart 零售数据集上均优于传统方法及 DeepAR、TFT 等神经网络模型，显著提升了预测准确性与稳定性。

laoliangsh发布于 2025/2/7更新于 2026/6/225 浏览

MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

时间序列预测在现代数据分析中扮演着至关重要的角色。它不仅在金融市场、天气预报等领域广泛应用，更是供应链管理中的核心技术之一。通过对历史数据的分析和建模，时间序列预测能够帮助企业预测未来的需求、优化库存管理、提高供应链效率，从而降低成本、提升客户满意度。在供应链管理中，准确的需求预测可以避免库存过剩或短缺，确保产品能够及时供应，满足市场需求。

尽管 Transformer 神经网络在自然语言处理和计算机视觉等领域取得了显著成功，但其在供应链需求预测中的应用仍然面临诸多挑战。传统的时间序列预测方法，如指数平滑、ARIMA 等，虽然在某些情况下表现良好，但在处理复杂的供应链需求预测时，往往力不从心。Transformer 模型虽然在时间序列预测中展示了潜力，但其在处理供应链需求预测中特有的稀疏性和跨系列效应时，表现仍有待提高。现有的 Transformer 模型大多针对通用的时间序列数据集进行优化，缺乏对供应链需求预测这一特定应用场景的专门设计和调整。

8 月 8 日，来自 IBM 研究中心和麻省理工学院（MIT）的研究团队提出了一种新的 Transformer 模型——Inter-Series Transformer。该模型通过引入系列间注意力层，旨在捕捉不同产品时间序列之间的动态关系，从而改进需求预测的准确性。具体来说，Inter-Series Transformer 模型在初始阶段应用跨时间序列的注意力机制，以捕捉交互并解决稀疏性问题。随后模型使用共享的多任务每时间序列网络，独立地对每个时间序列进行转换，捕捉时间效应并生成预测。通过这种方式，Inter-Series Transformer 模型不仅能够有效利用跨系列信息，还能避免多变量建模中常见的过拟合问题。

团队成员包括 Rares Cristian、Pavithra Harsha、Clemente Ocejo、Georgia Perakis、Brian Quanz、Ioannis Spantidakis 和 Hamza Zerhouni。IBM 研究中心的研究人员主要来自位于纽约约克镇高地的 IBM TJ Watson 研究中心，而 MIT 的研究人员则来自位于马萨诸塞州剑桥市的麻省理工学院。这支跨机构的研究团队结合了 IBM 在实际应用中的丰富经验和 MIT 在理论研究中的深厚积累，为本研究提供了坚实的基础和广泛的视角。

MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

相关工作

Inter-Series Transformer 模型

更多推荐文章

相关免费在线工具

架构设计

系列间注意力层

特征处理

实验设置

数据集

训练过程

评估指标

实验结果与分析

传统模型的结果

神经网络模型的结果

最新模型的结果

Inter-Series Transformer 的表现

进一步分析与消融研究

时间序列交叉验证：模型鲁棒性的验证

高维表示投影实验：不同特征投影方法的比较

位置编码实验：位置编码与连续时间特征的比较

结论与未来工作

更多推荐文章

相关免费在线工具

MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

MIT 与 IBM 联合提出 Inter-Series Transformer 用于供应链需求预测

相关工作

Inter-Series Transformer 模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

架构设计

系列间注意力层

特征处理

实验设置

数据集

训练过程

评估指标

实验结果与分析

传统模型的结果

神经网络模型的结果

最新模型的结果

Inter-Series Transformer 的表现

进一步分析与消融研究

时间序列交叉验证：模型鲁棒性的验证

高维表示投影实验：不同特征投影方法的比较

位置编码实验：位置编码与连续时间特征的比较

结论与未来工作

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具