人工智能★ 评分 8.0

StaTS: Spectral Trajectory Schedule Learning for Adaptive Time Series Forecasting with Frequency Guided Denoiser

Jintao Zhang, Zirui Liu, Mingyue Cheng, Xianquan Wang, Zhiding Liu, Qi Liu
2026年3月3日
关键词
时间序列预测扩散模型噪声调度学习频率引导去噪谱正则化

核心发现

  1. 问题识别与方法论创新:现有扩散模型在时间序列预测中因固定噪声调度导致中间状态难以反演且终端噪声不纯,同时忽略了谱域退化。StaTS通过交替优化学习噪声调度(STS)和去噪器(FGD)来解决此问题。
  2. 谱轨迹调度器(STS):STS学习数据自适应的噪声调度,并通过谱正则化(包括平坦终端状态、平滑谱平坦度演变、避免退化噪声水平)来保持结构完整性和逐步可逆性。
  3. 频率引导去噪器(FGD):FGD估计调度引起的谱失真,并用其调制去噪强度,实现跨扩散步骤和变量的异构恢复,从而增强去噪能力。
  4. 两阶段训练与理论支撑:采用两阶段训练策略稳定调度学习与去噪器优化的耦合,并通过理论证明(PGD收敛性、前向漂移稳定性)支撑其优化过程。
  5. 卓越的性能与效率:在8个真实世界多元时间序列基准测试中,StaTS在CRPS和MAE上持续超越SOTA基线,并在大多数情况下降低MSE,同时展现出比其他扩散模型更低的内存和运行时开销。
  6. 组件有效性与鲁棒性:消融实验证明了STS中端点目标、FGD中谱失真估计以及实例归一化的关键作用。方法对扩散步数和STS训练周期不敏感,表现出良好的鲁棒性。

实验规模

论文在8个真实世界多元时间序列数据集上进行了评估,包括Electricity、ILI、ETTh1、ETTh2、ETTm1、ETTm2、Traffic和SolarEnergy。这些数据集的维度从7到862不等,时间步长从966到69680。 对比了5个最先进的概率时间序列预测基线模型:CSDI、D3VAE、TimeDiff、DiffusionTS和NsDiff。 实验设置遵循长期多元时间序列预测的标准协议,输入长度为168,扩散步数T=50。模型训练50个epoch,使用3个随机种子,推理时每个测试实例抽取100个样本。评估指标包括CRPS、MAE和MSE。 计算效率方面,StaTS在Traffic数据集上展现出比其他扩散基线更低的内存(训练27.74MB vs CSDI 3512.09MB)和运行时(训练10.61ms vs CSDI 77.81ms)开销。

局限性

尽管StaTS在概率预测方面表现出色,但在某些数据集(如ETTm1和SolarEnergy)上,其MSE指标未能超越最佳基线,这可能表明在点预测精度方面仍有提升空间。此外,STS模块中多个超参数的平衡(如lambda权重)可能需要细致调优,且论文未提供这些超参数的敏感性分析。

Paper ID: 2603.00037v1