2024年1月16日,深度学习领域顶级会议——国际表征学习大会(International Conference on Learning Representations, ICLR) 公布了2024年论文录用情况,在投稿的7262份稿件中,东南大学数学学院虞文武教授团队文章《Sparse System Identification: Beyond Recent Deep Learning Techniques on Time-Series Prediction》获得7.33评分,排名前4%,最终被大会接收。
该文章提出了一种多变量数据(或称图数据/耦合数据/网络数据/时空数据等)长时预测的轻量级方法。摒弃了当前大多数方法都利用GPU集群训练深度学习模型、且需要大量算力开销的传统过程。该文章另辟蹊径,提出了“长短时存储”的系统辨识方案,通过长短时加记忆存储的特征提取模式,构建能够捕捉复杂系统动态特征的完备表达的基函数库,形成一个轻量级训练(仅需依赖CPU)、且预测效果不输于当前深度学习类模型的、具有显式函数表达认知优势的机器学习模型——GLIP。
受泰勒公式多项式展开思想的影响,目前绝大部分系统辨识方法因缺少系统的先验知识,往往不加分析的采用多项式为主的基函数,或加入超越函数增强基函数的表达能力,该方式并非一般非线性函数的等价完备表达。GLIP摒弃了该固有思想,使用傅里叶变换提取完备的频域信息,从而获取等价的表达函数,用于基函数库的构建,摆脱了多项式基仅适用于逐点展开、无法适用于全局函数表达的局限性,形成了一种机理与数据融合驱动的机器学习预测算法的新范式。利用傅里叶变换可以得到一个关于时域的一种完备表征形式:结合系统辨识的各种回归方法可以获得相较于传统思路更加长期的预测效果。这也突破了传统预测方法误差累积、只能进行短期预测的局限性。
GLIP在预测时融入了全局(长时)和局部(短时)的视野,构造了三组不同的基函数库:全局基、存储基和局部基,可以同时提取全局平均特征、接近测试集的局部敏感数据特征和系统机理动态变化过程特征的记忆存储。 .
全局基视野覆盖全局,局部基和存储基着眼于局部和系统机理动态演化,他们相互配合不仅可以完成全局的预测,还可以将全局预测的结果作用于局部进一步支持精确预测。目前GLIP取得了超越2023年及以前公开的主流神经网络方法的预测效果。因其方法的创新和实验的SOTA效果,最终被ICLR2024收录,论文信息和代码已公开在下方链接中。
该论文第一作者为东南大学数学学院研二硕士生刘潇奕,指导老师为陈都鑫副教授和虞文武教授,该研究工作得到了科技部科技创新2030“新一代人工智能”重大项目、国家自然科学基金重点项目的支持。
ICLR是深度学习领域的三大顶级会议之一,在谷歌学术刊物排名中位居前十。该会议专注于人工智能领域的前沿研究,发表了众多具有重要影响力的论文。ICLR采用全面公开的评审规则,评审过程中论文完全公开,允许所有对论文感兴趣的研究者参与论文评审意见的讨论,这使得ICLR在深度学习顶级会议中独具特色,具有评审的透明性和广泛性,同时也增加了论文被接收的难度。
论文信息:Xiaoyi Liu, Duxin Chen, Wenjia Wei, Xia Zhu, Wenwu Yu, Sparse System Identification: Beyond Recent Deep Learning Techniques on Time-Series Prediction. ICLR 2024. 链接:https://openreview.net/forum?id=aFWUY3E7ws