DSE精选文章
An Overview Based on the Overall Architecture of Traffic Forecasting
文章介绍
方法框架
在智能交通系统发展进程中,交通预测占据关键地位。依据图1呈现的流程,研究人员开展交通预测工作时,有着清晰的逻辑步骤与目标导向。研究人员先从多渠道收集具有多源、异构等特性且存在样本偏差等问题的交通区域和点数据,并进行预处理剖析其特性,接着围绕空间、时间和时空表示构建交通数据模型以捕捉相关特征,最后针对交通流、速度等不同预测任务选择合适模型方法,同时开发并优化损失函数来提高预测准确性。

图1. 方法框架图
(1)交通数据分析
在数据收集方面,数据主要来源于固定城市传感(如道路监控设备)、移动城市传感(如共享单车、出租车)和被动城市传感(如地铁公交交易记录、带 GPS 的智能手机 )。

图2. 交通数据分析
在数据格式方面,交通数据可以分为交通区域数据(类似网格数据 )和交通点数据(如传感器、地铁站等数据)。在两种典型交通数据中,交通区域数据由于其在时间和空间维度上的排列规则,是较为特殊的交通数据类型。交通点数据是一类在空间维度上不规则排列的时空数据,是比交通区域数据更通用的表示形式。因此,交通区域数据与交通点数据之间的关系是从特殊到一般的。

图3. 交通数据格式
收集到的数据常面临样本偏差、稀疏和缺失等问题,学者们提出了多种预处理方法应对。交通数据具有多源、异构、多模态和复杂时空依赖的特性,受天气、节假日等外部因素影响显著,这些特性增加了数据分析和建模的难度。
(2)交通数据建模
交通数据是一类包含空间维度和时间维度的时空数据。因此,将交通数据建模分为三组:空间表示、时间表示和时空表示。
空间表示通常处理网格数据或图形数据。学者们通常采用卷积神经网络来学习网格数据的特征,并通过图神经网络或其变体来学习图数据复杂和动态的空间依赖关系。这里值得注意的是,交通流量图可以总结为静态图、虚拟图、层次图或动态图,示例如下图所示。

图4. 交通图示例
时间表示将时间视为序列数据,研究人员通常使用 RNN、TCN、Causal TCN 或其变体。这里值得注意的是,时间特征分为临近性、周期性、趋势、每日、每周和假期,如下图所示。

图5. 时间特征示例
时空表示意味着模型可以同时捕获空间和时间特征,例如 STSGCN 和 STJGCN。最后,文中还讨论了时空与其他前沿技术相结合的研究,如元学习、ODE、自监督学习、持续学习等。
(3)交通预测应用
交通预测包含各种应用场景。在这里,总结了现有交通预测工作的主要应用,包括交通流量预测、交通速度预测、交通需求预测和其他混合交通预测。
(4)数据集

这些数据集来源广泛,涵盖了不同城市和交通场景。如TaxiBJ数据集包含北京出租车的交通数据,SHMetro和HZMetro分别记录了上海和杭州的地铁交易数据,这些数据为研究提供了丰富的信息。数据的时间跨度和粒度各不相同,时间间隔从30秒到30分钟不等,涵盖的时间范围从几个月到数年,为不同时间尺度的交通预测研究提供了多样的选择。
模型对比与分析:文中虽未像传统实验那样对具体模型进行对比测试,但通过对现有交通预测模型的广泛调研和分析,间接呈现了不同模型在处理交通数据时的特点。不同模型在面对交通数据的多源、异构、复杂时空依赖等特性时表现各异。在空间表示上,网格法、图神经网络法等各有优劣;时间表示方面,RNN、TCN等模型也展现出不同的性能(如在计算效率、捕捉时间特征能力等方面)。通过这些分析可知,目前的模型在处理交通数据时仍面临挑战,如异构数据融合困难、多任务预测复杂以及模型缺乏可解释性等。
(5)挑战与未来方向
基于对现有模型的总结分析,文章指出当前交通预测面临的挑战。
在数据方面,异构交通数据融合是难题,交通数据常伴有缺失、稀疏和噪声问题;多任务预测需处理多样的数据格式和复杂的时空相关性;模型解释性方面,机器学习和深度学习模型多为黑箱模型,在交通领域的可解释性研究有限。
针对这些挑战,文章提出未来研究方向,包括大规模图基交通预测,以应对智能城市中大规模交通图数据;基于自监督的交通预测,探索图对比学习在时空图中的应用;知识引导的交通预测,挖掘和整合交通知识;大模型引导的交通预测,结合交通数据的多源多模态特性,利用大模型提升预测能力。
结语
作者简介
期刊简介