基于渐进式的大规模短时交通流量预测方法
未命名
07-17
阅读:83
评论:0
1.本发明涉及智能交通系统中的交通流量预测,具体地,涉及一种基于渐进式的大规模短时交通流量预测方法。
背景技术:
2.随着经济水平的提高,越来越多的人们开始使用交通工具来方便出行,然而,这给交通系统的管理带来了严峻的挑战,例如,频繁发生的交通拥堵现象和日益增加的交通事故等。为了能更加主动地、智能地对交通系统进行决策和管理,许多不同类型的传感器被部署在了道路的各个地方。通过这些传感器收集到的交通数据,学者们可以进行进一步的对比、分析和挖掘交通数据中潜藏的规律,以预测未来时间段内的交通流量。在交通流量预测领域中,进行大规模交通流量预测是一大挑战。越来越多的技术被设计用来完成这项任务,此外,它还被广泛应用于导航系统、旅行者信息系统、交通异常检测、物流优化系统、物流供应链和城市管理中。
3.交通流量数据有两大典型特征:时间相关性和空间相关性。更具体的表现是,同一区域不同时间里,交通流量数据不同,且呈现出逐渐变化的趋势;同一时间不同区域内,交通流量数据变化存在着一定的相似性,区域之间存在着互相影响。因此,如何对交通流量数据进行准确的预测,其关键在于如何有效地对交通流量的时空依赖进行合理建模。事实上,交通流量被学者们证实是高度可预测的。早期,一些学者通过利用传统统计学的方法来对交通数据进行建模,然而这些方法只适用于对线性数据进行有效建模,在处理复杂非线性的交通流量数据时表现得效果较差。随后,一些学者采用了浅层的机器学习方法和一些深度学习的方法对交通流量数据进行建模,这些方法虽然可以很好地建模交通数据复杂的时间依赖,但是他们并没有考虑到交通流量数据的空间相关性。在图像领域的卷积神经网络取得了瞩目的性能效果后,一些学者开始尝试将交通路网的空间拓扑视为图像,并通过在模型中嵌入卷积神经网络的技术来对交通流量数据的空间依赖进行建模。然而,卷积神经网络只适用于对规范化的网格网络进行建模,对非欧几里得的、高维复杂的交通路网的特征提取,表现较差。近年来,越来越多的学者通过在模型中嵌入图卷积网络来拟合交通数据的空间特征。尽管这些基于图卷积网络的模型看起来十分合理,它们在大规模传感器组成的交通路网上对交通流量进行预测时的性能表现较差,且效率较低。通过在大规模交通流量数据集上进行预研发现,一部分最先进的方法有着较高的效率,但是其性能表现较差;另一部分最先进的方法有着较高的性能,但是其效率低下。造成这种现象的原因主要有:
4.1)现有基于图卷积的方法通过设置人工阈值来对邻接矩阵进行处理,过滤掉了远距离传感器之间的数值,从而忽略了远距离传感器之间的影响,然而这个影响在大规模交通流量预测中是不可忽略的。
5.2)由于忽略的远距离传感器之间的影响,现有方法在对大规模交通数据的时空依赖进行特征融合时就会造成不充分、不全面的现象。
6.3)图卷积技术在处理大规模图的结构时会有着较多的计算开销和复杂的卷积操
作,更具体的说,图卷积网络需要去遍历大规模图拓扑中的大量节点以及其邻居节点,还需要进行多层特征提取和编码操作,这会导致时间开销随着图的规模的提升而显著增加。
技术实现要素:
7.本发明的目的是提供一种基于渐进式的大规模短时交通流量预测方法,该方法基于渐进式的思想,将时间特征和空间特征通过逐步融合的方式来更全面、更充分地进行时空融合操作,有效地解决现有方法在大规模交通流量预测中存在的时空融合不充分的问题,且大幅度降低了计算和空间依赖建模的时间开销;同时,预测效果更精准,能够为城市交通管理提供较为准确的参考依据。
8.为了实现上述目的,本发明提供了一种基于渐进式的大规模短时交通流量预测方法,该基于渐进式的大规模短时交通流量预测方法包括:
9.s1、获取传感器采集的原始数据集,并对原始数据集进行预处理,得到多种不同周期模式的历史交通数据和传感器之间的真实道路驾车距离邻接矩阵;
10.s2、构建基于渐进式的大规模短时交通流量模型,将处理好的多种周期时间序列数据和驾车距离邻接矩阵作为模型的输入,训练所述大规模短时交通流量模型,得到具有预测未来时间段内交通流量能力的大规模短时交通流量模型;
11.s3、通过s2中得到的模型对其输入当下的流量数据来预测未来的流量数据。
12.优选地,所述多种周期模式包括分别以月为周期、以周为周期和近期,所述历史交通数据包括多条记录,每条记录包括:一个时间段内的交通流量、该时间段的日期和所处时间的起始和结束。
13.优选地,针对三种周期的时间序列数据,先利用自注意力思想对其进行分别建模,以捕获其自身的时间依赖信息;再基于两两融合、串行的方式,将建模后的月周期模式和周周期模式先进行时间特征融合,得到的时间特征再与近期模式进行时间特征融合,来提取交通流量数据最终的时间特征;
14.针对驾车距离邻接矩阵,利用大规模图嵌入技术中的二阶相似性计算方法对其进行编码,计算出交通流量数据最终的空间特征;
15.针对构建好的交通流量数据的时间特征和空间特征,利用基于渐进式思想的时空融合模块对其进行时空融合建模,并最后产生预测结果。
16.优选地,s1中,在纳入训练的传感器中采集当前时间段内的交通数据,将采集好的交通流量数据输入已训练好模型中,进行大规模短时交通流量预测,来预测未来一段时间的交通流量信息;
17.其中,原始数据集包含传感器所在街道、经纬度和若干条记录,记录涵盖该传感器一年内所记录的数据,每条记录间隔15分钟;每条流量记录包括记录的日期、时间、当天的类型、时间段内通过的车辆数、时间段内通过的车辆的平均速度,此外,原始数据集中含有上千个传感器记录的数据,属于大规模交通预测;
18.对原始数据集进行预处理操作,所述预处理操作内容包括:从原始数据集中按照以月为周期、以周为周期和近期历史流量数据为当前周期进行预处理,整理出月模式、周模式和当前模式三个交通流量时间序列数据s
month
、s
week
和s
current
,并按照7∶1∶2的比例划分为训练集、验证集和测试集;从原始数据集中提取每个传感器的经纬度信息,通过将其映射到
地图的公路上来计算其两两之间的驾车距离,构建传感器之间的驾车距离邻接矩阵d,所述驾车距离邻接矩阵d为非对称矩阵。
19.优选地,对原始数据集进行预处理操作包括:从原始数据集中提取所有传感器节点的空间位置坐标,并将空间路网拓扑信息定义为图g=(v,e,w);其中,v是所有传感器节点的集合,|v|=n表示传感器节点的总数为n,e是所有传感器节点有向边的集合,w是有向边对应的权重的集合;
20.通过将传感器节点映射到地图上,来计算得到图g的驾车距离邻接矩阵d,并将d作为图g的有向边权值,即d=w;
21.从原始数据集中提取所有传感器的交通流量数据,其中,t时间步内传感器站点i观测到的交通流量数据记为则t时间步内,所有传感器站点观测到的交通流量数据记为t时间步代表一个[t,t+δt]的时间间隔,并进一步构建t时间步内的三个周期模式时间序列:
[0022][0023][0024][0025]
其中,w和m分别表示一周的时间步长和一个月的时间步长;最后将m个时间步的三个周期模式时间序列拼接起来,得到个周期模式时间序列拼接起来,得到和其中,表示实数集,p表示时间序列的长度。
[0026]
优选地,在s2中确定交通流量预测模型的输入和输出变量,其中,输入变量包括:以月为周期、以周为周期和近期历史流量数据,以及驾车距离邻接矩阵d;输出变量包括:对应传感器未来时间段内的交通流量;
[0027]
基于渐进式的大规模短时交通流量模型包括:多视图时间序列编码模块、空间知识提取模块和基于渐进式的时空融合模块;将三个周期模式时间序列作为多视图时间序列编码模块的输入,驾车距离邻接矩阵d作为空间知识提取模块的输入,基于渐进式的时空融合模块通过对多视图时间序列编码模块和空间知识提取模块的结果进行时空特征融合并产生输出
[0028]
所述多视图时间序列编码模块包括:一个初始化操作和两个双视图时间序列编码组件,所述初始化操作将给每一个输入的周期模式初始化一个低维向量tf,并将其嵌入到对应周期模式中;所述双视图时间序列编码组件有两个输入分支和一个输出分支,每个输入分支包括:一个自注意力组件、一个双分支交叉注意力组件和一层前馈神经网络层,输出分支将两个输入分支经过前馈神经网络层的最后结果相加作为输出结果;
[0029]
在多视图时间序列编码模块中,对于输入数据s
month
、s
week
和s
current
,先将月周期模式和周周期模式输入第一个双视图时间序列编码组件进行时间特征的融合,得到融合了月周期和周周期时间特征的中间变量s
temp
:
[0030]stemp
=
[0031]
ffn(dbca(sa(s
month
),sa(s
week
)))+
[0032]
ffn(dbca(sa(s
week
),sa(s
month
))),
[0033]
再将中间变量s
temp
与s
current
输入第二个双视图时间序列编码组件进行时间特征的融合,最后构建出交通流量数据的时间特征te:
[0034]
te=
[0035]
ffn(dbca(sa(s
temp
),sa(s
current
)))+
[0036]
ffn(dbca(sa(s
current
),sa(s
temp
)));
[0037]
其中,sa(
·
)表示自注意力组件的计算操作,dbca(a,b)表示双分支交叉注意力组件的计算操作,a和b为其输入且位置调换对结果有影响,ffn(
·
)表示前馈神经网络层的计算操作;
[0038]
所述空间知识提取模块包括:一个大规模图嵌入编码组件;所述大规模图嵌入编码组件将驾车距离邻接矩阵d作为输入,利用二阶相似性的计算方法来捕获交通流量数据的空间特征,其中,二阶相似性的计算方法首先根据传感器节点的个数将每个节点映射成两个低维向量表示和并以o=-∑
(i,j)∈ewij
log p(vj|vi)为优化函数对其进行优化,最终提取到交通流量数据的空间特征ge;其中,表示i节点本身的表示向量,表示i节点作为其他节点邻居时的表示向量,w
ij
表示从节点i到节点j的权值,e表示所有节点的集合,
[0039]
所述基于渐进式的时空融合模块包括:l个串联的渐进交叉注意力组件和一层前馈神经网络层;l的取值与数据集有关,所述渐进交叉注意力组件包括:一个全连接层、两个渐进交叉注意力层和两个前馈神经网络层;其中,所述基于渐进式的时空融合模块将时间特征te和空间特征ge作为输入,经过l个渐进交叉注意力组件的时空融合处理后,得到充分融合的时空特征tel,不失一般化,这里用tei代表第i个渐进交叉注意力组件的输出,特别的,当i=o时,te=te0。
[0040]
在得到充分融合的时空特征te
l
后,将其作为基于渐进式的时空融合模块的最后一层前馈神经网络层的输入,以产生最后的预测结果
[0041]
优选地,在自注意力组件中,输入特征z会先被输入层正则化网络层处理,得到自注意力层的输入z
(1)
,自注意力层会将z
(1)
映射成三个矩阵wq、wk和wv,通过wq每行的行向量与wk每列的列向量进行向量点积来进行相似度计算,即再对其结果进行softmax计算来得到输入特征z
(1)
的注意力系数矩阵a,再通过得到自注意力层的结果z
(2)
,之后将z
(2)
进行残差连接操作,得到z
(3)
=z
(2)
+z,最后将z
(3)
输入前馈神经网络层进行计算,与自注意力层类似,前馈神经网络层之前有一层正则化网络层,之后有一层残差连接层,同理可得前馈神经网络层的输出z
(4)
,即z
(4)
=sa(z);其中,不失一般化,z为自注意力组件的输入,可以为s
month
、s
week
、s
current
或s
temp
,表示矩阵叉乘。
[0042]
优选地,在双分支交叉注意力组件中,以初始化操作中嵌入的低维向量tf的计算为主,该向量的设计是为了存储所在模式的时间特征并参与和其他周期模式的融合计算,
由于将其用低维向量表示,可有效降低特征融合的时间开销,在自注意力组件计算后,tf向量已经学习到了所在周期模式的时间特征;
[0043]
在对双分支注意力组件中输入a和b周期模式后,先初始化一个低维向量s
pos
,再将其嵌入到不包含tfb的b周期模式sb上用来捕获b周期模式传感器之间的局部位置信息,通过一个偏置算法,对带有低维向量s
pos
的b周期模式进行自注意力操作,得到包含局部位置信息的b周期模式的中间变量息的b周期模式的中间变量其中||代表矩阵的拼接操作,再将a周期模式的低维向量tfa和进行计算,先将tfa映射成wq矩阵,映射成wk和wv矩阵,与自注意力组件中的自注意力层的计算原理类似,先计算此时wq代表的是a周期模式的时间特征,wk代表的是b周期模式的时间特征,通过矩阵叉乘计算后进行softmax函数计算得到二者的交叉注意力系数矩阵a
ab
,再将a
ab
与wv进行矩阵叉乘计算,得到融合后的tf
ab
向量,再做一次残差连接计算,将tf
ab
与tfa相加,然后将其结果嵌入到a周期模式中,作为新的tfa;其中,不失一般化,a和b代表输入的周期模式,可以为s
month
、s
week
、s
current
或s
temp
,且a和b的地位不等价。
[0044]
优选地,在第i个渐进交叉注意力组件中,对于输入的时间特征te
i-1
,先将其输入到全连接层中,将其维度与空间特征ge对齐,再将对齐后的时间特征te
i-1
与空间特征ge输入渐进交叉注意力层作时空融合,得到融合了时空特征的中间变量tgi=ffn(pca(fc(te
i-1
),ge)),考虑到渐进式融合可能会存在信息损失,且每一个渐进交叉注意力组件都以原始的ge作为空间特征输入,不需要弥补空间特征的融合损失,而时间特征输入来自于上一个渐进交叉注意力组件的输出,可能会存在时间特征的损失,因此为了保存更多的时间特征信息,将输入的时间特征te
i-1
与融合了时空特征的中间变量tgi作为第二个渐进交叉注意力层的输入进行进一步融合,来弥补时间特征的融合损失,每个渐进交叉注意力层后都有一层前馈神经网络层,最后得到第i个渐进交叉注意力组件的计算结果:
[0045]
tei=ffn(pca(tgi,te
i-1
)),i=1,2,3,......;
[0046]
其中,ffn(
·
)表示前馈神经网络层的计算操作,fc(
·
)表示全连接层的计算操作,pca(
·
)表示渐进交叉注意力层的计算操作。
[0047]
优选地,在渐进交叉注意力层中,对于输入变量a和b,将a映射成wq矩阵,b映射成wk和wv矩阵,进行与自注意力层类似的计算,即矩阵,进行与自注意力层类似的计算,即然后进行一次残差连接作为最后的输出,也即:pca(a,b)=o
ab
+a;其中,不失一般性,a和b表示输入的变量,可以是te
i-1
、ge或tgi等;
[0048]
在得到充分融合的时空特征te
l
后,将其作为基于渐进式的时空融合模块的最后一层前馈神经网络层的输入,以产生最后的预测结果,所述基于渐进式的大规模短时交通流量预测模型的预测结果为:
[0049][0050]
根据上述技术方案,首先获取并预处理数据集,其中数据集取自传感器采集的原始数据,原始数据包括:传感器所在街道、经纬度和若干流量记录,每条流量记录包括记录
的日期、时间、当天的类型(工作日、节假日、雨天、晴天等等)、时间段内通过的车辆数、时间段内通过的车辆的平均速度等等,在获取数据集后,对其进行信息提取和拓展的预处理操作,提取数据集中的周期数据,周期数据包括以月(28天)为周期的历史交通数据、以周(7天)为周期的历史交通数据和近期数据,拓展操作通过提取数据集中的经纬度信息,并将其映射到地图上来计算每个传感器之间的驾车距离邻接矩阵;构建基于渐进式的大规模短时交通流量模型,将预处理得到的周期数据和驾车距离邻接矩阵作为时间特征和空间特征输入到模型中,对其进行训练;采集当前时刻下的交通流量数据,并将数据输入到训练好的模型中来预测未来时间段内的交通流量。
[0051]
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0052]
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0053]
图1是本发明提供的基于渐进式的大规模短时交通流量预测方法的流程示意图;
[0054]
图2是本发明提供的基于渐进式的大规模短时交通流量预测方法的结构示意图;
[0055]
图3是本发明提供的基于渐进式的大规模短时交通流量预测方法中双视图时间序列编码组件的结构示意图;
[0056]
图4是本发明提供的基于渐进式的大规模短时交通流量预测方法中渐进交叉注意力组件的结构示意图。
具体实施方式
[0057]
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
[0058]
参见图1,本发明提供一种基于渐进式的大规模短时交通流量预测方法,该方法包括:
[0059]
s1、获取传感器采集的原始数据集,并对原始数据集进行预处理,得到多种不同周期模式的历史交通数据和传感器之间的真实道路驾车距离邻接矩阵;
[0060]
s2、构建基于渐进式的大规模短时交通流量模型,将处理好的多种周期时间序列数据和驾车距离邻接矩阵作为模型的输入,训练所述大规模短时交通流量模型,得到预测未来时间段内的交通流量信息。
[0061]
s1中的多种周期模式包括分别以月(28天)为周期、以周(7天)为周期和近期,历史交通数据包括多条记录,每条记录包括:一个时间段内的交通流量、该时间段的日期和所处时间的起始和结束。
[0062]
s1具体包含以下步骤:
[0063]
s11,获取传感器采集的原始数据集,所述原始数据集包含传感器所在街道、经纬度和若干条记录等信息,记录涵盖了该传感器一年内所记录的数据,每条记录间隔15分钟,所述每条流量记录包括记录的日期、时间、当天的类型(工作日、节假日、雨天、晴天等)、时间段内通过的车辆数、时间段内通过的车辆的平均速度等,此外,原始数据集中含有上千个传感器记录的数据,在智能交通系统下的交通流量预测领域,属于大规模交通预测;
[0064]
s 12,对原始数据集进行预处理操作,所述预处理操作内容包括:从原始数据集中按照以月(28天)为周期、以周(7天)为周期和近期历史流量数据为当前周期进行预处理,整理出月模式、周模式和当前模式三个交通流量时间序列数据s
month
、s
week
和s
current
,并按照7:1:2的比例划分为训练集、验证集和测试集,以训练和验证所述大规模交通流量预测模型的准确性;从原始数据集中提取每个传感器的经纬度信息,通过将其映射到地图的公路上来计算其两两之间的驾车距离,构建传感器之间的驾车距离邻接矩阵d,为了更符合客观实际,所述驾车距离邻接矩阵d是非对称矩阵。
[0065]
s121,从原始数据集中提取所有传感器的交通流量数据,并使用最大最小归一化的方法对采集的交通流量数据进行归一化处理,以消除量纲带来的影响;
[0066]
s122,对归一化处理好后的交通流量数据进行周期模式的划分,t时间步内,传感器站点i观测到的交通流量数据记为则t时间步内,所有传感器站点观测到的交通流量数据记为t时间步代表一个[t,t+δt]的时间间隔,并进一步构建t时间步内的三个周期模式时间序列:
[0067][0068][0069][0070]
其中,w和m分别表示一周(7天)的时间步长和一个月(28天)的时间步长,假设一个时间步长为15分钟,那么w=7
×
24
×
(60/15),m=28
×
24
×
(60/15);最后将m个时间步的三个周期模式时间序列拼接起来,得到和其中,表示实数集,p表示时间序列的长度;
[0071]
s123,从原始数据集中提取所有传感器节点的空间位置坐标,并将空间路网拓扑信息定义为图g=(v,e,w);其中,v是所有传感器节点的集合,|v|=n表示传感器节点的总数为n,e是所有传感器节点有向边的集合,w是有向边对应的权重的集合;通过将传感器节点映射到地图上,来计算得到图g的驾车距离邻接矩阵d,并将d作为图g的有向边权值,即d=w。
[0072]
s13,确定交通流量预测模型的输入和输出变量,其中,输入变量包括:以月为周期、以周为周期和近期历史流量数据,以及驾车距离邻接矩阵d;输出变量包括:对应传感器未来时间段内的交通流量
[0073]
在本实施例中,大规模交通流量预测方法的目标是:构建一个函数f,给定当前时刻t的三种周期模式:月周期、周周期和近期,能够预测未来q个时间步里各个传感器所在位置的交通流量信息其中,指的是第i个传感器未来q个时间步里的交通流量预测值。
[0074][0075]
s2,构建基于渐进式的大规模短时交通流量模型,将处理好的三种周期时间序列
数据s
month
,s
week
,s
current
和驾车距离邻接矩阵d作为模型的输入,训练所述大规模短时交通流量模型,来达到预测未来时间段内的交通流量信息的效果;其中,针对三种周期的时间序列数据,先利用自注意力思想对其进行分别建模,以捕获其自身的时间依赖信息,再基于两两融合、串行的方式,将建模后的月周期模式和周周期模式先进行时间特征融合,得到的时间特征再与近期模式进行时间特征融合,来提取交通流量数据最终的时间特征;针对驾车距离邻接矩阵,利用大规模图嵌入技术中的二阶相似性计算方法对其进行编码,来计算交通流量数据最终的空间特征;针对构建好的交通流量数据的时间特征和空间特征,利用基于渐进式思想的时空融合模块对其进行时空融合建模,并最后产生预测结果;
[0076]
在本实施例中,如图2所示,所述的基于渐进式的大规模短时交通流量模型包括:多视图时间序列编码模块、空间知识提取模块和基于渐进式的时空融合模块;其中,将三个周期模式时间序列作为多视图时间序列编码模块的输入,驾车距离邻接矩阵d作为空间知识提取模块的输入,基于渐进式的时空融合模块通过对多视图时间序列编码模块和空间知识提取模块的结果进行时空特征融合并产生输出
[0077]
在本实施例中,如图2所示,所述多视图时间序列编码模块包括:一个初始化操作和两个双视图时间序列编码组件,其中,所述初始化操作将给每一个输入的周期模式初始化一个低维向量tf,并将其嵌入到对应周期模式中,该向量的作用是为了将所在周期模式的时间特征信息从高维压缩到低维,并参与后面的融合计算,以降低融合的计算开销;所述空间知识提取模块包括:一个大规模图嵌入编码组件;所述大规模图嵌入编码组件将驾车距离邻接矩阵d作为输入;所述基于渐进式的时空融合模块包括:l个串联的渐进交叉注意力组件和一层前馈神经网络层;l的取值与数据集有关;
[0078]
在本实施例中,如图3所示,所述双视图时间序列编码组件有两个输入分支和一个输出分支,每个输入分支包括:一个自注意力组件、一个双分支交叉注意力组件和一层前馈神经网络层,输出分支将两个输入分支经过前馈神经网络层的最后结果相加作为输出结果;
[0079]
在本实施例中,如图4所示,所述渐进交叉注意力组件包括:一个全连接层、两个渐进交叉注意力层和两个前馈神经网络层;
[0080]
在本实施例中,模型的计算步骤主要包含以下内容:
[0081]
s211,在多视图时间序列编码模块中,对于输入数据s
month
、s
week
和s
current
,先将月周期模式和周周期模式输入第一个双视图时间序列编码组件进行时间特征的融合,得到融合了月周期和周周期时间特征的中间变量s
temp
:
[0082]stemp
=ffn(dbca(sa(s
month
),sa(s
week
)))
[0083]
+ffn(dbca(sa(s
week
),sa(s
month
)))
[0084]
再将中间变量s
temp
与s
current
输入第二个双视图时间序列编码组件进行时间特征的融合,最后构建出交通流量数据的时间特征te:
[0085]
te=ffn(dbca(sa(s
temp
),sa(s
current
)))
[0086]
+ffn(dbca(sa(s
current
),sa(s
temp
)))
[0087]
其中,sa(
·
)表示自注意力组件的计算操作,dbca(a,b)表示双分支交叉注意力组件的计算操作,a和b为其输入且位置调换对结果有影响,ffn(
·
)表示前馈神经网络层的计算操作;
[0088]
在本实施例中,选择先将月周期模式和周周期模式进行融合是因为相对于近期模式,月周期模式和周周期模式对未来时间步的交通流量影响程度较小(影响程度:近期>周周期模式>月周期模式),如果先融合近期模式可能会损失一部分重要的时间依赖信息,导致最后时空融合不充分,且实验结果表明,该融合策略所产生的最后效果性能最佳;
[0089]
在自注意力组件中,输入特征z会先被输入层正则化网络层处理,得到自注意力层的输入z
(1)
=layernormalization(z),自注意力层采用多头注意力机制将z
(1)
映射成三个矩阵和并以h为头数在wq、wk和wv矩阵的最后一维进行划分,这样做可以提高并行计算的效率,同时可以更好地对特征进行融合,通过每行的行向量与每列的列向量进行向量点积来进行相似度计算,即再对其结果进行softmax计算来得到输入特征z
(1)
的第i个头的注意力系数矩阵a(i),再通过得到第i个头的计算结果head(i),然后将h个头的结果在最后一个维度上进行连接操作得到自注意力层的结果z
(2)
:
[0090]z(2)
=concat(head
(1)
,head
(2)
,...,head
(h)
)
[0091]
之后将z
(2)
进行残差连接操作,得到z
(3)
=z
(2)
+z,最后将z
(3)
输入前馈神经网络层进行计算,与自注意力层类似,前馈神经网络层之前有一层正则化网络层,之后有一层残差连接层,同理可得前馈神经网络层的输出z
(4)
:
[0092]z(4)
=sa(z)=z
(3)
+ffn(layernormalization(z
(3)
))
[0093]
其中,不失一般化,z为自注意力组件的输入,可以为s
month
、s
week
、s
current
或s
temp
,表示矩阵叉乘;
[0094]
在双分支交叉注意力组件中,以初始化操作中嵌入的低维向量tf的计算为主,该向量的设计是为了存储所在模式的时间特征并参与和其他周期模式的融合计算,由于将其用低维向量表示,可以有效降低特征融合的时间开销,在自注意力组件计算后,tf向量已经学习到了所在周期模式的时间特征;
[0095]
在对双分支注意力组件中输入a和b周期模式后,先初始化一个低维向量s
pos
,再将其嵌入到不包含tfb的b周期模式sb上用来捕获b周期模式传感器之间的局部位置信息,通过一个偏置算法,对带有低维向量s
pos
的b周期模式进行自注意力操作,得到包含局部位置信息的b周期模式的中间变量
[0096][0097]
其中||代表矩阵的拼接操作,采用偏置算法的目的是因为这样的计算,可能可以提取传感器之间潜在的局部位置信息,且不会产生差于不作任何处理方法的性能,一个极端的情况是sa([s
pos
||sb])的结果为0;
[0098]
再将a周期模式的低维向量tfa和进行计算,先将tfa映射成wq矩阵,映射成wk和wv矩阵,与自注意力组件中的自注意力层的计算原理类似,先计算此时wq代表的是a周期模式的时间特征,wk代表的是b周期模式的时间特征,通过矩阵叉乘计算后进行softmax函数计算得到二者的交叉注意力系数矩阵a
ab
,再将a
ab
与wv进行矩阵叉乘计算,得到融合后的tf
ab
向量,再做一次残差连接计算,将tf
ab
与tfa相加,然后将其结果嵌入到a周期模式中,作为新的tfa;其中,不失一般化,a和b代表输入的周期模式,可以为s
month
、s
week
、s
current
或s
temp
,且a和b的地位不等价。
[0099]
s212,在空间知识提取模块中,对于输入数据驾车距离邻接矩阵d,大规模图嵌入编码组件利用二阶相似性的计算方法来捕获交通流量数据的空间特征,其中,二阶相似性的计算方法首先根据传感器节点的个数将每个节点映射成两个低维向量表示和并以
[0100][0101]
为优化函数对其进行优化,最终提取到交通流量数据的空间特征ge;
[0102]
其中,
[0103][0104]
表示i节点本身的表示向量,表示i节点作为其他节点邻居时的表示向量,w
ij
表示从节点i到节点j的权值,e表示所有节点的集合;
[0105]
s22,在基于渐进式的时空融合模块中,对于多视图时间序列编码模块的输出te和空间知识提取模块的输出ge,通过l个渐进交叉注意力组件的渐进式时空融合,并通过一层前馈神经网络的计算,得到最终的预测目标
[0106][0107]
其中,tei,i=1,2,3,...表示第i个渐进交叉注意力组件的输出结果,特别的,当i=0时,te=te0;
[0108]
在第i个渐进交叉注意力组件中,将时间特征te
i-1
和空间特征ge作为输入,先将时间特征te
i-1
输入到全连接层中,将其维度与空间特征ge对齐,再将对齐后的时间特征te
i-1
与空间特征ge输入渐进交叉注意力层作时空融合,得到融合了时空特征的中间变量tgi:
[0109]
tgi=ffn(pca(fc(te
i-1
),ge))
[0110]
考虑到渐进式融合可能会存在信息损失,而每次空间特征的输入都是ge,不存在空间特征的损失,所以将输入的时间特征te
i-1
与融合了时空特征的中间变量tgi作为第二个渐进交叉注意力层的输入进行进一步融合,以弥补渐进式融合过程中可能存在的时间特征损失的问题,每个渐进交叉注意力层后都有一层前馈神经网络层,最后得到第i个渐进交叉注意力组件的计算结果:
[0111]
tei=ffn(pca(tgi,te
i-1
)),i=1,2,3,......
[0112]
其中,ffn(
·
)表示前馈神经网络层的计算操作,fc(
·
)表示全连接层的计算操作,pca(
·
)表示渐进交叉注意力层的计算操作;
[0113]
在渐进交叉注意力层中,对于输入变量a和b,将a映射成wq矩阵,b映射成wk和wv矩阵,进行与自注意力层类似的计算,即:
[0114][0115]
然后为了更多的保留a输入的特征信息,再进行一次残差连接操作作为最后的输出:
[0116]
pca(a,b)=o
ab
+a
[0117]
其中,不失一般性,a和b表示输入的变量,可以是te
i-1
、ge或tgi等;
[0118]
在得到充分融合的时空特征te
l
后,将其作为基于渐进式的时空融合模块的最后一层前馈神经网络层的输入,以产生最后的预测结果,所述基于渐进式的大规模短时交通流量预测模型的预测结果为:
[0119][0120]
本实施例中,将月周期历史交通流量数据、周周期历史交通流量数据、近期历史交通流量数据和驾车距离邻接矩阵作为预测模型的输入,训练所属的基于渐进式的大规模短时交通流量预测模型,其中,输入的时间序列的长度p=6,输出的预测窗口长度q=1,时间步的跨度δt=15,30,45,60,即模型可以预测未来1个小时以内各个传感器节点通过的交通流量信息,批数量(batch size)设置为16,采用adam(adaptive moment estimation)优化算法,初始学习率设定为0.002,衰减率为0.5每20个epoch,模型训练100个epoch。
[0121]
本实施例中,采用平均绝对误差mae(mean absolute error)作为损失函数loss,使用平均绝对误差mae、均方根误差rmse(root mean square error)和对称平均绝对百分比误差smape(symmetric mean absolute percentage error)作为评估标准来对模型的性能进行评估,三个误差标准的数值越低越接近0越好,0为完美模型。
[0122][0123][0124][0125]
s3,采集纳入训练的传感器节点当前时间步和历史时间步内的交通流量数据,并按照s1所述预处理步骤将其整理成三种周期模式,并将处理好的三种周期模式时序数据输入训练好的交通流量预测模型中,预测未来15、30、45和60分钟对应传感器节点的交通流量信息。
[0126]
综上,本发明提供的基于渐进式的大规模短时交通流量预测的方法至少可以带来以下有益效果:
[0127]
1)针对现有基于图卷积神经网络的方法受限于人工设置阈值,从而忽略了远距离
传感器之间的空间相似性,进而导致多时间步下大规模交通流量预测的时空融合不充分的问题,本发明利用大规模图嵌入技术对大规模交通路网进行建模,可以有效地考虑到远距离传感器之间的空间依赖,此外,本发明设计了一个新型的基于渐进式的时空融合模块,该模块基于渐进式思想来逐渐对交通数据的时空特征进行融合,且嵌入了图像识别领域中的残差连接技术,以在融合过程中保留更多的时空特征信息,降低融合的特征损失。
[0128]
2)考虑到交通数据的周期性对预测目标的影响,本发明提出了一种新型的多视图时间序列编码模块,该模块根据周期性对预测目标影响的程度(近期>周周期>月周期)以及实验结果为依据,先将月周期和周周期的历史流量数据输入到双视图时间序列编码组件中进行分别建模并融合,再将其结果与近期历史流量数据在双视图时间序列编码组件中进行分别建模并融合,来充分捕获大规模交通流量数据的时间依赖。此外,通过在缺失数据场景下进行实验发现,该模块可以有效降低缺失数据给大规模交通流量预测带来的影响。
[0129]
3)针对现有基于图卷积神经网络的方法在大规模交通预测任务中的时间开销较大的问题,本发明在多视图时间序列编码模块中,设计了一个低维向量tf,通过tf来进行周期模式之间的时间相关性的融合可以大幅度降低计算的时间开销,此外,本发明采用了大规模图嵌入编码技术,其中嵌入了alias采样和负采样技术,可以有效地降低对空间依赖建模的时间开销。
[0130]
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
[0131]
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
[0132]
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
技术特征:
1.一种基于渐进式的大规模短时交通流量预测方法,其特征在于,所述基于渐进式的大规模短时交通流量预测方法包括:s1、获取传感器采集的原始数据集,并对原始数据集进行预处理,得到多种不同周期模式的历史交通数据和传感器之间的真实道路驾车距离邻接矩阵;s2、构建基于渐进式的大规模短时交通流量模型,将处理好的多种周期时间序列数据和驾车距离邻接矩阵作为模型的输入,训练所述大规模短时交通流量模型,得到具有预测未来时间段内交通流量能力的大规模短时交通流量模型;s3、通过s2中得到的模型对其输入当下的流量数据来预测未来的流量数据。2.根据权利要求1所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,s1中所述多种周期模式包括分别以月为周期、以周为周期和近期,所述历史交通数据包括多条记录,每条记录包括:一个时间段内的交通流量、该时间段的日期和所处时间的起始和结束。3.根据权利要求2所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,针对三种周期的时间序列数据,先利用自注意力思想对其进行分别建模,以捕获其自身的时间依赖信息;再基于两两融合、串行的方式,将建模后的月周期模式和周周期模式先进行时间特征融合,得到的时间特征再与近期模式进行时间特征融合,来提取交通流量数据最终的时间特征;针对驾车距离邻接矩阵,利用大规模图嵌入技术中的二阶相似性计算方法对其进行编码,计算出交通流量数据最终的空间特征;针对构建好的交通流量数据的时间特征和空间特征,利用基于渐进式思想的时空融合模块对其进行时空融合建模,并最后产生预测结果。4.根据权利要求1所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,s1中,在纳入训练的传感器中采集当前时间段内的交通数据,将采集好的交通流量数据输入已训练好模型中,进行大规模短时交通流量预测,来预测未来一段时间的交通流量信息;其中,原始数据集包含传感器所在街道、经纬度和若干条记录,记录涵盖该传感器一年内所记录的数据,每条记录间隔15分钟;每条流量记录包括记录的日期、时间、当天的类型、时间段内通过的车辆数、时间段内通过的车辆的平均速度,此外,原始数据集中含有上千个传感器记录的数据,属于大规模交通预测;对原始数据集进行预处理操作,所述预处理操作内容包括:从原始数据集中按照以月为周期、以周为周期和近期历史流量数据为当前周期进行预处理,整理出月模式、周模式和当前模式三个交通流量时间序列数据s
month
、s
week
和s
current
,并按照7∶1∶2的比例划分为训练集、验证集和测试集;从原始数据集中提取每个传感器的经纬度信息,通过将其映射到地图的公路上来计算其两两之间的驾车距离,构建传感器之间的驾车距离邻接矩阵d,所述驾车距离邻接矩阵d为非对称矩阵。5.根据权利要求4所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,对原始数据集进行预处理操作包括:从原始数据集中提取所有传感器节点的空间位置坐标,并将空间路网拓扑信息定义为图g=(v,e,w);其中,v是所有传感器节点的集合,|v|=n表示传感器节点的总数为n,e是所有传感器节点有向边的集合,w是有向边对应的权重的集合;
通过将传感器节点映射到地图上,来计算得到图g的驾车距离邻接矩阵d,并将d作为图g的有向边权值,即d=w;从原始数据集中提取所有传感器的交通流量数据,其中,t时间步内传感器站点i观测到的交通流量数据记为则t时间步内,所有传感器站点观测到的交通流量数据记为t时间步代表一个[,t+δt]的时间间隔,并进一步构建t时间步内的三个周期模式时间序列:的三个周期模式时间序列:的三个周期模式时间序列:其中,w和m分别表示一周的时间步长和一个月的时间步长;最后将m个时间步的三个周期模式时间序列拼接起来,得到式时间序列拼接起来,得到和其中,表示实数集,p表示时间序列的长度。6.根据权利要求1所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,在s2中确定交通流量预测模型的输入和输出变量,其中,输入变量包括:以月为周期、以周为周期和近期历史流量数据,以及驾车距离邻接矩阵d;输出变量包括:对应传感器未来时间段内的交通流量;基于渐进式的大规模短时交通流量模型包括:多视图时间序列编码模块、空间知识提取模块和基于渐进式的时空融合模块;将三个周期模式时间序列作为多视图时间序列编码模块的输入,驾车距离邻接矩阵d作为空间知识提取模块的输入,基于渐进式的时空融合模块通过对多视图时间序列编码模块和空间知识提取模块的结果进行时空特征融合并产生输出所述多视图时间序列编码模块包括:一个初始化操作和两个双视图时间序列编码组件,所述初始化操作将给每一个输入的周期模式初始化一个低维向量tf,并将其嵌入到对应周期模式中;所述双视图时间序列编码组件有两个输入分支和一个输出分支,每个输入分支包括:一个自注意力组件、一个双分支交叉注意力组件和一层前馈神经网络层,输出分支将两个输入分支经过前馈神经网络层的最后结果相加作为输出结果;在多视图时间序列编码模块中,对于输入数据s
month
、s
week
和s
current
,先将月周期模式和周周期模式输入第一个双视图时间序列编码组件进行时间特征的融合,得到融合了月周期和周周期时间特征的中间变量s
temp
:s
temp
=ffn(dbca(sa(s
month
),sa(s
week
)))+ffn(dbca(sa(s
week
),sa(s
month
))),再将中间变量s
temp
与s
current
输入第二个双视图时间序列编码组件进行时间特征的融合,最后构建出交通流量数据的时间特征te:te=ffn(dbca(sa(s
temp
),sa(s
current
)))+ffn(dbca(sa(s
current
),sa(s
temp
)));其中,sa(-)表示自注意力组件的计算操作,dbca(a,b)表示双分支交叉注意力组件的计算操作,a和b为其输入且位置调换对结果有影响,ffn(
·
)表示前馈神经网络层的计算操作;
所述空间知识提取模块包括:一个大规模图嵌入编码组件;所述大规模图嵌入编码组件将驾车距离邻接矩阵d作为输入,利用二阶相似性的计算方法来捕获交通流量数据的空间特征,其中,二阶相似性的计算方法首先根据传感器节点的个数将每个节点映射成两个低维向量表示和并以o=-∑
(i,j)∈e
w
ij
log p(v
j
|v
i
)为优化函数对其进行优化,最终提取到交通流量数据的空间特征ge;其中,表示i节点本身的表示向量,表示i节点作为其他节点邻居时的表示向量,w
ij
表示从节点i到节点j的权值,e表示所有节点的集合,所述基于渐进式的时空融合模块包括:l个串联的渐进交叉注意力组件和一层前馈神经网络层;l的取值与数据集有关,所述渐进交叉注意力组件包括:一个全连接层、两个渐进交叉注意力层和两个前馈神经网络层;其中,所述基于渐进式的时空融合模块将时间特征te和空间特征ge作为输入,经过l个渐进交叉注意力组件的时空融合处理后,得到充分融合的时空特征te
l
,不失一般化,这里用te
i
代表第i个渐进交叉注意力组件的输出,特别的,当i=0时,te=te0。在得到充分融合的时空特征te
l
后,将其作为基于渐进式的时空融合模块的最后一层前馈神经网络层的输入,以产生最后的预测结果7.根据权利要求6所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,在自注意力组件中,输入特征z会先被输入层正则化网络层处理,得到自注意力层的输入z
(1)
,自注意力层会将z
(1)
映射成三个矩阵w
q
、w
k
和w
v
,通过w
q
每行的行向量与w
k
每列的列向量进行向量点积来进行相似度计算,即再对其结果进行softmax计算来得到输入特征z
(1)
的注意力系数矩阵a,再通过得到自注意力层的结果z
(2)
,之后将z
(2)
进行残差连接操作,得到z
(3)
=z
(2)
+z,最后将z
(3)
输入前馈神经网络层进行计算,与自注意力层类似,前馈神经网络层之前有一层正则化网络层,之后有一层残差连接层,同理可得前馈神经网络层的输出z
(4)
,即z
(4)
=sa(z);其中,不失一般化,z为自注意力组件的输入,可以为s
month
、s
week
、s
current
或s
temp
,表示矩阵叉乘。8.根据权利要求6所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,在双分支交叉注意力组件中,以初始化操作中嵌入的低维向量tf的计算为主,该向量的设计是为了存储所在模式的时间特征并参与和其他周期模式的融合计算,由于将其用低维向量表示,可有效降低特征融合的时间开销,在自注意力组件计算后,tf向量已经学习到了所在周期模式的时间特征;在对双分支注意力组件中输入a和b周期模式后,先初始化一个低维向量s
pos
,再将其嵌入到不包含tf
b
的b周期模式s
b
上用来捕获b周期模式传感器之间的局部位置信息,通过一个偏置算法,对带有低维向量s
pos
的b周期模式进行自注意力操作,得到包含局部位置信息的b周期模式的中间变量其中||代表矩阵的拼接操作,再将a周期模式的低维向量tf
a
和进行计算,先将tf
a
映射成w
q
矩阵,映射成w
k
和w
v
矩阵,与自注意力组件中的自注意力层的计算原理类似,先计算此时w
q
代表
的是a周期模式的时间特征,w
k
代表的是b周期模式的时间特征,通过矩阵叉乘计算后进行softmax函数计算得到二者的交叉注意力系数矩阵a
ab
,再将a
ab
与w
v
进行矩阵叉乘计算,得到融合后的tf
ab
向量,再做一次残差连接计算,将tf
ab
与tf
a
相加,然后将其结果嵌入到a周期模式中,作为新的tf
a
;其中,不失一般化,a和b代表输入的周期模式,可以为s
month
、s
week
、s
current
或s
temp
,且a和b的地位不等价。9.根据权利要求6所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,在第i个渐进交叉注意力组件中,对于输入的时间特征te
i-1
,先将其输入到全连接层中,将其维度与空间特征ge对齐,再将对齐后的时间特征te
i-1
与空间特征ge输入渐进交叉注意力层作时空融合,得到融合了时空特征的中间变量tg
i
=ffn(pca(fc(te
i-1
),ge)),考虑到渐进式融合可能会存在信息损失,且每一个渐进交叉注意力组件都以原始的ge作为空间特征输入,不需要弥补空间特征的融合损失,而时间特征输入来自于上一个渐进交叉注意力组件的输出,可能会存在时间特征的损失,因此为了保存更多的时间特征信息,将输入的时间特征te
i-1
与融合了时空特征的中间变量tg
i
作为第二个渐进交叉注意力层的输入进行进一步融合,来弥补时间特征的融合损失,每个渐进交叉注意力层后都有一层前馈神经网络层,最后得到第i个渐进交叉注意力组件的计算结果:te
i
=ffn(pca(tg
i
,te
i-1
)),i=1,2,3,......;其中,ffn(
·
)表示前馈神经网络层的计算操作,fc(
·
)表示全连接层的计算操作,pca(
·
)表示渐进交叉注意力层的计算操作。10.根据权利要求9所述的基于渐进式的大规模短时交通流量预测方法,其特征在于,在渐进交叉注意力层中,对于输入变量a和b,将a映射成w
q
矩阵,b映射成w
k
和w
v
矩阵,进行与自注意力层类似的计算,即然后进行一次残差连接作为最后的输出,也即:pca(a,b)=o
ab
+a;其中,不失一般性,a和b表示输入的变量,可以是te
i-1
、ge或tg
i
等;在得到充分融合的时空特征te
l
后,将其作为基于渐进式的时空融合模块的最后一层前馈神经网络层的输入,以产生最后的预测结果,所述基于渐进式的大规模短时交通流量预测模型的预测结果为:
技术总结
本发明公开了一种基于渐进式的大规模短时交通流量预测方法,包括:S1、获取传感器采集的原始数据集,并对原始数据集进行预处理;S2、构建基于渐进式的大规模短时交通流量模型,将处理好的多种周期时间序列数据和驾车距离邻接矩阵作为模型的输入,训练所述大规模短时交通流量模型;S3、通过得到的模型对其输入当下的流量数据来预测未来的流量数据。该方法基于渐进式的思想,将时间特征和空间特征通过逐步融合的方式来更全面、更充分地进行时空融合操作,有效地解决现有方法在大规模交通流量预测中存在的时空融合不充分的问题,且大幅度降低了计算和空间依赖建模的时间开销;同时,预测效果更精准,能够为城市交通管理提供较为准确的参考依据。的参考依据。的参考依据。
技术研发人员:汪晨 左开中 谌章义 胡鹏
受保护的技术使用者:安徽师范大学
技术研发日:2023.03.28
技术公布日:2023/7/6
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
