一种基于多特征融合的时空注意图卷积网络的交通流预测方法
未命名
07-18
阅读:101
评论:0
1.本发明属于交通流预测领域,具体涉及一种基于多特征融合的时空注意图卷积网络的交通流预测方法。
背景技术:
2.在智能化城市建设当中,由于交通拥堵越来越严重,交通问题越来越被人们所重视。科技迅速的发展的同时,交通系统也日益繁杂,智能交通系统(intelligent transportation system,its)应运而生。及时准确的交通预测可以帮助人们更好的做好出行的决策,从而缓解城市的交通拥堵,减少了交通出行对大气的污染,最终既保证了交通的高效出行,又保证了汽车尾气的最低排放量。
3.现有的关于交通流预测的研究主要包括三类方法,分别是基于传统统计学模型、传统机器学习模型和智能预测模型。传统统计学模型是以概率论为基础,基于数理统计方法而建立起的一套模型。常见的模型包含历史平均模型(historical average,ha)、卡尔曼滤波模型(kalman filter,kf)和时间序列预测模型。在传统统计学模型中,最为经典的就是差分整合移动平均自回归模型(autoregressive integrated moving average model,arima)及其变体。arima通过分析自相关图和偏相关图得到被观测的系统时间序列数据的预测值。然而,该模型是在平稳的时间序列的基础上建立起来的,对现今大规模动态的路网上并不适用。除此之外,该模型忽略了路网的时空特征,不适用于大型路网的交通流预测。
4.第二种方法是数据驱动的,无需数据满足平稳性的假设,并且此类方法能够对稍微复杂的数据进行建模并做出更精准的预测。常见的模型主要是支持向量机(support vector machine,svm)、k近邻(k-nearest neighbor,knn)和人工神经网络(artificial neural network,ann)。支持向量机的模型不仅可以提高交通流预测的精度,还大大减少了计算量。利用k近邻非参数回归模型预测短时交通量,不仅提高了预测算法的精度,还提高了预测算法的执行效率。然而,大多数传统的机器学习的模型都依赖于特征工程,无法将时间依赖性和空间依赖性同时建模,因此有一定的局限性。
5.第三种方法通过融合循环神经网络(recurrent neural network,rnn)或者融合图卷积神经网络(graph convolution network,gcn)不仅可以自动学习交通流的非线性特征并自动捕捉数据模式,还可以充分的利用时空特征。但是,现实生活中依然有大量的非欧几里得空间的数据需要处理,通过传统的机器学习方法和rnn等将其拓展为图卷积和rnn及其变体的时空预测框架,用此来解决非欧几里得空间的交通流预测问题。以上模型都只关注了交通数据这一部分因素,但交通流的变化除了受到时空的影响外还受一些外在因素的影响。
技术实现要素:
6.本发明旨在提供一种基于多特征融合的时空注意图卷积网络的交通流预测方法,
以解决上述技术存在的问题。
7.为实现上述目的,本发明提供了一种基于多特征融合的时空注意图卷积网络的交通流预测方法,包括以下步骤:
8.步骤1:构造图网络结构,通过计算交通节点之间的道路关系建立关系矩阵;
9.步骤2:获取各个交通节点的历史交通流量数据和特征数据,通过特征数据融合交通流量数据的方式获取多特征融合的时空交通数据;
10.步骤3:构建时空注意图卷积网络模型,将步骤2所述的交通数据作为该模型的输入,提取交通流量数据的空间特征和时间特征;
11.步骤4:定义模型损失函数,根据损失函数反向传播优化模型参数,最后实现道路交通流的预测。
12.进一步的,步骤1中图网络结构由一个邻接矩阵a表示,a
ij
表示第i个节点和第j个节点的连通性,若存在空间连接关系,则a
ij
为1,否则为0。
13.进一步的,步骤2中具体包括:
14.获取道路网络上的交通信息作为网络中节点的属性特征,用矩阵x表示,交通信息每固定时间取样一次,总共取得t个样本,对于一个节点得到的数据表示为x=(x1,x2,
…
,x
t-1
,x
t
),则n个节点的道路网络用矩阵表示为
[0015][0016]
式中x
nt
表示第n个节点t时刻的交通流数据信息,(x
1t
,x
2t
,
…
,x
nt
)表示第t时刻的所有节点的交通流数据信息;
[0017]
获取影响该道路网络的辅助属性,用矩阵s表示,辅助属性每固定时间取样一次,总共取得t个样本,对于单个辅助属性得到的数据表示为s=(s1,s2,
…
,s
t-1
,s
t
),则m个辅助属性用矩阵表示为
[0018][0019]
式中s
mt
表示第m个辅助属性t时刻的数据信息。(s
1t
,s
2t
,
…
,s
mt
)表示第t时刻的所有辅助的外部属性特征数据信息;
[0020]
获取多特征融合的时空数据,用矩阵f表示,将道路网络的交通特征矩阵和影响该道路网络的辅助属性在同一时间内进行融合,则t时刻内最终的多特征数据矩阵表示为
[0021][0022]
式中x
nt
表示第n个节点t时刻的交通流数据信息,s
mt
表示第m个辅助属性t时刻的数据信息,(x
1t
,x
2t
,
…
,x
nt
,s
1t
,s
2t
,
…
,s
mt
)表示第t时刻n个节点和m个外部辅助属性所融合成的多特征数据信息。
[0023]
进一步的,步骤3中具体包括:
[0024]
构建空间图卷积层,本模型采用的图卷积计算方法为
[0025][0026][0027][0028]
式中f
l+1
表示图卷积网络的第1层的输出,a是邻接矩阵,i是单位矩阵,σ(
·
)表示非线性激活函数,是带自环邻接矩阵,是的度矩阵,是对角矩阵,w
l
为第1层的可训练权重参数矩阵,f
l
表示第1层的输入数据;
[0029]
构建时间特征提取层,本层采用门控循环单元和transformer相结合的方式,门控循环单元用以捕捉每个空间节点在时间维度上的短时依赖,通过该单元忘记h
t-1
中的某些信息,并加入当前节点输入的某些信息。gru的建模过程如下:
[0030][0031][0032]rt
=σ(wr·
[h
t-1
,x
t
]+br)
[0033]zt
=σ(wz·
[h
t-1
,x
t
]+bz)
[0034]
式中(1-z
t
)*h
t-1
表示t-1时刻数据输入的选择性遗忘,表示对当前时刻数据的选择性记忆;
[0035]
式中h
t
表示t时刻的门控循环单元的数据输出,即传递到下一时刻的隐藏状态,z
t
表示更新门,表示t时刻的候选隐藏状态,h
t-1
表示上一时刻的隐藏状态,tan(
·
)表示激活函数,r
t
表示重置门,x
t
表示为t时刻的输入信息,σ(
·
)表示非线性激活函数,w,wr,wz,b,br和bz是可学习参数矩阵;
[0036]
transformer包含多头注意力层、前向反馈层、残差化和归一化层,将上层门控循环单元的值作为输入,经过位置编码后传入多头注意层后,多头注意力层的输入由序列中所有位置的查询矩阵维度为dk的键矩阵和维度为dv的值矩阵组成,注意力层的公式为
[0037][0038][0039][0040][0041]
式中attention(
·
)代表是实现注意力机制的函数,softmax(
·
)代表是归一化指数函数,k
t
代表是键矩阵的转置,dk代表是隐藏层的维度,表示经过位置编码后的输入,wq,wk,wv为三个可学习的参数矩阵,分别代表是查询矩阵、键矩阵和值矩阵。
[0042]
进一步的,步骤4中的具体包括:
[0043]
根据初始化的邻接矩阵a,以及模型参数矩阵w,进行交通数据预测过程,预测结果与真值之间存在误差,经变分推断方法,其变分损失的损失函数如下:
[0044]
[0045]
式中代表预测的交通信息,x
t+1
代表输入的交通信息,w
θ
表示本文公式中需要训练的参数;
[0046]
使用平均绝对误差(mean absolute error,mae),平均百分比误差(mean absolute percentage error,mape)和均方根误差(root mean square error,rmse)作为评估指标,公式如下:
[0047][0048][0049][0050]
式中xi表示真实的交通信息数据,表示模型预测的交通信息数据,n表示一共的训练样本数。
[0051]
与现有技术相比较,本发明具有如下有益效果:
[0052]
1.本发明提出了一种基于多特征数据融合的时空注意图卷积网络的交通流预测模型,通过将外部特征数据融合到交通数据中,弥补了原有单一数据的缺陷;
[0053]
2.传统的图卷积网络模型在捕获空间依赖性效果不佳,本发明通过将图卷积单元与注意力机制层相结合来捕获各节点在时间维度上的依赖性,在注意图卷积单元中,可以动态地进行时间上和空间上的特征提取。
附图说明
[0054]
图1为本发明基于多特征融合的时空注意图卷积网络交通流预测的流程图。
[0055]
图2为本发明模型结构示例图。
[0056]
图3为本发明多特征数据融合模块结构示例图。
[0057]
图4为本发明注意图卷积模块结构示例图。
具体实施方式
[0058]
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详清楚、完整的描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。
[0059]
如图1所示,本发明公开一种基于多特征融合的时空注意图卷积网络的交通流预测方法的处理流程图,包括以下步骤:
[0060]
步骤1:构造图网络结构g=(v,e,a)。通过计算传感器之间成对道路网络距离,利用阈值高斯核建立邻接矩阵a,公式表达如下:
[0061][0062]
式中v代表道路节点集合,e代表节点与节点之间的边集合,即vi与vj之间的实际距
离,k代表是控制邻接矩阵a的阈值,σ代表是距离的标准差。
[0063]
步骤2:构造多特征融合矩阵f。如图3所示,对收取到的历史交通流数据和外部特征数据进行数据采集,获取训练样本。获取到的交通流历史时刻数据为(x1,x2,
…
,x
t-1
,x
t
),外部特征数据为(s1,s2,
…
,s
t-1
,s
t
),其中t为取样窗口大小,即历史交通流数据的数量,该数据每隔10分钟进行一次数据采集,取t
′
+t个连续时刻的交通流数据作为一个训练样本,记t
′
个连续时刻的交通流数据为历史交通流数据,即t个连续时刻的交通流数据为真实交通流数据。将外部特征数据作为独立的交通流数据特征,在相同连续时刻内进行一个等值融合,最后融合后的数据为:
[0064][0065]
步骤3:构造注意力图卷积网络模型,如图2所示。将融合后的多特征数据作为输入进入带有空间注意力机制的图卷积网络模型中,如图4所示。首先使用空间注意力机制捕获当前时间下的全局图结点特征ma
t
,相关注意力机制公式如下:
[0066]
ma
t
=contact(h1,h2,
…
,hk)w
°
[0067][0068][0069]qt
=f
t
wq[0070]kt
=f
t
wk[0071]vt
=f
t
wv[0072]
式中,wq,wk,wv为三个可学习的参数矩阵,softmax(
·
)代表是归一化指数函数,attention(
·
)代表是实现注意力机制的函数,w
°
代表的是一个可学习的投影矩阵,代表是t时间第i个注意力的输出,contact(
·
)代表是拼接操作;
[0073]
接着,将上一时刻的各节点特征h
t-1
={h1,h2,
…
,hn}与当前时刻通过注意力机制得到的各节点特征利用门控机制进行融合,得到注意力机制的图滤波ag
t
,公式表示如下:
[0074]
ag
t
=z
t
*ma
t
+(1-z
t
)*h
′
t-1
[0075]zt
=σ(ma
twz1
+h
′
t-1wz2
)
[0076]h′
t-1
=h
t-1
wh+bh[0077]
式中,w
z1
,w
z2
,wh和bh是可学习参数,σ(
·
)代表是激活函数;
[0078]
接着,将注意力图滤波得到的输出进入到图卷积模块进行空间特征的提取,图卷积的公式如下:
[0079][0080]
式中f
l+1
表示输出,是带自环邻接矩阵,即邻接矩阵a和单位矩阵i的和,d是a的度矩阵,σ是非线性激活函数,w
l
为第1层的可训练权重参数矩阵,ag
l
为输入,ag
l+1
为输出;
[0081]
接着进行时间特征的提取,时间特征的提取是由门控循环单元和transformer来
构成;
[0082]
具体的,门控循环单元过程将当前时刻的多特征数据f
t
与多注意图卷积模块在上一时刻t-1的输出进行拼接,放入多注意图卷积模块,门控循环单元的公式如下:
[0083][0084][0085]rt
=σ(wr·
[h
t-1
,x
t
]+br)
[0086]zt
=σ(wz·
[h
t-1
,x
t
]+bz)
[0087]
式中z
t
和r
t
分别表示为更新门和重置门,w,wr,wz,b,br和bz是可学习参数矩阵;
[0088]
具体地,在经gru处理过后输出的结果首先进行常规处理操作,即位置编码,具体过程如下:
[0089]
x=xi+e
t
[0090][0091]
式中e
t
表示正余弦编码,i对应的是10维不同维度的数,d代表的是position编码的维度,model代表的是d的维度数;
[0092]
将经过位置编码后的数据送入多头注意力机制中从全局捕获其时间相关性,多头注意力机制公式如下:
[0093][0094][0095][0096][0097]
将多头注意力输出的结果经过全连接层后得到最终的交通流预测输出,公式如下:
[0098][0099]
式中,w0和b0是可学习参数。
[0100]
步骤4:设置损失函数,根据初始化的邻接矩阵a以及模型参数矩阵w,本示例采用的损失函数公式如下:
[0101][0102]
式中代表预测的交通信息,x
t+1
代表输入的交通信息,w
θ
表示本文公式中需要训练的参数;
[0103]
利用反向传播方法对模型参数不断优化,最后将测试集数据作为模型输入,得出的预测值与真实观察值作比较得出预测精度。
[0104]
模型性能的评估指标如下:
[0105]
平均绝对误差(mean absolute error,mae),结果为实际值与预测值之间绝对误差的平均值,公式如下:
[0106][0107]
平均百分比误差(mean absolute percentage error,mape),结果为实际值与预测值之间绝对百分比误差的平均值,公式如下:
[0108][0109]
均方根误差(root mean square error,rmse),:结果为实际值与预测值之间均方误差的算术平方根,公式如下:
[0110][0111]
模型得出三个评价指标后,与当前主流模型对比,仍处于领先地位。
[0112]
以上对本发明所公开的技术方案进行了详细介绍,应用了具体实施方式对本发明的原理进行了阐述,以上实施方式仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
技术特征:
1.一种基于多特征融合的时空注意图卷积网络的交通流预测方法,其特征在于,该方法包括以下步骤:步骤1:构造图网络结构,通过计算交通节点之间的道路关系建立关系矩阵;步骤2:获取各个交通节点的历史交通流量数据和特征数据,通过特征数据融合交通流量数据的方式获取多特征融合的时空交通数据;步骤3:构建时空注意图卷积网络模型,将步骤2所述的交通数据作为该模型的输入,提取交通流量数据的空间特征和时间特征;步骤4:定义模型损失函数,根据损失函数反向传播优化模型参数,最后实现道路交通流的预测。2.根据权利要求1所述的基于多特征融合的时空注意图卷积网络的交通流预测方法,其特征在于,步骤1中图网络结构由一个邻接矩阵a表示,a
ij
表示第i个节点和第j个节点的连通性,若存在空间连接关系,则a
ij
为1,否则为0。3.根据权利要求1所述的基于多特征融合的时空注意图卷积网络的交通流预测方法,其特征在于,步骤2中具体包括:获取道路网络上的交通信息作为网络中节点的属性特征,用矩阵x表示,交通信息每固定时间取样一次,总共取得t个样本,对于一个节点得到的数据表示为x=(x1,x2,
…
,x
t-1
,x
t
),则n个节点的道路网络用矩阵表示为式中x
nt
表示第n个节点t时刻的交通流数据信息,(x
1t
,x
2t
,
…
,x
nt
)表示第t时刻的所有节点的交通流数据信息;获取影响该道路网络的辅助属性,用矩阵s表示,辅助属性每固定时间取样一次,总共取得t个样本,对于单个辅助属性得到的数据表示为s=(s1,s2,
…
,s
t-1
,s
t
),则m个辅助属性用矩阵表示为式中s
mt
表示第m个辅助属性t时刻的数据信息;(s
1t
,s
2t
,
…
,s
mt
)表示第t时刻的所有辅助的外部属性特征数据信息;获取多特征融合的时空数据,用矩阵f表示,将道路网络的交通特征矩阵和影响该道路网络的辅助属性在同一时间内进行融合,则t时刻内最终的多特征数据矩阵表示为式中x
nt
表示第n个节点t时刻的交通流数据信息,s
mt
表示第m个辅助属性t时刻的数据信
息,(x
1t
,x
2t
,
…
,x
nt
,s
1t
,s
2t
,
…
,s
mt
)表示第t时刻n个节点和m个外部辅助属性所融合成的多特征数据信息。4.根据权利要求1所述的基于多特征融合的时空注意图卷积网络的交通流预测方法,其特征在于,步骤3中具体包括:构建空间图卷积层,本模型采用的图卷积计算方法为构建空间图卷积层,本模型采用的图卷积计算方法为构建空间图卷积层,本模型采用的图卷积计算方法为式中f
l+1
表示图卷积网络的第l层的输出,a是邻接矩阵,i是单位矩阵,σ(
·
)表示非线性激活函数,是带自环邻接矩阵,是的度矩阵,是对角矩阵,w
l
为第l层的可训练权重参数矩阵,f
l
表示第l层的输入数据;构建时间特征提取层,本层采用门控循环单元和transformer相结合的方式,门控循环单元用以捕捉每个空间节点在时间维度上的短时依赖,通过该单元忘记h
t-1
中的某些信息,并加入当前节点输入的某些信息;gru的建模过程如下:并加入当前节点输入的某些信息;gru的建模过程如下:r
t
=σ(w
r
·
[h
t-1
,x
t
]+b
r
)z
t
=σ(w
z
·
[h
t-1
,x
t
]+b
z
)式中(1-z
t
)*h
t-1
表示t-1时刻数据输入的选择性遗忘,表示对当前时刻数据的选择性记忆;式中h
t
表示t时刻的门控循环单元的数据输出,即传递到下一时刻的隐藏状态,z
t
表示更新门,表示t时刻的候选隐藏状态,h
t-1
表示上一时刻的隐藏状态,tan(
·
)表示激活函数,r
t
表示重置门,x
t
表示为t时刻的输入信息,σ(
·
)表示非线性激活函数,w,w
r
,w
z
,b,b
r
和b
z
是可学习参数矩阵;transformer包含多头注意力层、前向反馈层、残差化和归一化层,将上层门控循环单元的值作为输入,经过位置编码后传入多头注意层后,多头注意力层的输入由序列中所有位置的查询矩阵维度为d
k
的键矩阵和维度为d
v
的值矩阵组成,注意力层的公式为注意力层的公式为注意力层的公式为注意力层的公式为式中attention(
·
)代表是实现注意力机制的函数,softmax(
·
)代表是归一化指数函数,k
t
代表是键矩阵的转置,d
k
代表是隐藏层的维度,表示经过位置编码后的输入,w
q
,w
k
,wv为三个可学习的参数矩阵,分别代表是查询矩阵、键矩阵和值矩阵。
5.根据权利要求1所述的基于多特征融合的时空注意图卷积网络的交通流预测方法,其特征在于,步骤4中的具体包括:根据初始化的邻接矩阵a,以及模型参数矩阵w,进行交通数据预测过程,预测结果与真值之间存在误差,经变分推断方法,其变分损失的损失函数如下:式中代表预测的交通信息,x
t+1
代表输入的交通信息,w
θ
表示本文公式中需要训练的参数;使用平均绝对误差mae,平均百分比误差mape和均方根误差rmse作为评估指标,公式如下:下:下:式中x
i
表示真实的交通信息数据,表示模型预测的交通信息数据,n表示一共的训练样本数。
技术总结
本发明公开了一种用于交通流预测的多特征融合的时空注意图卷积神经网络,从数据处理、空间相关性、时间相关性三个角度出发设计。首先,对获取到的历史交通流数据与外部特征因素融合,获取多特征融合的时空交通数据作为训练样本;其次,利用注意图卷积网络捕获城市道路网络的拓扑结构,获得多特征融合的交通流空间特征;接着,将获得的具有空间特征的时间序列输入到由门控循环单元和注意力单元相结合的时间特征提取模型中捕捉时间特征;最后,将输出的预测值与实际值相对比,更改相关参数直至模型最优化。至模型最优化。至模型最优化。
技术研发人员:陈雅君 丁治明 郭黎敏
受保护的技术使用者:北京工业大学
技术研发日:2023.02.24
技术公布日:2023/5/26
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
