一种交通量预测模型的构建方法和系统
未命名
07-17
阅读:295
评论:0
1.本发明属于智能运输系统领域,尤其涉及一种交通量预测模型的构建方法和系统。
背景技术:
2.近年来,智能运输系统中的交通量预测任务因其在交通管理中的重要作用而备受关注。利用先进的深度学习技术,可以从复杂的道路网络中提取时空相关性,从而提高交通量的预测精度。然而,现有的预测方法在时空依赖学习和趋势模式学习等方面都面临着一些问题,使得它们在预测精度上无法更进一步。
3.在交通空间学习方面,由于传统卷积神经网络(convolution neural network,cnn)的平移不变性和图卷积网络(graph convolution network,gcn)的高速发展,后者逐渐成为了道路网络空间建模的主流方案。gcn虽然解决了cnn平移不变性的问题,但它只关注目标路段的地理邻接路段,忽略了可能存在的“邻近”路段,而这些“邻近”路段与目标路段具有较高的相关性,但是与目标路段存在地理不相干的关系,导致预测结果的不准确性。
技术实现要素:
4.本发明实施例的目的在于提供一种交通量预测模型的构建方法和系统,旨在解决背景技术中确定的现有技术存在的技术问题。
5.本发明实施例是这样实现的,一种交通量预测模型的构建方法,包括以下步骤:
6.将经过预处理的数据划分为测试集、验证集和测试集;
7.所述数据表示为n
×
t
×f×
s,其中n为路段节点个数,t为数据的时间步长,f为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据;
8.根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;
9.对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;
10.对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
11.本发明实施例的另一目的在于提供一种交通量预测模型的构建系统,所述系统包括:
12.数据处理模块,用于将经过预处理的数据划分为测试集、验证集和测试集;
13.其中,所述数据表示为n
×
t
×f×
s,其中n为路段节点个数,t为数据的时间步长,f
为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据;
14.邻接矩阵构建模块,用于根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;
15.时空模块,用于对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;
16.输出模块,用于对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
17.本发明实施例的有益效果是:在构造交通路段的空间关系时,综合地理关系以及交通量相关性,构建全新的邻接矩阵以描述道路网络的空间关系;采用拼接的聚合方式代替gcn通过累加各个阶次邻居的聚合方式以保留更多的道路交互信息;在构造交通路段的时间关系时,对历史数据进行正向分析,对历史的未来数据进行逆序分析,使模型能够更全面地感知时间信息;本发明模仿生物基因的方式,将时间戳作为趋势基因嵌入到模型中,以类似生物基因的形式记录一周内每天每个采样时刻的流量趋势变化情况,使所提出的框架更快地适应流量变化。
附图说明
18.图1为本发明实施例提供的一种交通量预测模型的构建方法的流程图;
19.图2为本发明实施例提供的构建邻接矩阵的流程图;
20.图3为本发明实施例提供的道路网络结构示意图;
21.图4为本发明实施例提供的对数据按序列进行空间依赖关系提取的流程图;
22.图5为本发明实施例提供的对数据按序列进行时间依赖关系提取的流程图;
23.图6为本发明实施例提供的交通量预测模型的构建方法的状态示意图;
24.图7为本发明实施例提供的一种交通量预测模型的构建系统的结构框图;
25.图8为本发明又一实施例提供的一种交通量预测模型的构建系统的结构框图;
26.图9为本发明实施例提供的邻接矩阵构建单元的结构框图;
27.图10为一个实施例中计算机设备的内部结构框图。
具体实施方式
28.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
29.可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本技术的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
30.如图1和6所示,在一个实施例中,提出了一种交通量预测模型的构建方法,具体可以包括以下步骤:
31.步骤s100,将经过预处理的数据划分为测试集、验证集和测试集。
32.所述数据表示为n
×
t
×f×
s,其中n为路段节点个数,t为数据的时间步长,f为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据。
33.本发明实施例中,f为特征个数,特征为路段的平均占有率、车速和车流量,即f=3,s=5。所述的数据以6:1:3的比例划分成训练集、验证集以及测试集,其中训练集用于调节模型的参数,验证集用于调节模型的超参数,测试集用于测试模型的性能。
34.本发明实施例在实际应用时,采用了由洛杉矶caltrans性能测量系统环路监测器收集的数据。该数据中包含的特征分别是路段的平均占有率、车流量以及平均车速。数据的初始采样频率为每天2880次,为了提高效率和实用性,本发明将其聚合为每天288次,即每5分钟获得一条记录。
35.作为优选的,为了提高模型的性能和加快收敛速度,本发明实施例采用了zero-mean的标准化方法,将数据分布转化为标准的正态分布,公式如下所示:
[0036][0037]
其中,n表示数据样本的个数,m表示每一条数据样本的属性个数,x
p,i
和y
p,i
分别表示第i个数据样本的第p个属性的原始值和标准化后的值,μ
p
和σ
p
分别表示属性p的平均值和标准差。
[0038]
步骤s200,根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性。
[0039]
本发明实施例中的邻接矩阵是一个方形矩阵,其中元素为0或1,其中1表示相应的两个路段节点相邻,0表示对应的两个节点节点不相邻,其在构建时考虑了位置和时间关系。
[0040]
步骤s300,对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系。
[0041]
本发明实施例中,由于序列的数量为5个,那么实际应用时,时间依赖关系和空间依赖关系的提取就需要同步执行五次,其中,时间依赖关系的对象是时间步,其目的是提取两个时刻之间的依赖关系,而空间依赖关系的对象是路段节点,提取空间依赖关系本质上就是获得节点之间的权重关系。
[0042]
步骤s400,对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
[0043]
本发明实施例中,在交通量预测模型构建完成后,还会根据验证集和测试集,利用反向传播算法对参数进行优化。
[0044]
在一个实施例中,如图2和3所示,步骤s200具体可以包括以下步骤:
[0045]
步骤s201,根据基于地理位置的邻接构造方法确定路段节点之间的邻接关系。
[0046]
本发明实施例中,基于地理位置的邻接构造方法属于现有技术,其是根据路段节点之间距离相近或者连通来进行邻接构造,本发明实施例在此不进行具体介绍。
[0047]
但是现有技术中一般都仅考虑到这一个因素。忽略了一些潜在的邻居。潜在邻居指的是某些路段的交通信息与目标路段的交通信息高度相关,但是这种高度相关性却无法通过地理位置表达。例如,图3中有一个道路网络,它具有三维形状,其中时间维度表示每个时间步长的道路网络状态,空间维度表示道路网络的细节。实心点是要预测的目标路段(即路段a)。以往的模式是搜索路段a的地理相邻道路(即路段b和路段c),并在学习空间信息时充分考虑它们的影响。路段e与路段a的相关性较高,但距离较远,并没有受到关注。因此,基于地理位置的邻接构造方法丢失了许多与目标路段高度相关的路段。
[0048]
步骤s202,采用皮尔逊相关系数对路段节点进行相关性分析,当所述相关性分析的结果大于设定的阈值时,判定路段节点为邻接关系,反之则不相邻。
[0049]
本发明实施例通过相关分析挖掘潜在邻居,并在学习交通空间特征的同时考虑地理邻居和潜在邻居。相关性分析采用皮尔逊相关系数,公式如下所示:
[0050][0051]
其中,x和y表示两个进行相关分析的数据组,μ
x
和μy分别表示数据组x和y的平均值,σ
x
和σy数据组x和y的标准差。e[
·
]表示期望;cov(
·
)表示协方差。如果两个路段节点的相关系数大于阈值,则在邻接矩阵中对应的元素为1,即为邻接关系,反之则为0。
[0052]
步骤s203,将基于地理位置的邻接构造方法与皮尔逊相关系数相关性分析的结果耦合,得到邻接矩阵。
[0053]
本发明实施例中,耦合方式可以理解为累加,即邻接矩阵中为1的项,即可是地理位置上的相关,也可以是根据皮尔逊相关系数计算得到的潜在相关。
[0054]
在一个实施例中,如图4所示,所述对所述测试集中的数据按序列进行空间依赖关系提取的步骤,具体包括:
[0055]
步骤s301,采用基于谱域的图卷积网络在傅里叶域中的对角化线性算子来定义图上的卷积运算,图上的卷积运算式为:
[0056][0057][0058]
其中,g
θ
为卷积核,θ为对应的权重,x为数据特征,u为归一化图拉普拉斯算子l的特征向量矩阵,u为u的转置矩阵,u x表示对特征x进行傅里叶变换,in为单位矩阵,d为l的度矩阵,a为邻接矩阵,λ为对角矩阵,用于存储l的特征值。
[0059]
本发明实施例中,在邻接矩阵构造完成后,借鉴了卷积定理和傅里叶变换,采用基于谱域的gcn(图卷积网络)在傅里叶域中的对角化线性算子来定义图上的卷积运算。
[0060]
步骤s303,采用切比雪夫多项式的截断展开式逼近卷积核至k阶计算l的特征分解。
[0061]
本发明实施例中,由于计算l的特征分解对于大型图而言成本较高,因此,本发明实施例采用切比雪夫多项式tk(x)的截断展开式逼近卷积核至k阶。
[0062][0063]
其中,θ
′k表示第k阶切比雪夫多项式的系数。由于切比雪夫多项式的定义域为-1到1之间,因此需要对λ进行缩放。表示重新缩放的特征值向量,缩放公式如下所示:
[0064][0065]
其中,λ
max
表示l最大的特征值。切比雪夫多项式的迭代公式如下所示:
[0066][0067]
其中,k表示迭代次数,x是自变量。回到定义的图上卷积公式可得:
[0068][0069]
其中,表示重新缩放的拉普拉斯算子,公式如下所示:
[0070][0071]
该式可以由如下式证明:
[0072]
(u∧u
t
)k=u∧ku
t
ꢀꢀ
(10)
[0073]
步骤s305,通过拼接聚合方式对图卷积网络中的各个阶次进行聚合,使得各个路段节点之间的特征信息进行交互。
[0074]
本发明实施例中,由于gcn对卷积核提取的每一阶邻域的空间信息进行累加,但是交通各路段的信息交互是一个扩散过程。常规方法采用端到端的累加方式,忽略了交通信息扩散的过程。因此,本发明将gcn中的各个阶次累加聚合方式改为拼接聚合方式,以保留更多的交通特征信息,公式如下所示:
[0075][0076]
经过空间依赖提取,图上各个节点的特征信息进行了交互,目标节点可以通过加权的方式获取到其邻居节点和高相关性节点的特征信息。
[0077]
在一个实施例中,如图5所示,所述对所述测试集中的数据按序列进行时间依赖关系提取的步骤,具体包括:
[0078]
步骤s302,对每个时间步的输入信息和隐藏状态通过空间相关性学习进行过滤。
[0079]
本发明实施例中,每个时间步的输入信息和隐藏状态(初始状态为0)通过图卷积核(即空间相关性学习)进行过滤。空间相关性学习实际上就是采用图卷积的卷积核进行过
滤以提取特征,rnn循环神经网络的作用是学习不同时刻数据的相关性,而在rnn循环神经网络处理之前,数据会先经过图卷积核处理(即相关性学习)。
[0080]
步骤s304,将得到的时间步特征进行记忆机制和门限机制处理,获取下一时间步的输出数据和隐藏状态。
[0081]
本发明实施例中,基于rnn循环神经网络对时间步特征进行学习,并且rnn循环神经网络中还嵌入有长短期记忆(long short-term memory,lstm)和门控循环单元(gated recurrent unit,gru),即在rnn循环神经网络中引入了记忆机制和门限机制来共享长期信息。
[0082]
步骤s306,按时间维度循环获得最后一个时刻的输出信息。
[0083]
步骤s308,将按序列分别进行时间依赖关系提取得到的输出信息拼接得到时间特征信息。
[0084]
本发明实施例中,拼接操作如下所示:
[0085]
h=c[h0,h1,h2,h3,h4]
ꢀꢀꢀ
(13)
[0086]
其中,h为最终拼接得到的时间特征信息,h0为最近的数据序列特征、h2和h1分别为一天前此时的历史序列特征和未来数据序列特征、h4和h3分别为一周前此刻的历史序列特征和未来序列特征,c即表示拼接操作。
[0087]
经过上述操作,经过时间依赖关系的提取,可获取不同时间步之间的权重关系,并结合历史时刻的特征信息以预测未来时刻的特征信息。
[0088]
在一个实施例中,还包括以下步骤:
[0089]
将时间戳编码为趋势基因,以描述设定周期内每个采样时刻的交通变化趋势,所述趋势基因与提取结果进行全连接层处理,得到预测结果。
[0090]
本发明实施例中,其模仿生物基因的方式,将时间戳作为趋势基因,以类似生物基因的形式记录一周内每天每个采样时刻的流量趋势变化情况,使所提出的框架更快地适应流量变化。
[0091]
本发明实施例在实际应用时,例如中午12点是下班高峰期,像商业区的流量可能陡增,此时可以将“12点”这个时间戳也当成输入的一部分,用来刻画这种现象。
[0092]
在一个实施例中,所述对所述测试集中的数据按序列进行时间依赖关系提取的步骤中,
[0093]
剔除所述数据的输出部分,对所述数据的输入部分进行处理,且对历史序列特征进行正向排列后分析处理,对对应历史序列特征的未来数据序列逆序排列后处理分析。
[0094]
本发明实施例中,未来的交通数据不能用作训练数据,因为其不能在测试阶段获得。在这种情况下,本发明实施例放弃了未来数据,转而寻找历史的未来数据(即一天前此刻的未来数据序列特征和一周前此刻未来数据序列特征)。本发明对前一天预测时刻的历史数据序列和未来数据序列,前一周预测时刻的历史数据序列和未来数据序列给予了足够的重视。考虑到序列的问题,本发明在对历史的未来信息进行分析的时候将该序列进行逆序操作,以符合数据序列的连续性。
[0095]
本发明实施例获取5个数据序列,将这五个序列分别输入至gru中进行时间特征提取,获得5个特征。gru的计算公式如下所示:
[0096][0097][0098][0099][0100]
其中,w和u表示gru的权重,σ和φ表示激活函数sigmoid和tanh,r和z分别表示重置门限和更新门限,和h
t-1
分别表示输入时刻数据和上一个时刻的隐藏层数据;表示中间变量。通过gru提取的5个特征分别为最近的数据序列特征h0、一天前此时的历史序列特征h2和未来数据序列特征h1、一周前此刻的历史序列特征h4和未来序列特征h3,5个特征经过拼接,获得最终的时间特征信息h。
[0101]
本发明实施例所述模型的参数设计如下所示:
[0102]
(1)模型的训练环境为英特尔至强银4114cpu(主频为2.20ghz)和英伟达geforce rtx 2080(显存为8gb)。
[0103]
(2)模型的隐藏层神经元个数为64,训练次数为200,批次大小为64,学习率为1e-3。
[0104]
(3)优化算法选择自适应矩估计(adaptive moment estimation,adam),l2惩罚被用作正则项,系数大小为1e-6。
[0105]
(4)相关性阈值设置为90%,切比雪夫多项式截断阶数为3,用于预测的历史数据步长为24,预测的数据步长从[3,6,9,12]中分别选择。
[0106]
如图6和7所示,在一个实施例中,提供了一种交通量预测模型的构建系统,所述系统包括数据处理模块100、邻接矩阵构建模块200、时空模块300和输出模块400。其中:
[0107]
数据处理模块100,用于将经过预处理的数据划分为测试集、验证集和测试集;
[0108]
其中,所述数据表示为n
×
t
×f×
s,其中n为路段节点个数,t为数据的时间步长,f为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据;
[0109]
邻接矩阵构建模块200,用于根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;
[0110]
时空模块300,用于对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;
[0111]
输出模块400,用于对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
[0112]
本发明实施例中,将包含五个序列的输入数据(数据特征分别为平均占有率、车流量以及平均车速)分别输入五个时空模块分别学习特征。每个时间步的输入信息和隐藏状
态(初始状态为0)通过图卷积核(即空间相关性学习)进行过滤。然后,提取的特征经更新门、重置门以及记忆单元处理,获取下一时间步的输出数据和隐藏状态。按时间维度循环获得最后一个时刻的输出。获取的五个输出信息通过完全连接层融合为最终的时空特征。
[0113]
如图8所示,在一个实施例中,所述系统还包括趋势基因模块500,所述趋势基因模块500用于将时间戳编码为趋势基因,以描述设定周期内每个采样时刻的交通变化趋势,所述趋势基因与提取结果进行全连接层处理,得到预测结果。
[0114]
如图9所示,在一个实施例中,所述邻接矩阵构建模块200包括第一邻接关系确定单元201、第二邻接关系确定单元202和耦合单元203。其中:
[0115]
第一邻接关系确定单元201,用于根据基于地理位置的邻接构造方法确定路段节点之间的邻接关系;
[0116]
第二邻接关系确定单元202,用于采用皮尔逊相关系数对路段节点进行相关性分析,当所述相关性分析的结果大于设定的阈值时,判定路段节点为邻接关系,反之则不相邻;
[0117]
耦合单元203,用于将基于地理位置的邻接构造方法与皮尔逊相关系数相关性分析的结果耦合,得到邻接矩阵。
[0118]
如图6所示,在一个实施例中,对所述数据的预处理方式为将数据分布转化为标准的正态分布。
[0119]
本发明实施例中,在数据预处理时,为了提高训练效果和加速收敛,本发明采用了zero-mean对数据进行了标准化。而在测试阶段,模型输出的是标准化后的预测数据,因此,需要通过还原标准化数据,得到真实的预测交通量,还原的公式如下所示:
[0120][0121]
其中,表示模型预测第i条数据的第p个属性,z
p,i
是还原后的第i条数据的第p个属性。
[0122]
图10示出了一个实施例中计算机设备的内部结构图。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现一种交通量预测模型的构建方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种交通量预测模型的构建方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0123]
本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0124]
在一个实施例中,本技术提供的一种交通量预测模型的构建系统可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该一种交通量预测模型的构建系统的各个程序模块,比如,图7所示的数据处理模块100、邻接矩阵构建模块200、时空模块300和输出模块400。各个程序模块构成的计
算机程序使得处理器执行本说明书中描述的本技术各个实施例的一种交通量预测模型的构建方法中的步骤。
[0125]
例如,图10所示的计算机设备可以通过如图7所示的一种交通量预测模型的构建系统中的数据处理模块100执行步骤s100。计算机设备可通过邻接矩阵构建模块200执行步骤s200。计算机设备可通过时空模块300执行步骤s300。
[0126]
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0127]
步骤s100,将经过预处理的数据划分为测试集、验证集和测试集。
[0128]
步骤s200,根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性。
[0129]
步骤s300,对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系。
[0130]
步骤s400,对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
[0131]
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
[0132]
步骤s100,将经过预处理的数据划分为测试集、验证集和测试集。
[0133]
步骤s200,根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性。
[0134]
步骤s300,对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系。
[0135]
步骤s400,对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。
[0136]
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0137]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器
(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0138]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0139]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0140]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种交通量预测模型的构建方法,其特征在于,所述方法包括:将经过预处理的数据划分为测试集、验证集和测试集;所述数据表示为n
×
t
×
f
×
s,其中n为路段节点个数,t为数据的时间步长,f为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据;根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。2.根据权利要求1所述的方法,其特征在于,所述根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性的步骤,具体包括:根据基于地理位置的邻接构造方法确定路段节点之间的邻接关系;采用皮尔逊相关系数对路段节点进行相关性分析,当所述相关性分析的结果大于设定的阈值时,判定路段节点为邻接关系,反之则不相邻;将基于地理位置的邻接构造方法与皮尔逊相关系数相关性分析的结果耦合,得到邻接矩阵。3.根据权利要求2所述的方法,其特征在于,所述对所述测试集中的数据按序列进行空间依赖关系提取的步骤,具体包括:采用基于谱域的图卷积网络在傅里叶域中的对角化线性算子来定义图上的卷积运算,图上的卷积运算式为:图上的卷积运算式为:其中,g
θ
为卷积核,θ为对应的权重,x为数据特征,u为归一化图拉普拉斯算子l的特征向量矩阵,u为u的转置矩阵,ux表示对特征x进行傅里叶变换,i
n
为单位矩阵,d为l的度矩阵,a为邻接矩阵,λ为对角矩阵,用于存储l的特征值;采用切比雪夫多项式的截断展开式逼近卷积核至k阶计算l的特征分解;通过拼接聚合方式对图卷积网络中的各个阶次进行聚合,使得各个路段节点之间的特征信息进行交互。4.根据权利要求1所述的方法,其特征在于,所述对所述测试集中的数据按序列进行时间依赖关系提取的步骤,具体包括:对每个时间步的输入信息和隐藏状态通过空间相关性学习进行过滤;将得到的时间步特征进行记忆机制和门限机制处理,获取下一时间步的输出数据和隐藏状态;
按时间维度循环获得最后一个时刻的输出信息;将按序列分别进行时间依赖关系提取得到的输出信息拼接得到时间特征信息。5.根据权利要求1或2或3或4所述的方法,其特征在于,还包括以下步骤:将时间戳编码为趋势基因,以描述设定周期内每个采样时刻的交通变化趋势,所述趋势基因与提取结果进行全连接层处理,得到预测结果。6.根据权利要求4所述的方法,其特征在于,所述对所述测试集中的数据按序列进行时间依赖关系提取的步骤中,剔除所述数据的输出部分,对所述数据的输入部分进行处理,且对历史序列特征进行正向排列后分析处理,对对应历史序列特征的未来数据序列逆序排列后处理分析。7.一种交通量预测模型的构建系统,其特征在于,所述系统包括:数据处理模块,用于将经过预处理的数据划分为测试集、验证集和测试集;其中,所述数据表示为n
×
t
×
f
×
s,其中n为路段节点个数,t为数据的时间步长,f为特征个数,所述特征为路段的平均占有率、车速和车流量,s为序列,所述序列包括最近的数据序列特征、一天前此刻的历史序列特征和未来数据序列特征、一周前此刻的历史序列特征和未来数据序列特征,每条所述数据均包括输入和输出部分,其中,输入表示历史的交通数据,输出数据为所要预测的路段未来的车流量数据;邻接矩阵构建模块,用于根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;时空模块,用于对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;输出模块,用于对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。8.根据权利要求7所述的交通量预测模型的构建系统,其特征在于,还包括:趋势基因模块,用于将时间戳编码为趋势基因,以描述设定周期内每个采样时刻的交通变化趋势,所述趋势基因与提取结果进行全连接层处理,得到预测结果。9.根据权利要求7所述的交通量预测模型的构建系统,其特征在于,所述邻接矩阵构建模块包括:第一邻接关系确定单元,用于根据基于地理位置的邻接构造方法确定路段节点之间的邻接关系;第二邻接关系确定单元,用于采用皮尔逊相关系数对路段节点进行相关性分析,当所述相关性分析的结果大于设定的阈值时,判定路段节点为邻接关系,反之则不相邻;耦合单元,用于将基于地理位置的邻接构造方法与皮尔逊相关系数相关性分析的结果耦合,得到邻接矩阵。10.根据权利要求7所述的交通量预测模型的构建系统,其特征在于,对所述数据的预处理方式为将数据分布转化为标准的正态分布。
技术总结
本发明适用于智能运输系统领域,提供了一种交通量预测模型的构建方法和系统,所述方法包括将经过预处理的数据划分为测试集、验证集和测试集;根据路段节点的位置构建邻接矩阵,所述邻接矩阵用于表征路段节点之间的相关性;对所述测试集中的数据按序列分别进行时间依赖关系和空间依赖关系的提取,所述时间依赖关系用于表征时间步之间的权重关系,所述空间依赖关系用于表征路段节点之间的权重关系;对时间依赖关系和空间依赖关系的提取结果进行全连接层处理,完成交通量预测模型的构建。本发明实施例的有益效果是:有效的对道路交通的时间依赖、空间依赖、趋势模式进行了学习,从而能够高效的预测交通量。够高效的预测交通量。够高效的预测交通量。
技术研发人员:陈志华 郭灿阳
受保护的技术使用者:福州大学
技术研发日:2022.11.22
技术公布日:2023/7/6
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
