基于多元时序分析的终端区流量预测方法及系统
未命名
07-17
阅读:239
评论:0
1.本发明涉及民航交通管制领域,具体涉及一种基于多元时序分析的终端区流量预测方法及系统。
背景技术:
2.自20世纪以来,我国gdp每年都在飞速增长。经济的发展带动了我国民航事业的飞速发展,为了适应时代需求,全国各地越来越多地建起了机场。民航业的高速发展给城市带来了繁荣与便捷,但随之而来的还有一系列的问题。面对急增的航空业务,有限的空域资源不足以满足其飞行需求,再加上空防训练任务的增加、恶劣天气的多发,空域资源与飞行需求二者之间的矛盾日益突显,最终导致空域拥堵、航班延误甚至飞行冲突等问题频发。因此,空中交通流量管理是解决上述问题的重要手段。
3.终端区通常设置在机场附近,是承载进离场航空器交汇的空域单元,具有航班密度高、航线结构复杂、限制多、冲突大等交通复杂性特点,是空中交通网络的关键节点,是空域拥堵、航班延误、飞行冲突最为严重的区域。未来,随着航空业务量的进一步增大,机场终端区只会承受着越来越大的航班流量,现有空域越来越趋于饱和,将会导致更加严重的交通拥堵、航班延误。由于机场终端区处于整个空中交通系统中的重要节点,其势必会成为制约当前及未来航空运输服务品质进一步提升的主要瓶颈。因此,实时、准确、高效地进行机场终端区短期流量预测势在必行。
技术实现要素:
4.本发明的目的是提供一种基于多元时序分析的终端区流量预测方法及系统。
5.为了解决上述技术问题,本发明提供了一种基于多元时序分析的终端区流量预测方法,包括:
6.步骤1、获取终端区内的基础数据;
7.步骤2、对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库;
8.步骤3、基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示;
9.步骤4、利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵;
10.步骤5、构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果。
11.进一步的,所述步骤1中获取终端区内的基础数据包括:终端区实际流量、终端区计划流量、航班正常架次、航班取消架次、容流差、航班延误、平均延误时间、航班延误架次、流控策略发布的强度、平均流控间隔、metar报文中的气象特征,waf对流天气和终端区天气指数。
12.进一步的,所述步骤2中对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库,包括:将采集到的终端区流量的基础数据进行数据清理,即填写缺失的值、光滑噪声数据、识别并删除离群点;对数据清理后的基础数据分别构建包含交通需求特征、延误特征、策略状态特征和环境状态特征的多元时序数据,以构成多元时序数据库;其中所述交通需求特征用于反应交通需求状态,包括终端区实际流量、终端区计划流量、航班正常架次、航班取消架次和容流差;所述延误特征用于反应延误状态,包括航班延误、平均延误时间和航班延误架次;所述策略状态特征用于反应终端区策略状态,包括流控策略发布的强度和平均流控间隔;所述环境状态特征用于反应反应终端区环境状态,包括metar报文中的气象特征,waf对流天气和终端区天气指数。
13.进一步的,所述步骤3中基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示,包括:基于二分迭代算法,获取多元时序数据经过归一化后的时间序列上的所有趋势分段点;根据预设定的子序列长度l和趋势分段数ω,使用不重叠的滑动窗口机制将整个时间序列定长分段成若干子序列,并采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段;使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示。
14.进一步的,所述采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段的方法包括:查找每个子序列中趋势分段点的数量γ;若γ≥ω-1,则从中挑选最具趋势信息的(ω-1)个趋势分段点,形成ω个趋势分段;若则对序列长度在前(ω-1-γ)的趋势分段进行二等分,形成ω个趋势分段;若则直接采用平均分段的方法形成ω个趋势分段;其中表示对向下取整。
15.进一步的,所述使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示,包括:将整个时间序列的所有趋势分段点根据高斯分布划分为3~10个分别用不同小写字母表示的等概率区域,并将整个斜率值取值范围划分为5个分别用不同大写字母表示的不重叠的区域;基于各趋势分段两端的趋势分段点或端点,计算每个趋势分段的斜率值,并采用该斜率值所在区域对应的大写字母表示该趋势分段的趋势特征信息;计算每个趋势分段的平均值,并采用该平均值所在等概率区域对应的小写字母表示该趋势分段的均值统计信息;使用大写字母代表趋势特征和小写字母代表均值统计的二元组表示每一个趋势分段;所述趋势分段的平均值的计算公式表示为:其中,x=[ti,
…
,t
i+m-1
]为一个序列长度为m的趋势分段序列。
[0016]
进一步的,所述步骤4中利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵,包括:基
于分段和符号化表示的多元时序数据,使用均方误差作为决策树节点划分时对特征的评价标准,分别训练出n棵决策树共同构建一个随机森林模型;使用构建好的随机森林模型对分段和符号化表示的多元时序数据中的所有特征进行重要性评估,选择重要性评分前8的特征构成特征矩阵。
[0017]
进一步的,所述步骤5中构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果,包括:通过设置cnn网络的层数、各个卷积层中卷积核大小及池化层的池化方式,构建并训练cnn子模型;通过设置gru网络的层数及隐含层神经元个数,并引入注意力机制对每个gru网络的输出结果分配相应的权重,构建并训练grua子模型;利用全连接层将cnn子模型和grua子模型进行融合,构建并训练基于cnn-grua的终端区流量预测模型;将所述特征矩阵分别输入训练好的cnn子模型和grua子模型,通过融合其输出的空间特征预测结果和时序特征预测结果,得到最终的终端区流量预测结果。
[0018]
又一方面,本发明还提供了一种基于多元时序分析的终端区流量预测系统,包括:数据获取模块,用于获取终端区内的基础数据;数据预处理模块,适于对数据获取模块获取的数据进行预处理,构建多元时序数据库;终端区动态多元时序数据表示模块,适于将多元时序数据库内的数据进行分段和符号化表示;终端区交通流量特征筛选模块,用于对分段和符号化表示后的多元时序数据进行特征筛选和降维,构建特征矩阵;终端区流量预测模块,用于对特征矩阵进行终端区流量预测,输出终端区流量预测结果。
[0019]
本发明的有益效果是,本发明首先使用时序表示方法对多元时序数据进行简化表示,使用随机森林模型进行重要性评估对多元时序数据中的特征进行筛选和降维,并利用基于cnn-grua的终端区流量预测模型实现终端区的流量预测,有助于管制人员了解预期交通态势,为交通调配提供重要的决策支持信息,提高航班的进离场效率,缓解机场终端区交通压力,从而提升整个空中交通系统的运行效率。
[0020]
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0021]
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0022]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]
图1是本发明的基于多元时序分析的终端区流量预测方法的流程图;
[0024]
图2是本发明的基于二分迭代算法获取趋势分段点的示意图;
[0025]
图3是本发明的实施例中例举的一个子序列基于趋势与均值的时间序列表示结果示意图;
[0026]
图4是本发明的随机森林模型的示意图;
[0027]
图5是本发明的基于cnn-grua的终端区流量预测模型的示意图;
[0028]
图6是本发明的基于多元时序分析的终端区流量预测系统的系统框图。
具体实施方式
[0029]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0030]
实施例1
[0031]
如图1所示,本实施例提供了一种基于多元时序分析的终端区流量预测方法,包括:
[0032]
步骤1、获取终端区内的基础数据;
[0033]
步骤2、对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库;
[0034]
步骤3、基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示;
[0035]
步骤4、利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵;
[0036]
步骤5、构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果。
[0037]
在一些实施例中,所述步骤1中获取终端区内的基础数据包括:终端区实际流量、终端区计划流量、航班正常架次、航班取消架次、容流差、航班延误、平均延误时间、航班延误架次、流控策略发布的强度、平均流控间隔、metar报文中的气象特征,waf对流天气和终端区天气指数。
[0038]
可以理解的是,所述步骤2中对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库,包括:将采集到的终端区流量的基础数据进行数据清理,即填写缺失的值、光滑噪声数据、识别并删除离群点;对数据清理后的基础数据分别构建包含交通需求特征、延误特征、策略状态特征和环境状态特征的多元时序数据,以构成多元时序数据库;其中所述交通需求特征用于反应交通需求状态,包括终端区实际流量、终端区计划流量、航班正常架次、航班取消架次和容流差;所述延误特征用于反应延误状态,包括航班延误、平均延误时间和航班延误架次;所述策略状态特征用于反应终端区策略状态,包括流控策略发布的强度和平均流控间隔;所述环境状态特征用于反应反应终端区环境状态,包括metar报文中的气象特征,waf对流天气和终端区天气指数。
[0039]
在本实施例中,所述步骤3中基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示,包括:基于二分迭代算法,获取多元时序数据经过归一化后的时间序列上的所有趋势分段点;根据预设定的子序列长度l和趋势分段数ω,使用不重叠的滑动窗口机制将整个时间序列定长分段成若干子序列,并采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段;使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示。
[0040]
本实施例中对多元时序数据进行归一化处理的计算公式表示为:其中x表示待归一化处理的多元时序数据,y表示经过归一化处理后的多元时序数据,min和max分别表示待归一化处理的多元时序数据中的最小值和最大值;对多元时序数据进行归一化处理是为了对原始范围内的多元时序数据进行重新缩放,使得值在0到1的范围内,这样方便后面的操作以及机器学习。
[0041]
本实施例中的所述二分迭代算法,具体如图2所示,上方虚线是已经经过归一化后的序列s,s1和sn分别是这段序列s的起点和终点,下方虚线是它们的连接线l
1-n
,计算这条序列s上每个点到连接线l
1-n
的距离,并找出距离最大点si。如果最大距离大于预设阈值ε,则将此点si标记为趋势分段点,将序列s分为起点为s1终点为si和起点为si终点为sn的两个序列段,接着分别从这两个序列段中进行二分迭代递归,直至找到所有的趋势分段点;如果最大距离不大于预设阈值ε,则二分迭代结束。
[0042]
在具体的实施方式中,所述采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段的方法包括:查找每个子序列中趋势分段点的数量γ;若γ≥ω-1,则从中挑选最具趋势信息的(ω-1)个趋势分段点,形成ω个趋势分段;若则对序列长度在前(ω-1-γ)的趋势分段进行二等分,形成ω个趋势分段;若则直接采用平均分段的方法形成ω个趋势分段;其中表示对向下取整。趋势分段为各子序列的起点、终点和(ω-1)个趋势分段点依次连接形成的。
[0043]
在具体的实施方式中,所述使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示,包括:将整个时间序列的所有趋势分段点根据高斯分布划分为3~10个分别用不同小写字母表示的等概率区域,并将整个斜率值取值范围划分为5个分别用不同大写字母表示的不重叠的区域;基于各趋势分段两端的趋势分段点或端点,计算每个趋势分段的斜率值,并采用该斜率值所在区域对应的大写字母表示该趋势分段的趋势特征信息;计算每个趋势分段的平均值,并采用该平均值所在等概率区域对应的小写字母表示该趋势分段的均值统计信息;使用大写字母代表趋势特征和小写字母代表均值统计的二元组表示每一个趋势分段;所述趋势分段的平均值的计算公式表示为:其中,x=[ti,
…
,t
i+m-1
]为一个序列长度为m的趋势分段序列。
[0044]
在一些实施例中,所述趋势分段的斜率值取值范围为(-∞,+∞),将该范围划分为5个不重叠的区域,每个区域对应一个大写字母,用来描述这个分段的趋势变化程度,分别是(-∞,-1)对应a表示剧烈下降、(-1,-0.1)对应b表示轻微下降、(-0.1,0.1)对应c表示轻微波动(近似于水平)、(0.1,1)对应d表示轻微上升以及(1,+∞)对应e表示剧烈上升;假设
整个时间序列的所有趋势分段点根据高斯分布划分为4个等概率区域,每个区域对应一个小写字母,用来描述这个分段的均值统计信息,分别是(-∞,-1)对应a,(-1,0)对应b,(0,1)对应c,以及(1,+∞)对应d,例如,如图3所示的一段子序列,将其用于分别体现各趋势分段的趋势特征和均值统计信息的数据二元组表示为符号二元组,即(1.31,0.15)表示为(e,c),(-0.95,0.02)表示为(b,c),(1.15,-0.15)表示为(e,b),(-1.16,0.11)表示为(a,c),(0.36,0.01)表示为(d,c),(-0.18,0.12)表示为(b,c),则该包含6个趋势分段的子序列可以表示为ecbcebacdcbc。
[0045]
在本实施例中,所述步骤4中利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵,包括:基于分段和符号化表示的多元时序数据,使用均方误差作为决策树节点划分时对特征的评价标准,分别训练出n棵决策树共同构建一个随机森林模型;使用构建好的随机森林模型对分段和符号化表示的多元时序数据中的所有特征进行重要性评估,选择重要性评分前8的特征构成特征矩阵。
[0046]
具体的,如图4所示,随机森林模型是由多个决策树共同构成的,将各个分类回归决策树的决策结果进行综合得到最终的决策结果。主要步骤如下:采用bootstrap方法有放回的从分段和符号化表示的多元时序数据样本中选取若干数据样本;利用抽样得到的数据样本使用均方误差作为决策树进行节点划分时对特征的评价标准,确定最佳的划分方式,生成决策树;重复上述操作n次,直到获得n棵决策树,构建随机森林模型;使用构建好的随机森林模型对多元时序数据中的所有特征进行重要性评估,选择重要性评分前8的特征作为预测模型的输入特征矩阵。
[0047]
可以理解的是,多元时序数据包括交通需求特征、延误特征、策略状态特征和环境状态特征四个大类特征,各大类特征中又包含很多特征,经过大量实验证明,利用选择8个以上的特征构成的特征矩阵预测的终端区流量结果的精确度与利用选取8个特征构成的特征矩阵预测的终端区流量结果的精确度相近,则为了简化计算过程,选取在随机森林模型的重要性评估中排前8的特征构成特征矩阵。
[0048]
在本实施例中,所述步骤5中构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果,包括:通过设置cnn网络的层数、各个卷积层中卷积核大小及池化层的池化方式,构建并训练cnn子模型;通过设置gru网络的层数及隐含层神经元个数,并引入注意力机制对每个gru网络的输出结果分配相应的权重,构建并训练grua子模型;利用全连接层将cnn子模型和grua子模型进行融合,构建并训练基于cnn-grua的终端区流量预测模型;将所述特征矩阵分别输入训练好的cnn子模型和grua子模型,通过融合其输出的空间特征预测结果和时序特征预测结果,得到最终的终端区流量预测结果。
[0049]
在本实施方式中,如图5所示,所述基于cnn-grua的终端区流量预测模型适于首先使用时序表示方法对原始数据(即多元时序数据,将其划分成用于训练模型的训练集和用于进行预测的测试集)进行降维和特征符号表示,方便后续的处理与计算,接着构建随机森林模型进行重要性评估,选出重要性较高的特征构成特征矩阵,分别输入cnn和grua两个不同子模型进行预测。cnn子模型需要设置cnn网络的层数,以及各个层所进行的操作,设置各个卷积层中卷积核大小及池化层的池化方式,grua子模型也需要设置grua模型中gru网络
的层数及隐含层神经元个数,利用训练集分别对cnn子模型和grua子模型进行训练,并将cnn子模型和grua子模型的训练结果用过一个输入为2输出为1的全连接层进行训练,分别通过反向传播进行迭代更新参数,当各自定义的损失函数收敛时,则训练完成。将测试集的特征矩阵分别输入训练好的cnn子模型和grua子模型,输出空间特征预测序列和时序特征预测序列并利用训练好的输入为2输出为1的全连接层将空间特征预测序列和时序特征预测序列融合,得到最终的终端区流量预测结果
[0050]
可以理解的是,cnn子模型通过卷积运算充分挖掘输入的特征矩阵的多维数据之间的相互关系,使用cnn网络提取局部数据空间特征,通过池化运算降低数据维度,提取数据中的空间特征,即cnn子模型的预测结果;gru子模型独特的门结构使其具有记忆功能,各gru单元按照时序的关系依次输入数据,可以充分的考虑到数据的前后关系,使用各gru单元提取数据中的时序特征;注意力机制的思想是通过对关键信息分配足够的注意力来突出重要的信息,降低甚至忽略一些不重要的信息,使用注意力机制为每个gru单元的输出结果分配不同的权重,然后将其通过全连接层,得到grua子模型的预测结果。
[0051]
实施例2
[0052]
在上述实施例1的基础上,如图6所示,本实施例还提供了一种基于多元时序分析的终端区流量预测系统,包括:数据获取模块,用于获取终端区内的基础数据;数据预处理模块,适于对数据获取模块获取的数据进行预处理,构建多元时序数据库;终端区动态多元时序数据表示模块,适于将多元时序数据库内的数据进行分段和符号化表示;终端区交通流量特征筛选模块,用于对分段和符号化表示后的多元时序数据进行特征筛选和降维,构建特征矩阵;终端区流量预测模块,用于对特征矩阵进行终端区流量预测,输出终端区流量预测结果,为制定合理的管制策略的提供更可靠的支持。
[0053]
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
技术特征:
1.一种基于多元时序分析的终端区流量预测方法,其特征在于,包括:步骤1、获取终端区内的基础数据;步骤2、对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库;步骤3、基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示;步骤4、利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵;步骤5、构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果。2.根据权利要求1所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述步骤1中获取终端区内的基础数据包括:终端区实际流量、终端区计划流量、航班正常架次、航班取消架次、容流差、航班延误、平均延误时间、航班延误架次、流控策略发布的强度、平均流控间隔、metar报文中的气象特征,waf对流天气和终端区天气指数。3.根据权利要求2所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述步骤2中对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库,包括:将采集到的终端区流量的基础数据进行数据清理,即填写缺失的值、光滑噪声数据、识别并删除离群点;对数据清理后的基础数据分别构建包含交通需求特征、延误特征、策略状态特征和环境状态特征的多元时序数据,以构成多元时序数据库;其中所述交通需求特征用于反应交通需求状态,包括终端区实际流量、终端区计划流量、航班正常架次、航班取消架次和容流差;所述延误特征用于反应延误状态,包括航班延误、平均延误时间和航班延误架次;所述策略状态特征用于反应终端区策略状态,包括流控策略发布的强度和平均流控间隔;所述环境状态特征用于反应反应终端区环境状态,包括metar报文中的气象特征,waf对流天气和终端区天气指数。4.根据权利要求3所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述步骤3中基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示,包括:基于二分迭代算法,获取多元时序数据经过归一化后的时间序列上的所有趋势分段点;根据预设定的子序列长度l和趋势分段数ω,使用不重叠的滑动窗口机制将整个时间序列定长分段成若干子序列,并采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段;使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示。5.根据权利要求4所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述采用相应的策略使每个子序列中的趋势分段点的数量为(ω-1)个,形成ω个趋势分段的方法包括:
查找每个子序列中趋势分段点的数量γ;若γ≥ω-1,则从中挑选最具趋势信息的(ω-1)个趋势分段点,形成ω个趋势分段;若则对序列长度在前(ω-1-γ)的趋势分段进行二等分,形成ω个趋势分段;若则直接采用平均分段的方法形成ω个趋势分段;其中表示对向下取整。6.根据权利要求4所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述使用基于趋势特征和均值统计的二元组对每一个趋势分段进行符号化表示,包括:将整个时间序列的所有趋势分段点根据高斯分布划分为3~10个分别用不同小写字母表示的等概率区域,并将整个斜率值取值范围划分为5个分别用不同大写字母表示的不重叠的区域;基于各趋势分段两端的趋势分段点或端点,计算每个趋势分段的斜率值,并采用该斜率值所在区域对应的大写字母表示该趋势分段的趋势特征信息;计算每个趋势分段的平均值,并采用该平均值所在等概率区域对应的小写字母表示该趋势分段的均值统计信息;使用大写字母代表趋势特征和小写字母代表均值统计的二元组表示每一个趋势分段;所述趋势分段的平均值的计算公式表示为:其中,x=[t
i
,
…
,t
i+m-1
]为一个序列长度为m的趋势分段序列。7.根据权利要求4所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述步骤4中利用随机森林模型确定与终端区流量预测相关性较高的因素,对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵,包括:基于分段和符号化表示的多元时序数据,使用均方误差作为决策树节点划分时对特征的评价标准,分别训练出n棵决策树共同构建一个随机森林模型;使用构建好的随机森林模型对分段和符号化表示的多元时序数据中的所有特征进行重要性评估,选择重要性评分前8的特征构成特征矩阵。8.根据权利要求7所述的基于多元时序分析的终端区流量预测方法,其特征在于,所述步骤5中构建基于cnn-grua的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果,包括:通过设置cnn网络的层数、各个卷积层中卷积核大小及池化层的池化方式,构建并训练cnn子模型;
通过设置gru网络的层数及隐含层神经元个数,并引入注意力机制对每个gru网络的输出结果分配相应的权重,构建并训练grua子模型;利用全连接层将cnn子模型和grua子模型进行融合,构建并训练基于cnn-grua的终端区流量预测模型;将所述特征矩阵分别输入训练好的cnn子模型和grua子模型,通过融合其输出的空间特征预测结果和时序特征预测结果,得到最终的终端区流量预测结果。9.一种基于多元时序分析的终端区流量预测系统,其特征在于,包括:数据获取模块,用于获取终端区内的基础数据;数据预处理模块,适于对于数据获取模块获取的数据进行预处理,构建多元时序数据库;终端区动态多元时序数据表示模块,适于将多元时序数据库内的数据进行分段和符号化表示;终端区交通流量特征筛选模块,用于对分段和符号化表示后的多元时序数据进行特征筛选和降维,构建特征矩阵;终端区流量预测模块,用于对特征矩阵进行终端区流量预测,输出终端区流量预测结果。
技术总结
本发明涉及交通管制领域,具体涉及一种基于多元时序分析的终端区流量预测方法及系统,本方法包括:获取终端区内的基础数据;对所述基础数据进行预处理,构建用于终端区流量预测的多元时序数据库;基于趋势与均值的时间序列表示方法,对多元时序数据库内的数据进行分段和符号化表示;利用随机森林模型对分段和符号化表示的多元时序数据进行特征筛选和降维,构造特征矩阵;构建基于CNN-GRUA的终端区流量预测模型,并将所述特征矩阵输入训练好的终端区流量预测模型,输出终端区流量预测结果;本方法有助于管制人员了解预期交通态势,为交通调配提供重要的决策支持信息,提高航班进离场效率,缓解机场终端区交通压力,从而提升整个空中交通系统的运行效率。中交通系统的运行效率。中交通系统的运行效率。
技术研发人员:祝玮琦 陈海燕 袁立罡 田文 张颖 谢华
受保护的技术使用者:南京航空航天大学
技术研发日:2023.03.21
技术公布日:2023/6/27
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
