一种考虑交通事故分类的事故下交通量预测方法及系统
未命名
07-17
阅读:96
评论:0
1.本发明涉及城市道路交通量预测分析技术领域,尤其涉及一种考虑交通事故分类的事故下交通量预测方法及系统。
背景技术:
2.随着我国经济的发展,交通需求日益增长,随之带来交通事故频发,不仅给人们生命和财产造成了巨大的损失,也会对城市交通系统运行带来一定的影响,引发交通拥堵,甚至交通中断。因此,快速、准确地预测事发路段的交通流变化,为交通管理部门交通疏导提供决策支持,以减轻甚至避免因交通事故引起的交通拥堵、二次事故等后续损失具有重要的理论意义和现实价值。
3.目前应用在各个方面的交通量预测方法主要有线性、非线性以及组合模型三种,这些方法在中长期预测应用方面效果较好,但事故下的交通量具有非线性、突变性和偶发性等特点,若只考虑时间序列或空间因素,不考虑事故本身影响属性,这种单一的预测方式很难满足事故下交通量预测的适用性。现有的事故下交通流预测方法大多是将所有的事故数据作为集合,分析事故前后交通量序列之间的潜在联系,但由于交通事故的异质性,这种传统方法构建出的模型弱化了不同事故对交通量变化趋势影响程度的差异,在预测精度和适用性上还存在不足。
技术实现要素:
4.本发明所要解决的技术问题是针对上述现有技术的不足,提供一种考虑交通事故分类的事故下交通量预测方法及系统。
5.本发明解决上述技术问题的技术方案如下:一种考虑交通事故分类的事故下交通量预测方法,包括如下步骤:
6.基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;
7.基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;
8.分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试;
9.将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。
10.本发明的有益效果是:本发明的考虑交通事故分类的事故下交通量预测方法,考虑交通事故对交通的影响等级不同,基于交通事故持续时间,将事故划分为几个不同的类别分别建立交通量预测模型,实现将事故按照其影响特征进行归类后,使用对应类别的预测模型进行预测,以削减交通事故异质性对交通量预测的影响,能够及时准确地为交通管理部门提供决策支持。
11.在上述技术方案的基础上,本发明还可以做如下改进:
12.进一步:所述基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量时间序列集具体包括如下步骤:
13.依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;
14.依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
;
15.根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;
16.根据每起事故的事故持续时间t将交通事故分为多个事故类别;
17.按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b;
18.对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。
19.上述进一步方案的有益效果是:通过卡口数据分别获取每起事故所在路段对应时间的交通量时间序列数据和同地点同时间下未发生交通事故的交通量时间序列数据,以便准确确定每起事故的事故持续时间t,从而方便精确地将交通事故分为多个事故类别。
20.进一步:所述基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型具体包括如下步骤:
21.根据所述历史交通事故特征表d划分第一训练集和第一测试集;
22.采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;
23.从所述历史交通事故特征表中所有的m个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型;
24.将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型。
25.上述进一步方案的有益效果是:通过将所述历史交通事故特征表d进行划分,并根据划分后的第一训练集采样得到训练样本,这样即可根据训练样本和从所述历史交通事故特征表中采样的事故特征生成基决策树,进而构建出随机森林交通事故归类模型,以对交通事故进行分类,确定交通事故所属的类别。
26.进一步:所述分类建立交通事故下交通量预测模型,并将分类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试具体包括如下步骤:
27.根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;
28.对所述第二训练集中的交通量时间序列数据进行归一化处理,并映射到区间[0,1]内,表达式为:
[0029]q′
=(q-q
min
)/(q
max-q
min
)
[0030]
式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序列数据的最大值;
[0031]
分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通
量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;
[0032]
分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型。
[0033]
上述进一步方案的有益效果是:通过对所述交通量数据集b进行划分,这样可以将所述第二训练集中的交通量时间序列数据归一化处理后对bp神经网络进行训练,得到多个基于bp神经网络的交通量预测模型,在对所述第二测试集的交通量时间序列数据进行测试,并修正所述交通事故下交通量预测模型的参数,保证与预测结果的精度,有利于精确得到对应的预测结果。
[0034]
进一步:所述的考虑交通事故分类的事故下交通量预测方法还包括如下步骤:
[0035]
建立不考虑交通事故分类的事故下交通量预测模型,并将历史事故的交通量序列作为输入进行训练和测试,得到对应不考虑交通事故分类的事故下交通流量预测模型;
[0036]
将所述目标交通量时间序列数据输入不考虑交通事故分类的事故下交通量预测模型,得到该起事故不考虑交通事故分类的事故下目标交通量预测结果;
[0037]
比较考虑交通事故分类的事故下目标交通量预测结果与对应不考虑交通事故分类的事故下目标交通量预测结果,并根据二者的误差结果评价预测的有效性。
[0038]
上述进一步方案的有益效果是:通过建立不考虑交通事故分类的事故下交通量预测模型,并对目标交通量时间序列数据进行预测,得到对应不考虑交通事故分类的事故下目标交通量预测结果,然后将考虑交通事故分类的事故下目标交通量预测结果与对应不考虑交通事故分类的事故下目标交通量预测结果分别与交通量实际值之间的误差进行比对,根据二者的误差大小比较预测的有效性,对预测结果进行验证,保证预测方法的精确性和科学性。
[0039]
本发明还提供了一种考虑交通事故分类的事故下交通量预测系统,包括数据处理模块、交通事故归类模块和交通量预测模块;
[0040]
数据处理模块,用于基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;
[0041]
交通事故归类模块,用于基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;
[0042]
交通量预测模块,用于分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试;
[0043]
交通量预测模块,还用于将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。
[0044]
本发明的考虑交通事故分类的事故下交通量预测系统,考虑交通事故对交通的影响等级不同,基于交通事故持续时间,将事故划分为几个不同的类别分别建立交通量预测模型,实现将事故按照其影响特征进行归类后,使用对应类别的预测模型进行预测,以削减交通事故异质性对交通量预测的影响,能够及时准确地为交通管理部门提供决策支持。
[0045]
在上述技术方案的基础上,本发明还可以做如下改进:
[0046]
进一步:所述数据处理模块基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集的具体实现为:
[0047]
依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;
[0048]
依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
;
[0049]
根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;
[0050]
根据每起事故的事故持续时间t将交通事故分为多个事故类别;
[0051]
按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b
[0052]
对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。
[0053]
上述进一步方案的有益效果是:通过卡口数据分别获取每起事故所在路段对应时间的交通量时间序列数据和同地点同时间下未发生交通事故的交通量时间序列数据,以便准确确定每起事故的事故持续时间t,从而方便精确地将交通事故分为多个事故类别。
[0054]
进一步:所述交通事故归类模块基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型的具体实现为:
[0055]
根据所述历史交通事故特征表d划分第一训练集和第一测试集;
[0056]
采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;
[0057]
从所述历史交通事故特征表中所有的m个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成对应的k棵基决策树,并构造随机森林交通事故归类模型;
[0058]
将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型。
[0059]
上述进一步方案的有益效果是:通过将所述历史交通事故特征表d进行划分,并根据划分后的第一训练集采样得到训练样本,这样即可根据训练样本和从所述历史交通事故特征表中采样的事故特征生成基决策树,进而构建出随机森林交通事故归类模型,以对交通事故进行分类,确定交通事故所属的类别。
[0060]
进一步:所述交通量预测模块分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试的具体实现为:
[0061]
根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;
[0062]
对所述第二训练集中的交通量时间序列数据进行归一化处理,并映射到区间[0,1]内,表达式为:
[0063]q′
=(q-q
min
)/(q
max-q
min
)
[0064]
式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序列数据的最大值;
[0065]
分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通
量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;
[0066]
分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型。
[0067]
上述进一步方案的有益效果是:通过对所述交通量数据集b进行划分,这样可以将所述第二训练集中的交通量时间序列数据归一化处理后对bp神经网络进行训练,得到多个基于bp神经网络的交通量预测模型,在对所述第二测试集的交通量时间序列数据进行测试,并修正所述交通事故下交通量预测模型的参数,保证与预测结果的精度,有利于精确得到对应的预测结果。
[0068]
本发明还提供了可读存储介质,所述可读存储介质中包括考虑交通事故分类的事故下交通量预测方法程序,所述考虑交通事故分类的事故下交通量预测方法程序被处理器执行时,实现所述的方法的步骤。
附图说明
[0069]
图1为本发明一实施例的考虑交通事故分类的事故下交通量预测方法的流程示意图;
[0070]
图2为本发明一实施例的原始数据处理流程;
[0071]
图3为本发明一实施例的考虑交通事故分类的事故下交通量预测流程与不考虑交通事故分类的事故下交通量预测流程对比图;
[0072]
图4为本发明一实施例的考虑交通事故分类的事故下交通量预测结果与不考虑交通事故分类的事故下交通量预测结果的对比图;
[0073]
图5为本发明一实施例的考虑交通事故分类的事故下交通量预测误差与不考虑交通事故分类的事故下交通量预测误差的对比图;
[0074]
图6为本发明一实施例的考虑交通事故分类的事故下交通量预测系统的结构示意图。
具体实施方式
[0075]
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0076]
如图1所示,一种考虑交通事故分类的事故下交通量预测方法,包括如下步骤:
[0077]
s1:基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;
[0078]
s2:基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;
[0079]
s3:分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试;
[0080]
s4:将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。
[0081]
本发明的考虑交通事故分类的事故下交通量预测方法,考虑交通事故对交通的影
响等级不同,基于交通事故持续时间,将事故划分为几个不同的类别分别建立交通量预测模型,实现将事故按照其影响特征进行归类后,使用对应类别的预测模型进行预测,以削减交通事故异质性对交通量预测的影响,能够及时准确地为交通管理部门提供决策支持。
[0082]
在本发明的一个或多个实施例中,所述基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量时间序列集具体包括如下步骤:
[0083]
s11:依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;
[0084]
这里,本发明的实施例中,时间跨度为事故发生前1h和事故发生后1h,时间间隔为2min,即每起事故的交通量时间序列都包括60个值,q={q1,q2,q3,
…
,q
60
},其中q1为事故发生前60-58min的交通量,q2为事故发生前58-56min的交通量,q
31
为事故发生后0-2min的交通量,q
32
为事故发生后2-4min的交通量,依此类推。
[0085]
s12:依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
,
[0086]
s13:根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;
[0087]
这里,对每起事故对应的q和q
*
进行比对,以q
*
为参考,记事故发生后流量变化趋于稳定的时刻为ts,事故发生的时刻为t0,则事故持续时间为t,t=t
s-t0。
[0088]
s14:根据每起事故的事故持续时间t将交通事故分为多个事故类别;
[0089]
本发明的实施例中,将交通事故分为短时事故(t≤15)、中时事故(15<t≤30)、中长时事故(30<t≤45)和长时事故(t>45)四个类别,分别记为1、2、3、4。
[0090]
s15:按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b;其中,b:{q1,q2,
…
,q4},q1~q4分别为第1-4类事故下的交通量时间序列集。以q1为例,q1是规格为i1×
60的列表,其中i1为第1类交通事故的数量,如式所示:
[0091][0092]
s16:对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。
[0093]
这里,对交通事故报警信息,剔除信息不全、信息错误的记录,只保留完整的和交通事故相关的数据。整理出的事故属性包括时间属性(是否在工作日、是否在高峰期、是否在深夜)、空间属性(是否在主干道、是否在路口、车道数)、事故本身属性(是否涉及大车、是否涉及多车、是否挪动、是否需要救护车)以及天气(小时降雨量)共11个属性。各属性取值如下:
[0094]
表1交通事故属性
[0095][0096]
注:0=否;1=是;小时降雨量单位为mm/h。
[0097]
各交通事故的特征向量为d=(x1,x2,x3,
…
,x
11
,y),其中x1~x
11
为该起事故的11个属性值;y为该事故所属类别。整理出的事故特征表为d=[d1,d2,d3,
…
,dn],其中n为历史交通事故总量。
[0098]
通过卡口数据分别获取每起事故所在路段对应时间的交通量时间序列数据和同地点同时间下未发生交通事故的交通量时间序列数据,以便准确确定每起事故的事故持续时间t,从而方便精确地将交通事故分为多个事故类别。
[0099]
在本发明的一个或多个实施例中,所述基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型具体包括如下步骤:
[0100]
s21:根据所述历史交通事故特征表d划分第一训练集和第一测试集;
[0101]
比如,本发明的实施例中,以70%的历史交通事故特征表d为第一训练集,剩余的30%为第一测试集。
[0102]
s22:采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;
[0103]
这里,每次抽取所述第一训练集中约三分之二的事故数据作为样本。
[0104]
s23:从所述历史交通事故特征表中所有的m(本发明中m=11)个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型;
[0105]
本发明的实施例中,生成决策树过程中,每次分裂时从中挑选最优的那个特征作为分裂特征。
[0106]
s24:将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型进行测试,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型;
[0107]
具体地,将第一测试集中历史交通事故的11个特征值输入到构造好的随机森林交通事故归类模型后,随机森林交通事故归类模型里的每棵基决策树都独立地对事故进行判断,每起事故将得到k个归类结果,最后根据相对多数投票法确定测试得到的事故所属的类别,再将测试得到的事故所属的类别与实际事故所述类别进行对比,如果所述第一测试集的事故所属类别的预测结果的满足设定精度要求时,得到最终的随机森林交通事故归类模型,否则,调整所述随机森林交通事故归类模型的参数,直至所述第一测试集的事故所属类别的预测结果的精度满足设定精度要求,并得到最终的随机森林交通事故归类模型。
[0108]
通过将所述历史交通事故特征表d进行划分,并根据划分后的第一训练集采样得到训练样本,这样即可根据训练样本和从所述历史交通事故特征表中采样的事故特征生成基决策树,进而构建出随机森林交通事故归类模型,以对交通事故进行分类,确定交通事故所属的类别。
[0109]
在本发明的一个或多个实施例中,所述分类建立交通事故下交通量预测模型,并
将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试具体包括如下步骤:
[0110]
s31:根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;
[0111]
本实施例中,这里将四类事故下的交通量时间序列每类取70%为第二训练集,剩余的30%为第二测试集。
[0112]
s32:对所述第二训练集中的交通量时间序列数据进行归一化处理,本发明中采用mapminmax函数将训练集的交通量数据在输入神经网络前做归一化处理,并映射到区间[0,1]内,表达式为:
[0113]q′
=(q-q
min
)/(q
max-q
min
)
[0114]
式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序列数据的最大值;
[0115]
s33:分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;
[0116]
具体地,所述步骤s33包括如下步骤:
[0117]
1)设置网络激活函数、传递函数和初始参数。设定隐含层激活函数为sigmoid函数,表达式为:
[0118][0119]
输出层传递函数为purelin线性函数;输入层和输出层的神经元个数分别为30和10,隐含层层数为1,隐含层神经元个数为3,训练次数为1000次,学习速率为0.01。
[0120]
2)分别将归一化后q1,q2,q3,q4的前30个交通量,即事故发生前1h的交通量时间序列为输入,进行神经网络训练:
[0121]
神经网络的输入层为:
[0122]
x=(q
′1,q
′2,q
′3…
,q
′
30
)
[0123]
隐含层各神经元输入为:
[0124]hi
=ω
1iq′1+ω
2iq′2+
…
+ω
30iq′
30
[0125]
其中,ωi为输入层各神经元到隐含层各神经元的权值;
[0126]
隐含层各神经元输出为:
[0127]hi
=s(h
i-bi)
[0128]
其中,s(
·
)为sigmoid函数;bi为隐含层阈值;
[0129]
输出层各神经元输入为:
[0130]
yj=ω
1j
h1+ω
2j
h2+
…
+ω
kjhk
[0131]
其中,ωj为隐含层各神经元到输出层各神经元的权值;k为隐含层神经元个数;
[0132]
输出层各神经元输出为:
[0133]
yj=p(y
j-bj)
[0134]
其中,p(
·
)为purelin函数;bj为输出层阈值。
[0135]
3)误差反向传播进行调参。采用均方误差损失函数mse判断预测值与真实值的差别,表达式为:
[0136][0137]
其中,yi为交通量预测值,qi为实际交通量,n为样本个数;
[0138]
误差不满足需求时,利用误差反向传播方法调整各神经元的权值与阈值,调整后按照上述2)中的方法再次训练直到满足需求,完成训练,调参表达式为:
[0139]
ω=ω+ηeh
[0140]
b=b+ηe
[0141]
其中,ω和b分别代表权值和阈值;η为学习速率;h为隐含层的节点数;e为节点的误差信号值。
[0142]
s34:分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型;
[0143]
具体地,将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,得到第二测试集的预测结果,将所述第二测试集的预测结果与所述第二测试集的实际值比较,如果所述第二测试集的预测结果的精度满足设定精度要求时,得到最终的所述交通事故下交通量预测模型,否则,调整所述交通事故下交通量预测模型的参数,直至所述第二测试集的预测结果的精度满足设定精度要求,并得到最终的所述交通事故下交通量预测模型。
[0144]
在本发明的一个或多个实施例中,所述的考虑交通事故分类的事故下交通量预测方法还包括如下步骤:
[0145]
s5:建立不考虑交通事故分类的事故下交通量预测模型,并将历史事故的交通量序列作为输入进行训练和测试,得到对应不考虑交通事故分类的事故下交通量预测模型;
[0146]
s6:将所述目标交通量时间序列数据输入不考虑交通事故分类的事故下交通量预测模型,得到该起事故不考虑交通事故分类的事故下目标交通量预测结果;
[0147]
具体地,将历史事故的交通量序列作为输入,按照s3中方法建立不考虑事故分类的bp神经网络交通量预测模型,记作bpo,将一起未知类别的交通事故作为目标交通事故,并将目标交通事故发生前的交通量序列作为目标交通量时间序列输入bpo,得到该起事故下不考虑事故分类的目标交通量预测结果。
[0148]
而考虑交通事故分类下事故发生后的目标交通量预测结果的具体过程为:
[0149]
将目标交通量时间序列对应的交通事故特征表中所有的m(本发明中m=11)个事故特征值输入至所述随机森林交通事故归类模型,并进行归类,得到归类结果;
[0150]
将目标交通量时间序列输入至对应类别的所述交通事故下交通量预测模型,得到对应考虑交通事故分类下事故发生后的目标交通量预测结果。
[0151]
s6:比较考虑交通事故分类的事故下目标交通量预测结果与对应不考虑交通事故分类的事故下目标交通量预测结果,并根据二者的误差结果评价预测的有效性。
[0152]
具体地,使用误差指标绝对百分比误差(mape)、均方误差(mse)以及平均绝对误差(mae)对比。使用误差指标绝对百分比误差(mape)、均方误差(mse)以及平均绝对误差(mae)进行对比:
[0153][0154][0155]
其中,yi为交通量预测值,qi为实际交通量,n为样本个数。
[0156]
如果考虑交通事故分类的事故下交通量预测结果的误差小于对应不考虑交通事故分类的事故下交通量预测结果的误差,则表明本发明的预测方法有效。
[0157]
通过分类建立不考虑交通事故分类的事故下交通量预测模型,并对目标交通量时间序列进行预测,得到对应不考虑交通事故分类的事故下的目标交通量预测结果,然后将考虑交通事故分类的事故下目标交通量预测结果与对应不考虑交通事故分类的事故下的目标交通量预测结果分别与交通量实际值之间的误差进行比对,根据二者的误差大小比较预测的有效性,对预测结果进行验证,保证预测方法的精确性和科学性。
[0158]
本发明的实施例中,结合实例对本发明的考虑交通事故分类的事故下交通量预测方法进行了验证,具体如下:
[0159]
1)对报警信息进行预处理。依据报警类型剔除非事故类的接警记录,且发案位置不在卡口覆盖范围内的事故其交通量数据无法计算,这些事故记录也进行剔除,最终筛选出274起信息完整的历史交通事故;
[0160]
2)在原始卡口数据和报警信息基础上做进一步处理,建立历史事故下的交通量时间序列集和交通事故特征集,如图2所示;
[0161]
3)构造交通事故归类模型。利用python中sklearn随机森林分类模块实现随机森林交通事故归类模型的建立。在多次改变参数训练并对比模型效用后,确定参数max_features为0.7、n_estimators为60、max_depth为6;这里,将历史交通事故特征表d中所有274条数据划分为各个类别的第一训练集和第一测试集,然后采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k(k的取值由随机森林交通事故归类模型的参数n_estimators确定)个训练样本,从所述历史交通事故特征表中所有的m(本发明中m=11)个事故特征中随机抽取m(m<m)(m的取值由随机森林交通事故归类模型的参数max_features确定)个事故特征,然后据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型,最后将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型进行测试,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型,然后将1起未知类别的交通事故作为目标交通事故,并将目标交通事故的特征表dx输入到最终的随机森林交通事故归类模型进行归类,得到其归类结果为3;
[0162]
4)分类建立事故下交通量预测模型。利用bp神经网络分别训练四个交通事故类别下的交通量预测模型bp1,bp2,bp3,bp4,经过多次试验,在满足训练要求前提下,确定四个模型隐含层层数和神经元个数组合分别为5
×
8、5
×
16、8
×
8和8
×
16;
[0163]
具体地,将交通量数据集b中所有信息完整的交通事故划分第二训练集和第二测试集,并进行归一化处理,分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于
bp神经网络的交通量预测模型,然后将各类所述交通量时间序列数据中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型;
[0164]
5)、将目标交通事故发生前1h的交通量序列作为目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型bp3进行预测,得到考虑交通事故分类的事故下目标交通量预测结果;
[0165]
6)、建立不考虑交通事故分类的事故下交通量预测模型,并将历史事故的所有274条交通量序列的作为输入进行训练和测试,得到对应不考虑交通事故分类的事故下交通量预测模型bpo;
[0166]
7)、将目标交通事故发生前1h的交通量序列作为目标交通量时间序列数据输入bpo,得到不考虑事故分类情况下的目标交通量预测结果;
[0167]
8)、对比考虑事故分类交通量预测方法和不考虑事故分类下目标交通量预测结果的误差,为了方便比较结果,本实例中还根据原始卡口数据计算交通量的实际值,方便作为参照进行比较。
[0168]
两种方法的流程对比如图3所示,两种方法的预测结果和误差对比如图4和图5所示。
[0169]
从图4可以看出,经过本发明的考虑事故分类下交通量预测方法比不考虑事故分类下交通量预测方法得到的预测值更接近实际值,可见本发明的考虑事故分类下交通量预测方法能得到更加精确的预测结果,从图5可以看出,经过本发明的考虑事故分类下交通量预测方法得到的预测结果的误差比不考虑事故分类下交通量预测方法得到的预测结果的误差更小,包括绝对百分比误差(mape)、均方误差(mse)以及平均绝对误差(mae)均小于不考虑事故分类下交通量预测方法得到的预测结果的误差,可见本发明的考虑事故分类下交通量预测方法是有效的。
[0170]
如图6所示,本发明还提供了一种考虑交通事故分类的事故下交通量预测系统,包括数据处理模块、交通事故归类模块和交通量预测模块;
[0171]
数据处理模块,用于基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;
[0172]
交通事故归类模块,用于基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;
[0173]
交通量预测模块,用于分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行测试和训练;
[0174]
交通量预测模块,还用于将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。
[0175]
本发明的考虑交通事故分类的事故下交通量预测系统,考虑交通事故对交通的影响等级不同,基于交通事故持续时间,将事故划分为几个不同的类别分别建立交通量预测模型,实现将事故按照其影响特征进行归类后,使用对应类别的预测模型进行预测,以削减交通事故异质性对交通量预测的影响,能够及时准确地为交通管理部门提供决策支持。
[0176]
在本发明的一个或多个实施例中,所述数据处理模块基于交通事故持续时间的事
故分类,建立历史交通事故特征表和分类的交通量数据集的具体实现为:
[0177]
依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;
[0178]
依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
;
[0179]
根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;
[0180]
根据每起事故的事故持续时间t将交通事故分为多个事故类别;
[0181]
按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b
[0182]
对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。
[0183]
通过卡口数据分别获取每起事故所在路段对应时间的交通量时间序列数据和同地点同时间下未发生交通事故的交通量时间序列数据,以便准确确定每起事故的事故持续时间t,从而方便精确地将交通事故分为多个事故类别。
[0184]
在本发明的一个或多个实施例中,所述交通事故归类模块基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型的具体实现为:
[0185]
根据所述历史交通事故特征表d划分第一训练集和第一测试集;
[0186]
采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;
[0187]
从所述历史交通事故特征表中所有的m个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型;
[0188]
将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型,且所述随机森林交通事故归类模型中的每棵基决策树分别独立地对交通事故进行判断,每起交通事故将得到k个归类结果,并根据相对多数投票法确定交通事故所属的类别。
[0189]
通过将所述历史交通事故特征表d进行划分,并根据划分后的第一训练集采样得到训练样本,这样即可根据训练样本和从所述历史交通事故特征表中采样的事故特征生成基决策树,进而构建出随机森林交通事故归类模型,以对交通事故进行分类,确定交通事故所属的类别。
[0190]
在本发明的一个或多个实施例中,所述交通量预测模块分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试的具体实现为:
[0191]
根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;
[0192]
对所述第二训练集中的交通量时间序列数据进行归一化处理,并映射到区间[0,1]内,表达式为:
[0193]q′
=(q-q
min
)/(q
max-q
min
)
[0194]
式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序列数据的最大值;
[0195]
分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;
[0196]
分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型。
[0197]
通过对交通量时间序列数据d进行划分,这样可以将所述第二训练集中的交通量时间序列数据归一化处理后对bp神经网络进行训练,得到多个基于bp神经网络的交通量预测模型,在对所述第二测试集的交通量时间序列数据进行测试,并修正所述交通事故下交通量预测模型的参数,保证与预测结果的精度,有利于精确得到对应的预测结果。
[0198]
本发明还提供了可读存储介质,所述可读存储介质中包括考虑交通事故分类的事故下交通量预测方法程序,所述考虑交通事故分类的事故下交通量预测方法程序被处理器执行时,实现所述的方法的步骤。
[0199]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种考虑交通事故分类的事故下交通量预测方法,其特征在于,包括如下步骤:基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试;将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。2.根据权利要求1所述的考虑交通事故分类的事故下交通量预测方法,其特征在于,所述基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量时间序列集具体包括如下步骤:依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
;根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;根据每起事故的事故持续时间t将交通事故分为多个事故类别;按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b;对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。3.根据权利要求2所述的考虑交通事故分类的事故下交通量预测方法,其特征在于,所述基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型具体包括如下步骤:根据所述历史交通事故特征表d划分第一训练集和第一测试集;采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;从所述历史交通事故特征表中所有的m个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型;将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型。4.根据权利要求2所述的考虑交通事故分类的事故下交通量预测方法,其特征在于,所述分类建立交通事故下交通量预测模型,并将分类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试具体包括如下步骤:根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;对所述第二训练集中的交通量时间序列数据进行归一化处理,并映射到区间[0,1]内,表达式为:q
′
=(q-q
min
)/(q
max-q
min
)式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序
列数据的最大值;分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型。5.根据权利要求1-4任一项所述的考虑交通事故分类的事故下交通量预测方法,其特征在于,还包括如下步骤:建立不考虑交通事故分类的事故下交通量预测模型,并将历史事故的交通量序列作为输入进行训练和测试,得到对应不考虑交通事故分类的事故下交通量预测模型;将所述目标交通量时间序列数据输入不考虑交通事故分类的事故下交通量预测模型,得到该起事故不考虑交通事故分类的事故下目标交通量预测结果;比较考虑交通事故分类的事故下目标交通量预测结果与对应不考虑交通事故分类的事故下目标交通量预测结果,并根据二者的误差结果评价预测的有效性。6.一种考虑交通事故分类的事故下交通量预测系统,其特征在于:包括数据处理模块、交通事故归类模块和交通量预测模块;数据处理模块,用于基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;交通事故归类模块,用于基于所述历史交通事故特征表采用随机森林方法构建交通事故归类模型;交通量预测模块,用于分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试;交通量预测模块,还用于将目标交通量时间序列数据输入训练和测试后对应类别的所述交通事故下交通量预测模型进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。7.根据权利要求6所述的考虑交通事故分类的事故下交通量预测系统,其特征在于,所述数据处理模块基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集的具体实现为:依据卡口数据获取每起事故所在路段对应时间的交通量时间序列数据,记作q;依据卡口数据获取同地点同时间下未发生交通事故的交通量时间序列数据,记作q
*
;根据交通量时间序列数据q和交通量时间序列数据q
*
得到每起事故的事故持续时间t;根据每起事故的事故持续时间t将交通事故分为多个事故类别;按照所述事故类别对卡口数据进行处理,得到事故下交通量数据集b对交通事故报警信息进行预处理,获取事故的属性值和属性类别,并根据所述确定历史交通事故特征表d,其中,所述事故特征表包括时间属性、空间属性、事故本身属性和天气属性。8.根据权利要求7所述的考虑交通事故分类的事故下交通量预测系统,其特征在于,所述交通事故归类模块基于所述历史交通事故特征表采用随机森林方法构建交通事故归类
模型的具体实现为:根据所述历史交通事故特征表d划分第一训练集和第一测试集;采用bootstrap有放回随机取样方法从所述第一训练集采样k次,每次抽取所述第一训练集中的事故样本,得到k个训练样本;从所述历史交通事故特征表中所有的m个事故特征中随机抽取m(m<m)个事故特征,根据所述训练样本和抽取的m个事故特征分别生成相应的k棵基决策树,并构造随机森林交通事故归类模型;将所述第一测试集中的特征值输入至所述随机森林交通事故归类模型,并对所述随机森林交通事故归类模型的参数进行调校,得到最终的随机森林交通事故归类模型。9.根据权利要求7所述的考虑交通事故分类的事故下交通量预测系统,其特征在于,所述交通量预测模块分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入所述交通事故下交通量预测模型进行训练和测试的具体实现为:根据所述交通量数据集b划分各个类别的第二训练集和第二测试集;对所述第二训练集中的交通量时间序列数据进行归一化处理,并映射到区间[0,1]内,表达式为:q
′
=(q-q
min
)/(q
max-q
min
)式中,q
′
为归一化后的交通量时间序列数据;q为第二训练集的交通量时间序列数据;q
min
为第二训练集中的交通量时间序列数据的最小值;q
max
为第二训练集中的交通量时间序列数据的最大值;分类建立交通事故下交通量预测模型,并将归一化后的所述第二训练集中的交通量时间序列数据作为输入进行bp神经网络进行训练,得到对应的多个基于bp神经网络的交通量预测模型;分别将各类所述交通量数据集b中的第二测试集作为所述交通事故下交通量预测模型的输入进行测试,并对所述交通事故下交通量预测模型的参数进行调校,得到最终的交通事故下交通量预测模型。10.一种可读存储介质,其特征在于,所述可读存储介质中包括考虑交通事故分类的事故下交通量预测方法程序,所述考虑交通事故分类的事故下交通量预测方法程序被处理器执行时,实现如权利要求1至5中任一项所述的方法的步骤。
技术总结
本发明涉及一种考虑交通事故分类的事故下交通量预测方法及系统,其方法包括基于交通事故持续时间的事故分类,建立历史交通事故特征表和分类的交通量数据集;基于历史交通事故特征表采用随机森林方法构建交通事故归类模型;分类建立交通事故下交通量预测模型,并将归类的交通量数据集输入交通事故下交通量预测模型进行训练和测试,再对目标交通量时间序列数据进行预测,得到考虑交通事故分类的事故下目标交通量预测结果。考虑交通事故对交通的影响等级不同,基于交通事故持续时间将事故划分为几个不同的类别分别建立交通量预测模型,实现将事故按照其影响特征进行归类后使用对应类别的预测模型进行预测,以削减交通事故异质性对交通量预测的影响。质性对交通量预测的影响。质性对交通量预测的影响。
技术研发人员:何雅琴 孔嫣兰 汤文 肖宇 孔杨
受保护的技术使用者:武汉科技大学
技术研发日:2022.12.31
技术公布日:2023/6/27
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
