基于大规模浮动车轨迹数据的区域交通事故风险分析方法

未命名 08-03 阅读：157 评论：0

1.本发明涉及城市路网交通安全分析领域，尤其涉及一种基于大规模浮动车轨迹数据的路网区域交通事故风险分析方法。

背景技术：

2.在交通工程领域，城市路网区域交通事故风险分析是交通安全中重要研究之一。城市道路网络是多要素综合作用下的复杂开放巨系统，具有多样性、随机性、动态性和非线性等典型特征。区域交通事故风险分析是对城市路网交通系统进行全面调查和分析，识别路网中风险源及定义潜在风险特征，找到风险向事故转化条件的过程。其核心是通过对人的不安全行为、车辆的不安全状态、道路的不安全条件、外界环境影响的单因素风险分析和它们之间的关联耦合风险建模。城市路网区域交通事故风险分析最终目标是探讨如何在全局路网环境下，将风险控制在可接受水平，通过战略规划、路网布局、监督执行实现对已识别风险因素和重大危险源的改进和完善。
3.对现有研究进行分析，目前城市路网侧重数据采集和管理方面，有关交通大数据等新一代的信息技术在交通安全分析方面的研究尚有不足，如何通过数据驱动的方法辨识路网区域交通事故风险问题是目前的难题。寻求一种如何有效的利用城市大规模的浮动车轨迹数据，生成结构简单、运行迅速的数据处理方法，又兼顾实时的交通风险辨识系统成为本领域技术人员需持续研究的课题。

技术实现要素：

4.发明目的：本发明的目的是提供一种采用城市路网大规模精细化浮动车轨迹数据作为数据支撑，通过数据驱动方法对区域交通事故风险进行识别的路网区域交通事故风险分析方法。
5.技术方案：本发明的区域交通事故风险分析方法，包括如下步骤：
6.s1，采用断裂gps定位融合匹配的改进dijkstra时空轨迹重构算法，对城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配；
7.s2，结合城市建成环境数据和去噪的时空轨迹数据，采用全天候-多时段融合的星期-小时-用地类型多维度标签化处理方法，得到复杂多维单位时间内活动鉴别标签，进一步生成浮动车全天候多维复杂的活动标签；
8.s3，采用将相似度和困惑度双指标分层加权评价的升级max s-p潜在狄利克雷分配模型，对各交通分区内全天候活动标签进行文本聚类分析，挖掘各交通分区浮动车潜在的时空活动特征；
9.s4，在deeplift网络基础上，采用双层耦合图卷积神经网络可解释模型，构建结合浮动车潜在的时空活动特征、路网属性、交通设施、社会人口经济特征的城市路网区域交通事故风险分析模型，进而得到交通事故风险影响因素的重要性排序和deeplift双层耦合图卷积神经网络可解释模型中间层的权重。
10.进一步，步骤s1中，城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配的实现步骤如下：
11.s11，选取在特定区域范围内且在连续一段时间内速度不为零的浮动车轨迹；
12.s12，删除缺失必要信息的轨迹数据；
13.s13，将选取的浮动车轨迹匹配至城市道路网络，得到浮动车运行轨迹。
14.进一步，将选取的浮动车轨迹匹配至城市道路网络，得到浮动车运行轨迹的具体实现步骤如下：
15.s131，设浮动车在某时间段内不重复行驶同一路段，如果重复，则保留首次路段记录；
16.s132，每个轨迹点映射唯一的路网路段；
17.s133，按照途径的道路唯一性、路段连通性以及最短路径原则，得到浮动车时空运行轨迹。
18.进一步，步骤s2中，生成浮动车全天候多维复杂的活动标签的具体实现步骤如下：
19.s21，浮动车轨迹的关键特征包括星期、小时和土地利用类型，将这些关键特性组合在一起，提取描述车辆全天候多时段复杂多维的活动标签；
20.s22，按照一定的间隔时间统计该时间段中频率最高的活动标签，定义浮动车该统计时间段内的活动标签；
21.s23，按照步骤s21和s22得到城市范围内各浮动车全天候多时段多维复杂的活动标签。进一步，步骤s3中，挖掘各交通分区浮动车潜在的时空活动特征的具体实现步骤如下：
22.s31，将每个标签视为主题的一个单词，每个活动视为文档的一个主题，每个交通分区的轨迹记录视为一个语料库的文档；根据活动标签的定义，将整个数据集中的活动标签按其空间位置分配给每个交通分区；
23.s32，采用吉布斯抽样法估计max s-p升级潜在狄利克雷分配模型；潜在狄利克雷分配模型分布期望为：
[0024][0025][0026]
其中，k代表潜在车辆时空活动特征的数量，l＝{l1，l2，...，ln}为轨迹记录文档生成的潜在出行特征的主题合集，n代表每个潜在车辆时空活动特征的标签数量，m代表交通分区的数量，代表每个潜在车辆活动特征k中活动特征标签l的混合权重，代表每个潜在车辆活动特征k中活动特征l的标签数量，β
l
代表模型训练生成主题l对应的先验词分布，θ
k，m
代表交通分区m中活动特征标签k的混合权重，代表交通分区m中活动特征k的标签数量，αk代表lda通过训练生成文本对应的先验主题分布；
[0027]
选用max s-p函数得到模型最优的时空活动特征个数：
[0028][0029][0030]
max s-p＝max(similarity(d)-perplexity(d)/10x)
[0031]
0≤|perplexity(d)/10x|≤1，x∈n
[0032]
其中，d＝{d1，d2，...，dm}为轨迹记录文档合集，dm代表交通分区m的轨迹记录文档，p(w)代表轨迹记录文档d生成词语w的概率，nd代表文档d中每个潜在车辆时空活动特征的标签数量，c代表各交通分区与潜在车辆时空活动特征数量生成的稀疏矩阵；a、b代表任意两个交通分区；c
ak
代表交通分区a与潜在车辆时空活动特征数量k生成的稀疏矩阵，c
bk
代表交通分区b与潜在车辆时空活动特征数量k生成的稀疏矩阵。
[0033]
进一步，步骤s4中，构建城市路网区域交通事故风险分析模型，得到交通事故风险影响因素的重要性排序和deeplift双层耦合图卷积神经网络可解释模型中间层的权重的具体实现步骤如下：
[0034]
s41，首先获取每个交通分区的特征并用x表示，其中包括浮动车时空出行活动特征、道路网络、交通设施、天气情况、地理信息数据、社会经济因素，同时计算邻接矩阵
[0035][0036]
其中，代表城市各个交通分区图的度矩阵。
[0037]
s42，将该邻接矩阵输入到deeplift双层耦合图卷积神经网络可解释模型f(x，a)中，得到每个标签的预测结果：
[0038][0039]
其中，w0为第一层的权值矩阵，用于将交通分区的特征表示映射为相应的隐层状态；w1为第二层的权值矩阵，用于将交通分区的隐层表示映射为相应的输出，softmax和relu为激活函数；
[0040]
s43，在deeplift双层耦合图卷积神经网络可解释模型中为探究各输入指标对区域事故风险的影响，该模型为每个输入xi赋予一个参考值ri，αxi＝x
i-ri，αxi值表示原输入xi被设置为一个参考值的效果；通过映射函数x＝h
x
(xi)映射到原始输入xi，其中特征梯度1表示输入接受其原始值xi，特征的梯度0表示输入接受引用值ri，则每次输入参考值变化效果αxi的贡献为：
[0041][0042]
其中，z＝f(x，a)是模型的预测结果，αz＝f(x，a)-f(r，a)，n为交通分区的特征个数；deeplift双层耦合图卷积神经网络可解释模型对每个交通分区的特征属性效果进行排序，并将所有特征属性的效果相加，以逼近原始模型的输出z，得到每个交通分区的预测结果和各因素对事故频次影响的重要性排序，以及可视化deeplift双层耦合图卷积神经网络可解释模型的中间层权重。
[0043]
本发明与现有技术相比，其显著效果如下：
[0044]
1、本发明将城市路网区域交通事故风险与浮动车轨迹特征相结合，从宏观的角度看时空活动特征对交通安全的影响，为交通安全管理系统的实时风险分析提供方法支撑；
[0045]
2、本发明通过对浮动车轨迹特征的捕捉和分析，可为城市路网交通事故的前兆特征和演变规律提供技术支持，为交通安全管理与控制系统提供方法和数据支撑。
附图说明
[0046]
图1为本发明的总体流程图；
[0047]
图2为本发明的全天候多时段多维复杂的活动标签提取示意图。
具体实施方式
[0048]
下面结合说明书附图和具体实施方式对本发明做进一步详细描述。
[0049]
本发明在已有的交通安全分析研究的基础上，基于高精度车辆轨迹数据、地理信息数据和道路网络结构等多源异构数据，建立数据驱动的深度学习模型刻画变量与交通事故风险之间的耦合关系，结合可解释模型揭示变量因素对交通事故风险的影响机理，进而探索城市路网事故风险的复杂时空关联性，为交通规划、交通安全设计等领域提供基础理论与方法。
[0050]
如图1所示，一种基于大规模浮动车轨迹数据的区域交通事故风险分析方法，包括如下步骤：
[0051]
步骤1，采用断裂gps定位融合匹配的改进dijkstra时空轨迹重构算法，见表1，对城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配，具体包括如下子步骤：
[0052]
步骤11，选取在研究区域范围内的浮动车轨迹。
[0053]
步骤12，删除由车辆仪表故障引起的不合理浮动车轨迹。
[0054]
步骤121，删除缺失必要信息的轨迹数据，例如位置经纬度、时间、速度等信息缺失；
[0055]
步骤122，速度在连续时间内为零，则认为该浮动车轨迹不合理，删除该浮动车轨迹。
[0056]
步骤13，将选取的浮动车轨迹匹配至城市道路网络，得到浮动车运行轨迹。
[0057]
步骤131，假设浮动车每统计时间内(例如8分钟、10分钟、15分钟)不重复行驶同一路段，如果重复，则保留首次路段记录；
[0058]
步骤132，每个轨迹点映射唯一的路网路段；
[0059]
步骤133，按照途径的道路唯一性、路段连通性以及最短路径原则，得到浮动车时空运行轨迹。
[0060]
表1断裂gps定位融合匹配的改进dijkstra时空轨迹重构算法
[0061]
[0062]
[0063][0064]
步骤2，结合城市建成环境数据和去噪的时空轨迹数据，采用全天候-多时段融合计算下的星期-小时-用地类型多维度标签化处理方法，得到复杂多维单位时间内活动鉴别标签，进一步生成浮动车全天候多维复杂的活动标签，具体实现步骤如下：
[0065]
步骤21，浮动车轨迹的关键特征用于提取描述车辆全天候多时段复杂多维的活动标签。通过浮动车轨迹的时间信息，提取星期和小时的时间特征，通过浮动车轨迹的位置与地理信息数据集相匹配，得到该浮动车所在区域的土地利用特征，最后将星期、小时和土地利用类型这些关键特性组合在一起。
[0066]
步骤22，按照一定的间隔时间统计该时间段中频率最高的活动标签，定义浮动车该统计时间段内的活动标签。例如，如图2所示，其中图2中注释见表2：
[0067]
表2浮动车轨迹与标签注释表
[0068][0069]
将间隔时间定义为15分钟，一辆浮动车n记录了9点到9点15分的轨迹，按照星期-小时-土地利用关键特征组合在一起，由于该浮动车在星期三九点在商业区域活动最频繁，因此该辆浮动车15分钟内的浮动车活动标签为星期三-九点-商业。
[0070]
步骤23，将步骤21和步骤22的方法应用至全天候各时段，得到城市范围内各浮动车全天候多时段多维复杂的活动标签。
[0071]
步骤3，采用将相似度和困惑度双指标分层加权评价的升级max s-p潜在狄利克雷分配模型，对各交通分区内全天候活动标签进行文本聚类分析，挖掘各交通分区浮动车潜在的时空活动特征，具体的实现步骤如下：
[0072]
步骤31，在本实施例中，活动标签是基于相似度和困惑度双指标分层加权评价的升级max s-p潜在狄利克雷分配模型探索活动模式的基本分析单位。每个标签都被视为主题的一个单词，每个活动都被视作为文档的一个主题，每个交通分区的轨迹记录被视为一
个语料库的文档。此外，根据活动标签的定义，将整个数据集中的活动标签按其空间位置分配给每个交通分区。
[0073]
步骤32，采用吉布斯抽样法估计max s-p升级潜在狄利克雷分配模型。潜在狄利克雷分配模型分布期望为：
[0074][0075][0076]
其中，d＝{d1，d2，...，dm}为轨迹记录文档合集，dm代表交通分区m的轨迹记录文档，p(w)代表轨迹记录文档d生成词语w的概率，nd代表文档d中每个潜在车辆时空活动特征的标签数量，c代表各交通分区与潜在车辆时空活动特征数量生成的稀疏矩阵，a，b代表任意两个交通分区，c
ak
代表交通分区a与潜在车辆时空活动特征数量k生成的稀疏矩阵，c
bk
代表交通分区b与潜在车辆时空活动特征数量k生成的稀疏矩阵。选用max s-p函数得到模型最优的时空活动特征个数：
[0077][0078][0079]
max s-p＝max(similarity(d)-perplexity(d)/10x)
[0080]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0081]
0≤|perplexity(d)/10x|≤1，x∈n
[0082]
其中，d＝{d1，d2，...，dm}为轨迹记录文档合集，dm代表交通分区m的轨迹记录文档，p(w)代表轨迹记录文档d生成词语w的概率，nd代表文档d中每个潜在车辆时空活动特征的标签数量，c代表各交通分区与潜在车辆时空活动特征数量生成的稀疏矩阵，a、b代表任意两个交通分区，c
ak
代表交通分区a与潜在车辆时空活动特征数量k生成的稀疏矩阵，c
bk
代表交通分区b与潜在车辆时空活动特征数量k生成的稀疏矩阵。
[0083]
步骤4，在deeplift网络基础上提出了双层耦合图卷积神经网络可解释模型，构建结合浮动车潜在的时空活动特征、路网属性、交通设施、社会人口经济特征等指标的城市路网区域交通事故风险分析模型，进而得到交通事故风险影响因素的重要性排序和deeplift双层耦合图卷积神经网络可解释模型中间层的权重，具体实现步骤如下：
[0084]
步骤41，首先获取每个交通分区的特征并用x表示，其中包括浮动车时空出行活动特征、道路网络、交通设施、天气情况、地理信息数据、社会经济因素，同时计算邻接矩阵
[0085][0086]
其中，为城市各个交通分区图的度矩阵。
[0087]
步骤42，然后将该邻接矩阵输入到deeplift双层耦合图卷积神经网络可解释模型f(x，a)中，得到每个标签的预测结果：
[0088]
[0089]
其中，w0为第一层的权值矩阵，用于将交通分区的特征表示映射为相应的隐层状态。w1为第二层的权值矩阵，用于将交通分区的隐层表示映射为相应的输出，softmax和relu为激活函数。
[0090]
步骤43，在deeplift双层耦合图卷积神经网络可解释模型中为探究各输入指标对区域事故风险的影响，该模型为每个输入xi赋予一个参考值ri，αxi＝x
i-ri，αxi值表示原输入xi被设置为一个参考值的效果；通过映射函数x＝h
x
(xi)映射到原始输入xi，其中特征梯度1表示输入接受其原始值xi，特征的梯度0表示输入接受引用值ri，则每次输入参考值变化效果δxi的贡献为：
[0091][0092]
其中，z＝f(x，a)是模型的预测结果，αz＝f(x，a)-f(r，a)，n为交通分区的特征个数；deeplift双层耦合图卷积神经网络可解释模型对每个交通分区的特征属性效果进行排序，并将所有特征属性的效果相加，以逼近原始模型的输出z，即可得到每个交通分区的预测结果和各因素对事故频次影响的重要性排序，以及可视化deeplift双层耦合图卷积神经网络可解释模型的中间层权重。

技术特征：
1.一种基于大规模浮动车轨迹数据的区域交通事故风险分析方法，其特征在于，包括如下步骤：s1，采用断裂gps定位融合匹配的改进dijkstra时空轨迹重构算法，对城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配；s2，结合城市建成环境数据和去噪的时空轨迹数据，采用全天候-多时段融合的星期-小时-用地类型多维度标签化处理方法，得到复杂多维单位时间内活动鉴别标签，进一步生成浮动车全天候多维复杂的活动标签；s3，采用将相似度和困惑度双指标分层加权评价的升级max s-p潜在狄利克雷分配模型，对各交通分区内全天候活动标签进行文本聚类分析，挖掘各交通分区浮动车潜在的时空活动特征；s4，在deeplift网络基础上，采用双层耦合图卷积神经网络可解释模型，构建结合浮动车潜在的时空活动特征、路网属性、交通设施、社会人口经济特征的城市路网区域交通事故风险分析模型，进而得到交通事故风险影响因素的重要性排序和deeplift双层耦合图卷积神经网络可解释模型中间层的权重。2.根据权利要求1所述基于大规模浮动车轨迹数据的区域交通事故风险分析方法，其特征在于，步骤s1中，城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配的实现步骤如下：s11，选取在特定区域范围内且在连续一段时间内速度不为零的浮动车轨迹；s12，删除缺失必要信息的轨迹数据；s13，将选取的浮动车轨迹匹配至城市道路网络，得到浮动车运行轨迹。3.根据权利要求2所述基于大规模浮动车轨迹数据的区域交通事故风险分析方法，其特征在于，将选取的浮动车轨迹匹配至城市道路网络，得到浮动车运行轨迹的具体实现步骤如下：s131，设浮动车在某时间段内不重复行驶同一路段，如果重复，则保留首次路段记录；s132，每个轨迹点映射唯一的路网路段；s133，按照途径的道路唯一性、路段连通性以及最短路径原则，得到浮动车时空运行轨迹。4.根据权利要求1所述基于大规模浮动车轨迹数据的区域交通事故风险分析方法，其特征在于，步骤s2中，生成浮动车全天候多维复杂的活动标签的具体实现步骤如下：s21，浮动车轨迹的关键特征包括星期、小时和土地利用类型，将这些关键特性组合在一起，提取描述车辆全天候多时段复杂多维的活动标签；s22，按照一定的间隔时间统计该时间段中频率最高的活动标签，定义浮动车该统计时间段内的活动标签；s23，按照步骤s21和s22得到城市范围内各浮动车全天候多时段多维复杂的活动标签。5.根据权利要求1所述基于大规模浮动车轨迹数据的区域交通事故风险分析方法，其特征在于，步骤s3中，挖掘各交通分区浮动车潜在的时空活动特征的具体实现步骤如下：s31，将每个标签视为主题的一个单词，每个活动视为文档的一个主题，每个交通分区的轨迹记录视为一个语料库的文档；根据活动标签的定义，将整个数据集中的活动标签按其空间位置分配给每个交通分区；
s32，采用吉布斯抽样法估计max s-p升级潜在狄利克雷分配模型；潜在狄利克雷分配模型分布期望为：模型分布期望为：其中，k代表潜在车辆时空活动特征的数量，l＝{l1,l2,
…
,l
n
}为轨迹记录文档生成的潜在出行特征的主题合集，n代表每个潜在车辆时空活动特征的标签数量，m代表交通分区的数量，代表每个潜在车辆活动特征k中活动特征标签l的混合权重，代表每个潜在车辆活动特征k中活动特征l的标签数量，β
l
代表模型训练生成主题l对应的先验词分布，θ
k,m
代表交通分区m中活动特征标签k的混合权重，代表交通分区m中活动特征k的标签数量，α
k
代表lda通过训练生成文本对应的先验主题分布；选用max s-p函数得到模型最优的时空活动特征个数：p函数得到模型最优的时空活动特征个数：max s-p＝max(similarity(d)-perplexity(d)/10x)0≤|perplexity(d)/10x|≤1,x∈n其中，d＝{d1,d2,
…
,d
m
}为轨迹记录文档合集，d
m
代表交通分区m的轨迹记录文档，p(w)代表轨迹记录文档d生成词语w的概率，n
d
代表文档d中每个潜在车辆时空活动特征的标签数量，c代表各交通分区与潜在车辆时空活动特征数量生成的稀疏矩阵；a、b代表任意两个交通分区；c
ak
代表交通分区a与潜在车辆时空活动特征数量k生成的稀疏矩阵，c
bk
代表交通分区b与潜在车辆时空活动特征数量k生成的稀疏矩阵。6.根据权利要求1所述基于浮动车轨迹数据的交通事故风险分析方法，其特征在于，步骤s4中，构建城市路网区域交通事故风险分析模型，得到交通事故风险影响因素的重要性排序和deeplift双层耦合图卷积神经网络可解释模型中间层的权重的具体实现步骤如下：s41，首先获取每个交通分区的特征并用x表示，其中包括浮动车时空出行活动特征、道路网络、交通设施、天气情况、地理信息数据、社会经济因素，同时计算邻接矩阵路网络、交通设施、天气情况、地理信息数据、社会经济因素，同时计算邻接矩阵其中，代表城市各个交通分区图的度矩阵。s42，将该邻接矩阵输入到deeplift双层耦合图卷积神经网络可解释模型f(x,a)中，得到每个标签的预测结果：其中，w0为第一层的权值矩阵，用于将交通分区的特征表示映射为相应的隐层状态；w1为第二层的权值矩阵，用于将交通分区的隐层表示映射为相应的输出，softmax和relu为激
活函数；s43，在deeplift双层耦合图卷积神经网络可解释模型中为探究各输入指标对区域事故风险的影响，该模型为每个输入x
i
赋予一个参考值r
i
，δx
i
＝x
i-r
i
，δx
i
值表示原输入x
i
被设置为一个参考值的效果；通过映射函数x＝h
x
(x
i
)映射到原始输入x
i
，其中特征梯度1表示输入接受其原始值x
i
，特征的梯度0表示输入接受引用值r
i
，则每次输入参考值变化效果δx
i
的贡献为：其中，z＝f(x,a)是模型的预测结果，δz＝f(x,a)-f(r,a)，n为交通分区的特征个数；deeplift双层耦合图卷积神经网络可解释模型对每个交通分区的特征属性效果进行排序，并将所有特征属性的效果相加，以逼近原始模型的输出z，得到每个交通分区的预测结果和各因素对事故频次影响的重要性排序，以及可视化deeplift双层耦合图卷积神经网络可解释模型的中间层权重。

技术总结
本发明公开了一种基于大规模浮动车轨迹数据的区域交通事故风险分析方法，包括以下步骤：S1，采用断裂GPS定位融合匹配的改进Dijkstra时空轨迹重构算法，对城市大规模浮动车轨迹数据进行城市道路网络时空线路匹配；S2，采用全天候-多时段融合的星期-小时-用地类型多维度标签化处理方法，最终生成浮动车全天候多维复杂的活动标签；S3，对各交通分区内全天候活动标签进行文本聚类分析，挖掘各交通分区浮动车潜在的时空活动特征；S4，构建结合浮动车的城市路网区域交通事故风险分析模型，得到交通事故风险影响因素的重要性排序。本发明计算高效，对实现城市路网的交通安全评估具有重要的现实意义。有重要的现实意义。有重要的现实意义。

技术研发人员：赵佳慧刘攀李志斌
受保护的技术使用者：东南大学
技术研发日：2023.03.24
技术公布日：2023/8/1

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：结构体的变形监测方法、图像曝光参数调整方法与流程 下一篇：基于小样本学习的RFID手指踪迹识别方法及装置

基于大规模浮动车轨迹数据的区域交通事故风险分析方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

基于大规模浮动车轨迹数据的区域交通事故风险分析方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表