一种目标城市交通事故严重程度分析方法

未命名 07-17 阅读:77 评论:0


1.本发明涉及一种目标城市交通事故严重程度分析方法,属于交通安全技术领域。


背景技术:

2.道路交通事故已成为许多国家人员伤亡的主要原因之一,给社会带来了沉重的代价。近十年来,基于道路交通事故的历史数据,建模并分析导致交通事故发生的影响因素,已成为交通安全领域广泛采用的研究手段。交通事故因果分析的研究成果,可为交通管理部门制定预防交通事故发生方面的政策,提供建议和启示,因而具有较强的实际应用价值。
3.在现有的交通事故分析中,研究者往往假设目标城市存在大量完备的交通事故数据。明显地,收集完备的交通事故数据,需要在每一条城市道路上安装大量监控设备,并付出大量的人力和财力,进行设备监管和数据处理。事实上,一些低发展水平的城市,往往很难承受如此高昂的数据采集成本。在一些高发展水平的城市,即使交通管理部门已经收集到了完备的交通事故数据,但由于数据隐私方面的考虑,只有少量低敏的事故数据可以被获取。基于以上分析可知,在实际的交通事故分析中,目标城市少数据是必须要面临和解决的一个重要问题。
4.在交通事故严重程度分析中,还存在类别不平衡问题,即导致人员死亡、严重受伤的严重事故的样本数要远小于导致人员轻微受伤、无受伤的不严重事故的样本数。研究者常采用重采样的技术解决事故严重程度分析中的类别不平衡问题,但是,无论是对少数严重事故样本进行过采样,还是对多数不严重事故进行欠采样,重采样方法改变了原始事故数据的数据分布,很容易导致局部最优的预测结果,不利于交通事故的准确分析。


技术实现要素:

5.为了解决交通事故严重程度分析中的少数据和类别不平衡影响分析准确性的问题,本发明提出了一种目标城市交通事故严重程度分析方法,引入跨城市交通事故数据和代价敏感分类模型,在仅使用少量目标城市交通事故数据的条件下,准确获得导致目标城市交通事故不同严重程度的影响因素。
6.为解决上述技术问题,本发明采用了如下技术手段:
7.本发明提出了一种目标城市交通事故严重程度分析方法,包括如下步骤:
8.获取不同城市的交通事故数据,根据每个城市的交通事故数据量确定目标城市和源城市;
9.利用统一特征表示法将分布于异构特征空间的目标城市和源城市交通事故数据进行特征对齐,得到跨城市交通事故样本的同构样本特征表示;
10.将跨城市交通事故样本的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,得到导致目标城市交通事故不同严重程度的影响因素。
11.进一步的,目标城市的交通事故数据量小于源城市的交通事故数据量。
12.进一步的,目标城市的交通事故数据进一步的,目标城市的交通事故数据表
示目标城市中第i个交通事故样本,d
t
为目标城市交通事故数据中事故特征的总数,n
t
为目标城市的交通事故样本总数,i=1,2,

,n
t
;源城市的交通事故数据其中,表示源城市中第j个交通事故样本,ds为源城市交通事故数据中事故特征的总数,ns为源城市的交通事故样本总数,j=1,2,

,ns。
13.进一步的,跨城市交通事故样本的同构样本特征表示如下:
[0014][0015]
其中,ufr(x)表示跨城市交通事故样本的同构样本特征表示,x为目标城市交通事故样本或源城市交通事故样本,表示目标城市和源城市中共有的dc维交通事故特征,表示目标城市中特有的d
t-dc维交通事故特征,表示源城市中特有的d
s-dc维交通事故特征。
[0016]
进一步的,将交通事故数据中的严重事故作为正类,不严重数据作为负类,根据统一特征表示后的源城市交通事故样本,通过代价敏感logistic回归训练并获得源城市的事故严重知识w
(s)

[0017]
进一步的,基于源城市的事故严重知识w
(s)
,训练代价敏感的跨城市交通事故分析模型,代价敏感的跨城市交通事故分析模型的目标函数为:
[0018][0019]
其中,w
(t)
表示logistic回归的似然参数,c
+
表示正类样本的错分代价,n
t
为目标城市的交通事故样本总数,表示目标城市中第i个交通事故样本,表示样本的类别,表示样本为正类,表示样本经过统一特征表示后的同构样本特征表示,c
_
表示负类样本的错分代价,表示样本为负类,λ为跨城市知识迁移的强度系数,i=1,2,

,n
t
,n
t
为目标城市的交通事故样本总数;
[0020][0021]
其中,表示同构样本特征表示属于类的后验概率。
[0022]
进一步的,得到导致目标城市交通事故不同严重程度的影响因素的方法为:
[0023]
将目标城市的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,通过求解代价敏感的跨城市交通事故分析模型的目标函数,得到用于分析目标城市事故严重程度的logistic回归的似然参数w
(t)

[0024]
基于logistic回归的似然参数w
(t)
,针对任一目标城市交通事故样本通过计算其后验概率关于目标城市交通事故样本任意分量的偏导数,得到定量分析规则:如果则第k个事故特征对导致严重事故起正相关作用;如果则第k个事故特征对导致不严重事故起正相关作
用;其中,表示目标城市交通事故数据中第k维事故特征对应的似然参数,k=1,

,d
t
,d
t
为目标城市交通事故数据中事故特征的总数。
[0025]
采用以上技术手段后可以获得以下优势:
[0026]
本发明提出了一种目标城市交通事故严重程度分析方法,利用数据量较多的源城市交通事故数据和代价敏感分类模型进目标城市交通事故严重程度分析,首先通过统一特征表示法对目标城市和源城市交通事故数据进行特征对齐,进而得到统一的、利于分析的同构样本特征表示,然后利用源城市交通事故数据训练跨城市交通事故分析模型,得到对多数类和少数类样本无偏的代价敏感的跨城市交通事故分析模型,最后通过代价敏感的跨城市交通事故分析模型准确获得导致目标城市交通事故不同严重程度的影响因素。本发明能够在仅使用少量目标城市交通事故数据的条件下进行准确可靠的交通事故分析,解决了现有技术中少数据和类别不平衡的问题,能够为交通管理部门制定预防交通事故发生方面的政策提供建议和启示,具有较高的实用价值。
附图说明
[0027]
图1为本发明一种目标城市交通事故严重程度分析方法的步骤流程图。
具体实施方式
[0028]
下面结合附图对本发明的技术方案作进一步说明:
[0029]
本发明提出了一种目标城市交通事故严重程度分析方法,如图1所示,具体包括如下步骤:
[0030]
步骤a、获取不同城市的交通事故数据,根据每个城市的交通事故数据量确定目标城市和源城市。每个城市的交通事故数据均包含多个交通事故样本,交通事故样本需要包含该起交通事故发生前、后一段时间内的时空信息,比如事故发生时间、天气情况、事故地点、道路交通情况、事故撞击的方式、是否有人员伤亡、是否肇事逃逸等。
[0031]
本发明收集少量目标城市交通事故,记为本发明收集少量目标城市交通事故,记为其中,表示目标城市中第i个交通事故样本,d
t
为目标城市交通事故数据中事故特征的总数,事故特征指事故发生时间、天气情况、事故地点、道路交通情况、事故撞击的方式、是否有人员伤亡、是否肇事逃逸等,n
t
为目标城市的交通事故样本总数,i=1,2,

,n
t
。本发明选择存在大量交通事故数据的城市作为源城市,源城市的交通事故数据记为其中,表示源城市中第j个交通事故样本,ds为源城市交通事故数据中事故特征的总数,ns为源城市的交通事故样本总数,j=1,2,

,ns。
[0032]
在本发明实施例中,目标城市可以是已知城市,根据目标城市确定源城市,要求目标城市的交通事故数据量小于源城市的交通事故数据量。理论上,除了目标城市之外的任何城市都可以作为源城市,但是在实际选择源城市时需要考虑以下两点:
[0033]
1、考虑到交通事故分析的严谨性、合理性,源城市的交通事故数据量应该远大于目标城市的交通事故数据量,即n
t
<<ns,因此,本发明要选择交通事故数据量尽可能多的城市作为源城市,以便后续基于源城市交通事故数据分析目标城市的交通事故情况。
[0034]
2、考虑到跨城市共有事故知识的可解释性,本发明假设目标城市和源城市的交通
事故数据至少存在一个共同的事故特征,也即dc≥1;为了满足这一假设,本发明选择与目标城市交通事故数据有尽量多共同特征的城市作为源城市。
[0035]
步骤b、利用统一特征表示法将分布于异构特征空间的目标城市和源城市交通事故数据进行特征对齐,得到跨城市交通事故样本的同构样本特征表示,以便后续进行相似性计算。跨城市交通事故样本既包括目标城市交通事故样本信息又包括源城市交通事故样本信息。
[0036]
在本发明实施例中,跨城市交通事故样本的同构样本特征表示如下:
[0037][0038]
其中,ufr(x)表示跨城市交通事故样本的同构样本特征表示,x为目标城市交通事故样本或源城市交通事故样本,表示目标城市和源城市中共有的dc维交通事故特征,表示目标城市中特有的d
t-dc维交通事故特征,表示源城市中特有的d
s-dc维交通事故特征。
[0039]
在本发明实施例中,如果令x表示目标城市交通事故样本,采用公式(4)可得目标城市的同构样本特征表示其中,类似的,如果令x表示源城市交通事故样本,采用公式(4)可得源城市的同构样本特征表示其中,
[0040]
步骤c、将跨城市交通事故样本的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,得到导致目标城市交通事故不同严重程度的影响因素。
[0041]
在本发明实施例中,定义导致人员死亡或重伤的交通事故为严重事故,其他交通事故为不严重事故,将交通事故数据中的严重事故作为正类(+1),不严重数据作为负类(-1)。
[0042]
步骤c01、通过分类器分析交通事故严重性,本发明可以选用代价敏感logistic回归模型或支持向量机模型。在本发明实施例中,采用代价敏感logistic回归模型。根据统一特征表示后的源城市交通事故样本,通过代价敏感logistic回归训练并获得源城市的logistic回归的似然参数w
(s)
,也即源城市的事故严重知识,能够用于源城市事故严重程度预测。
[0043]
源城市交通事故对应的代价敏感logistic回归模型的目标函数如下:
[0044][0045]
其中,c
+
表示正类样本的错分代价,表示源城市交通事故数据中正类样本的数量,表示样本的类别,表示样本为正类,表示样本经过统一特征表示后的同构样本特征表示,c
_
表示负类样本的错分代价,表示源城市交通事故数据中负类样本的数量,表示样本为负类。
[0046][0047]
其中,表示同构样本特征表示属于类的后验概率。
[0048]
步骤c02、基于源城市的事故严重知识w
(s)
,训练代价敏感的跨城市交通事故分析模型,将目标城市的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,通过求解代价敏感的跨城市交通事故分析模型的目标函数,得到用于分析目标城市事故严重程度的logistic回归的似然参数w
(t)

[0049]
代价敏感的跨城市交通事故分析模型的目标函数为:
[0050][0051]
其中,w
(t)
表示logistic回归的似然参数,表示样本的类别,表示样本为正类,表示样本经过统一特征表示后的同构样本特征表示,表示样本为负类,λ为跨城市知识迁移的强度系数。
[0052][0053]
其中,表示同构样本特征表示属于类的后验概率。
[0054]
由于目标城市存在少数据问题,即n
t

0,所以通过代价敏感logistic回归模型往往只能学得带偏的似然参数w
(t)
,但是源城市具有更完备的事故样本,所以容易学得源城市无偏的似然参数w
(s)
,为了利用无偏的似然参数w
(s)
指导目标城市有偏的似然参数w
(t)
的学习,本发明公式(7)通过最小化实现城市间的共有事故严重知识,从源城市到目标城市的知识迁移。
[0055]
在公式(7)中,参数λ用于控制跨城市知识迁移的强度,λ的值可以是人为给定的经验值,也可以通过交叉验证的模型训练方法,获得最优的λ值,λ值越大,知识迁移的强度越大。
[0056]
在本发明实施例中,可以采用liblinear matlab工具包,求解模型目标函数,并获得似然参数。
[0057]
步骤c03、基于logistic回归的似然参数w
(t)
,表示目标城市交通事故数据中第k维事故特征对应的似然参数,针对任一目标城市交通事故样本通过计算其后验概率关于目标城市交通事故样本任意分量的偏导数,得到定量分析规则:如果则第k个事故特征对导致严重事故起正相关作用;如果则第k个事故特征对导致不严重事故起正相关作用;其中,k=1,

,d
t

[0058]
通过上述分析可以得到交通事故中每个事故特征对交通事故严重程度的影响,将对导致严重事故起正相关作用的事故特征和对导致不严重事故起正相关作用的事故特征
划分开来后,作为导致目标城市交通事故不同严重程度的影响因素。
[0059]
与现有技术相比,本发明引入了跨城市交通事故数据和代价敏感分类模型,能够在仅收集了少量目标城市事故样本数据以及事故数据存在类别不平衡问题的情况下,进行准确可靠的交通事故分析,找出导致交通事故不同严重程度的影响因素,能够为交通管理部门制定预防交通事故发生方面的政策提供建议和启示,具有较高的实用价值。
[0060]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

技术特征:
1.一种目标城市交通事故严重程度分析方法,其特征在于,包括如下步骤:获取不同城市的交通事故数据,根据每个城市的交通事故数据量确定目标城市和源城市;利用统一特征表示法将分布于异构特征空间的目标城市和源城市交通事故数据进行特征对齐,得到跨城市交通事故样本的同构样本特征表示;将跨城市交通事故样本的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,得到导致目标城市交通事故不同严重程度的影响因素。2.根据权利要求1所述的一种目标城市交通事故严重程度分析方法,其特征在于,目标城市的交通事故数据量小于源城市的交通事故数据量。3.根据权利要求1所述的一种目标城市交通事故严重程度分析方法,其特征在于,目标城市的交通事故数据表示目标城市中第i个交通事故样本,d
t
为目标城市交通事故数据中事故特征的总数,n
t
为目标城市的交通事故样本总数,i=1,2,

,n
t
;源城市的交通事故数据其中,表示源城市中第j个交通事故样本,d
s
为源城市交通事故数据中事故特征的总数,n
s
为源城市的交通事故样本总数,j=1,2,

,n
s
。4.根据权利要求3所述的一种目标城市交通事故严重程度分析方法,其特征在于,跨城市交通事故样本的同构样本特征表示如下:其中,ufr(x)表示跨城市交通事故样本的同构样本特征表示,x为目标城市交通事故样本或源城市交通事故样本,表示目标城市和源城市中共有的d
c
维交通事故特征,表示目标城市中特有的d
t-d
c
维交通事故特征,表示源城市中特有的d
s-d
c
维交通事故特征。5.根据权利要求1所述的一种目标城市交通事故严重程度分析方法,其特征在于,将交通事故数据中的严重事故作为正类,不严重数据作为负类,根据统一特征表示后的源城市交通事故样本,通过代价敏感logistic回归训练并获得源城市的事故严重知识w
(s)
。6.根据权利要求5所述的一种目标城市交通事故严重程度分析方法,其特征在于,基于源城市的事故严重知识w
(s)
,训练代价敏感的跨城市交通事故分析模型,代价敏感的跨城市交通事故分析模型的目标函数为:其中,w
(t)
表示logistic回归的似然参数,c
+
表示正类样本的错分代价,n
t
为目标城市的交通事故样本总数,表示目标城市中第i个交通事故样本,表示样本的类别,表示样本为正类,表示样本经过统一特征表示后的同构样本特征表示,c_表示负类样本的错分代价,表示样本为负类,λ为跨城市知识迁移的强度系数,i=1,2,

,n
t
,n
t
为目标城市的交通事故样本总数;
其中,表示同构样本特征表示属于类的后验概率。7.根据权利要求1或6所述的一种目标城市交通事故严重程度分析方法,其特征在于,得到导致目标城市交通事故不同严重程度的影响因素的方法为:将目标城市的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,通过求解代价敏感的跨城市交通事故分析模型的目标函数,得到用于分析目标城市事故严重程度的logistic回归的似然参数w
(t)
;基于logistic回归的似然参数w
(t)
,针对任一目标城市交通事故样本通过计算其后验概率关于目标城市交通事故样本任意分量的偏导数,得到定量分析规则:如果则第k个事故特征对导致严重事故起正相关作用;如果则第k个事故特征对导致不严重事故起正相关作用;其中,表示目标城市交通事故数据中第k维事故特征对应的似然参数,k=1,

,d
t
,d
t
为目标城市交通事故数据中事故特征的总数。

技术总结
本发明公开了一种目标城市交通事故严重程度分析方法,其包括:获取不同城市的交通事故数据,根据每个城市的交通事故数据量确定目标城市和源城市;利用统一特征表示法将分布于异构特征空间的目标城市和源城市交通事故数据进行特征对齐,得到跨城市交通事故样本的同构样本特征表示;将跨城市交通事故样本的同构样本特征表示带入代价敏感的跨城市交通事故分析模型,得到导致目标城市交通事故不同严重程度的影响因素。本发明能够在仅使用少量目标城市交通事故数据的条件下,准确获得导致目标城市交通事故不同严重程度的影响因素。城市交通事故不同严重程度的影响因素。城市交通事故不同严重程度的影响因素。


技术研发人员:万建武 霍冠英 李庆武 王连涛 闵超波
受保护的技术使用者:河海大学
技术研发日:2022.11.28
技术公布日:2023/6/27
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐