基于改进PSO优化贝叶斯网络的高速公路事故成因分析方法
未命名
07-15
阅读:115
评论:0
基于改进pso优化贝叶斯网络的高速公路事故成因分析方法
技术领域
1.本技术涉及高速公路事故数据处理领域,特别是涉及高速公路交通事故成因分析方法。
背景技术:
2.在现有的高速公路交通安全管理系统中,在进行事故的成因分析方面,对高速公路交通事故各因素的关联关系确定准确率低,随着机器学习领域的不断发展,智能算法融合到事故数据的分析成为可能,贝叶斯网络是一种有效的概率图模型,可以表示随机变量之间的关联。结构学习是贝叶斯推断的重要部分。而为提高贝叶斯网络结构学习准确度,寻优算法及结构先验被应用于结构学习。传统的寻优算法如离散粒子群、爬山算法等用于贝叶斯网络的结构学习均有收敛速度慢、易陷入局部最优等问题,结构学习准确度有待提高。
技术实现要素:
3.本发明的目的是为了解决现有方法对高速公路交通事故确定各因素的关联关系准确度低的问题,而提出基于改进pso优化贝叶斯网络的高速公路事故成因分析方法。
4.基于改进pso优化贝叶斯网络的高速公路事故成因分析方法系统包括:数据获取模块、关联规则分析模块、贝叶斯网络学习模块、先验知识名单获取模块、罚项模块、评分函数模块、改进粒子群搜索模块、测试模块;
5.所述数据获取模块用于获取数据集;数据集由随机变量组成;
6.所述随机变量指贝叶斯网络中的节点;
7.所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件;
8.所述关联规则分析模块用于根据随机变量间的关联规则,构建关联规则集;
9.所述强关联规则分析模块用于根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;
10.所述贝叶斯网络学习模块用于从数据集中提取频繁项集,对频繁项集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;
11.所述先验知识名单获取模块用于根据强关联规则集和最大频繁项集的贝叶斯网络结构,提取黑白名单,加入先验知识;
12.所述罚项模块用于根据提取的黑白名单数据构建罚项;
13.所述评分函数模块用于根据罚项和bic评分函数得到融合先验知识的正则化评分函数;
14.所述改进粒子群搜索模块用于根据融合先验知识的正则化评分函数以及改进粒子群算法循环搜索得到最优贝叶斯网络结构。
15.测试模块用于将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系。
16.基于改进pso优化贝叶斯网络的高速公路事故成因分析方法具体过程为:
17.步骤一、获取高速公路交通事故中数据集;数据集由随机变量组成;
18.所述随机变量指贝叶斯网络中的节点;
19.所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;
20.步骤二、根据随机变量间的关联规则,构建关联规则集;
21.步骤三、根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;
22.步骤四、从数据集中提取频繁项集,对频繁项数据集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;
23.步骤五、根据强关联规则集和最大频繁项数据集的贝叶斯网络结构,提取黑白名单;根据提取的黑白名单数据构建罚项;
24.步骤六、根据罚项和bic评分函数得到融合先验知识的正则化评分函数;
25.步骤七、根据步骤六得到的融合先验知识的正则化评分函数以及改进粒子群算法对步骤四得到的最大频繁项集的贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构;
26.步骤八、将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系。
27.本发明的有益效果为:
28.本发明获取数据集;数据集由随机变量组成;所述随机变量指贝叶斯网络中的节点;所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;
29.本发明根据随机变量间的关联规则,构建关联规则集;
30.本发明根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;
31.本发明从数据集中提取频繁项集,对频繁项集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;
32.本发明根据强关联规则集和最大频繁项集的贝叶斯网络结构,提取黑白名单,加入先验知识;
33.本发明根据提取的黑白名单数据构建罚项;
34.本发明根据罚项和bic评分函数得到融合先验知识的正则化评分函数;
35.本发明根据融合先验知识的正则化评分函数以及改进粒子群算法进行贝叶斯网络结构学习,循环搜索得到最优贝叶斯网络结构。
36.本发明将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系(高速公路交通事故中各因素的关联)。
37.本发明通过挖掘关联规则及改进离散粒子群算法进行贝叶斯网络结构学习。
38.本发明通过建立随机变量之间的联系,得到先验知识,对离散粒子群算法的粒子速度更新规则进行改进,使用其选择出评分最高的最优贝叶斯网络结构,提高了贝叶斯网络结构学习的准确度,通过最优贝叶斯网络结构能够反映随机变量之间最准确的关联性,该方法有助于帮助高速公路交通管理者在统计分析事故数据时,将各信息输入至计算机中,更好地对道路进行管理及优化。
39.本发明在高速公路管理系统中,各事故的具体信息和道路数据可以视为随机变量,本发明通过改进离散粒子群优化算法来提高结构学习准确度以提高贝叶斯推断模型精度,从而提高对高速公路交通事故确定各因素的关联关系的准确度。
附图说明
40.图1为本发明方法流程图;
41.图2为本发明系统关联关系图;
42.图3为支持度计算过程示意图;
43.图4为改进离散粒子群算法的位置更新示意图;
44.图5为调整后的映射函数图。
具体实施方式
45.具体实施方式一:本实施方式基于改进pso优化贝叶斯网络的高速公路事故成因分析系统包括:数据获取模块、关联规则分析模块、贝叶斯网络学习模块、先验知识名单获取模块、罚项模块、评分函数模块、改进粒子群搜索模块、测试模块;
46.所述数据获取模块用于获取数据集;数据集由随机变量组成;
47.所述随机变量指贝叶斯网络中的节点;
48.所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;
49.所述汽车运行状态为运行车速、转弯/直行等状态;
50.所述道路环境条件为照明情况、路面情况、转弯半径等;
51.所述随机变量对应的样本数据从现有公开数据库中提取;
52.贝叶斯网络的节点代表随机变量;例如在高速公路交通安全领域,随机变量为驾驶员信息、汽车运行状态或道路环境条件(例如照明情况、路面湿滑状况、转弯半径等),这些影响预测任务的要素均可作为预测任务中的随机变量;样本数据就是对贝叶斯网络中所有节点对应的随机变量进行采样的数据,以高速公路交通安全领域为例,样本数据可以为之前所收集到的驾驶员信息、汽车运行状态或道路环境条件等信息。
53.所述关联规则分析模块用于根据随机变量间的关联规则,构建关联规则集;
54.所述强关联规则分析模块用于根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;
55.所述贝叶斯网络学习模块用于从数据集中提取频繁项集,对频繁项集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;
56.所述先验知识名单获取模块用于根据强关联规则集和最大频繁项集的贝叶斯网络结构,提取黑白名单,加入先验知识;
57.所述罚项模块用于根据提取的黑白名单数据构建罚项;
58.所述评分函数模块用于根据罚项和bic评分函数得到融合先验知识的正则化评分函数;
59.所述改进粒子群搜索模块用于根据融合先验知识的正则化评分函数以及改进粒子群算法进行贝叶斯网络结构学习,循环搜索得到最优贝叶斯网络结构。
60.测试模块用于将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络
结构,输出高速公路交通事故中各随机变量之间的关联关系(高速公路交通事故中各因素的关联)。
61.具体实施方式二:本实施方式基于改进pso优化贝叶斯网络的高速公路事故成因分析方法具体过程为:
62.步骤一、获取高速公路交通事故中数据集;数据集由随机变量组成;
63.所述随机变量指贝叶斯网络中的节点;
64.所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;
65.所述汽车运行状态为运行车速、转弯/直行等状态;
66.所述道路环境条件为照明情况、路面情况、转弯半径等;
67.所述随机变量对应的样本数据从现有公开数据库中提取;
68.贝叶斯网络的节点代表随机变量;例如在高速公路交通安全领域,随机变量为驾驶员信息、汽车运行状态或道路环境条件(例如照明情况、路面湿滑状况、转弯半径等),这些影响预测任务的要素均可作为预测任务中的随机变量;样本数据就是对贝叶斯网络中所有节点对应的随机变量进行采样的数据,以高速公路交通安全领域为例,样本数据可以为之前所收集到的驾驶员信息、汽车运行状态或道路环境条件等信息。
69.步骤二、根据随机变量间的关联规则,构建关联规则集;
70.步骤三、根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;
71.步骤四、从数据集中提取频繁项集,对频繁项数据集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;
72.步骤五、根据强关联规则集和最大频繁项数据集的贝叶斯网络结构,提取黑白名单;根据提取的黑白名单数据构建罚项;
73.步骤六、根据罚项和bic评分函数得到融合先验知识的正则化评分函数;
74.步骤七、根据步骤六得到的融合先验知识的正则化评分函数以及改进粒子群算法对步骤四得到的最大频繁项集的贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构;
75.步骤八、将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系(高速公路交通事故中各因素的关联)。
76.具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述步骤二中根据随机变量间的关联规则,构建关联规则集;具体过程为:
77.随机变量间的关联规则为随机变量间的重要性的支持度以及随机变量间的可信度的置信度;
78.对于任意两个随机变量vi,vj∈v,计算随机变量间的支持度和随机变量间的置信度,公式如下所示:
79.sup(vi→
vj)=p(vi∪vj)
80.81.其中:v表示数据集;
82.sup(vi→
vj)表示随机变量vi,vj的支持度,即随机变量vi、vj同时发生的概率p(vi∪vj),反映了随机变量vi,vj在样本数据中的重要性;
83.con(vi→
vj)表示随机变量vi,vj的置信度,即在变量vi发生的情况下,变量vj发生的条件概率p(vj|vi),反映了随机变量vi,vj的可信程度;
84.sup(vi)表示变量vi的支持度(随机变量vi发生的概率p(vi));
85.关联规则可以反映出随机变量之间的关联强度,例如高速公路交通事故严重程度与道路条件的关联度,道路环境条件包括路面湿滑状况、照明条件、转弯半径等,通过构建关联规则集反映出事故严重程度与路面是否湿滑、照明状况是否良好、转弯半径的大小之间的关联度。
86.其它步骤及参数与具体实施方式一或二相同。
87.具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述步骤三中根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;具体过程为:
88.设置支持度阈值和置信度阈值;
89.当随机变量间的支持度大于等于支持度阈值且随机变量间的置信度大于等于置信度阈值时,将两个随机变量对应的节点对加入强关联规则集。
90.强关联规则集是通过大量关联规则构成,每条关联规则间可能存在一定的逻辑关系。例如:样本数据中第一、第二随机变量同时满足所设置的支持度阈值以及所设置的置信度阈值对应的关联规则,第三和第四随机变量仅满足所设置支持度阈值对应的关联规则;只有当关联规则同时满足支持度和置信度阈值设置时,随机变量对才属于强关联规则集;从该例子中可以看出,第一和第二随机变量组成的随机变量对属于强关联规则集,第三、第四随机变量对不属于强关联规则集。
91.其它步骤及参数与具体实施方式一至三之一相同。
92.具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:所述步骤四中为提高最大频繁项集结构学习准确度,从数据集中提取频繁项集,对频繁项数据集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;具体过程为:
93.步骤四一、使用apriori算法从数据集中提取频繁项集
94.频繁项集(具有关联关系的随机变量)指数据集中支持度大于等于支持度阈值的数据的集合;
95.其中,表示第i个频繁项集;
96.步骤四二、若某个频繁项集不为其他任何频繁项集的子集,定义为最大频繁项集;
97.步骤四三、使用mmhc算法对最大频繁项集进行结构学习,得到最大频繁项集的贝叶斯网络结构;具体过程为:
98.贝叶斯网络结构集反映了随机变量之间的依赖关系;
99.通过对最大频繁项集的挖掘以及对其结构学习得到最大频繁项集的贝叶斯网络结构;
[0100][0101]
其中,bn
max
表示最大频繁项集的贝叶斯网络结构,表示第i个频繁项集对应的贝叶斯网络结构,表示n个频繁项集对应的贝叶斯网络结构集的并集。
[0102]
其它步骤及参数与具体实施方式一至四之一相同。
[0103]
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:所述步骤五中根据强关联规则集和最大频繁项数据集的贝叶斯网络结构,提取黑白名单;根据提取的黑白名单数据构建罚项;具体过程为:
[0104]
当数据集中的随机变量对属于强关联规则集且属于最大频繁项集的贝叶斯网络结构中连接的节点对,则将随机变量加入白名单;
[0105]
当数据集中的随机变量对不属于关联规则集且不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单;
[0106]
当数据集中的随机变量对不属于关联规则集或不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则随机变量既不加入白名单也不加入黑名单。
[0107]
关联规则分析可得出具有强相关性的节点对,故可用关联规则分析结果与最大频繁项集的贝叶斯网络结构相互检验,提高最大频繁项集贝叶斯网络结构的准确度,并以此作为总体样本数据贝叶斯网络结构学习的先验知识。
[0108]
其它步骤及参数与具体实施方式一至五之一相同。
[0109]
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是:所述当数据集中的随机变量对属于强关联规则集且属于最大频繁项集的贝叶斯网络结构中连接的节点对,则将随机变量加入白名单;
[0110]
当数据集中的随机变量对不属于关联规则集且不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单;
[0111]
具体过程为:
[0112]
对数据集中的随机变量对(vi→
vj)∈bn
max
,若(vi→
vj)∈str,则将变量对(vi→
vj)加入白名单,即
[0113]
若数据集中的随机变量对不属于关联规则集或不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单,即
[0114][0115]
其中,str为强关联规则集合,(vi→
vj)为随机变量对,为白名单;为黑名单。
[0116]
其它步骤及参数与具体实施方式一至六之一相同。
[0117]
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是:所述步骤五中根据提取的黑白名单数据构建罚项;具体过程为:
[0118]
构建的罚项为:
[0119][0120]
其中:m表示满足(vi→
vj)∈g的变量个数;vi为变量,vj为变量;
[0121]
为二进制变量,当第k个元素满足时,反之则
[0122]
为二进制变量,当第k个元素满足时,反之则
[0123]
λ1与λ2为控制权重系数,根据不同的数据样本调整取值;
[0124]
罚项是为融合黑白名单构建的因子,由于黑白名单作为先验知识,因此该因子可将先验信息融合。在具体构建该因子时,可采用黑白名单所对应的数据的求和、作差等方式得到;
[0125]
其它步骤及参数与具体实施方式一至七之一相同。
[0126]
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是:所述步骤六中根据罚项和bic评分函数得到融合先验知识的正则化评分函数;具体过程为:
[0127]
f(g)=bic(g)+φg
[0128]
其中f(g)表示融合先验知识的正则化评分函数,bic(g)表示bic评分函数;
[0129]
bic评分函数是基于贝叶斯定理提出的一种用来计算最大得分的网络结构的函数;
[0130]
将利用黑白名单对应数据所得到的先验知识作为罚项融入bic评分函数中,对传统的评分函数进行了改进,在后续对贝叶斯网络结构进行评分可以更准确的获取随机变量关联性更高的贝叶斯网络结构。
[0131]
其它步骤及参数与具体实施方式一至八之一相同。
[0132]
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是:所述步骤七中根据步骤六得到的融合先验知识的正则化评分函数以及改进粒子群算法对步骤四得到的最大频繁项集的贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构;具体过程为:
[0133]
步骤七一、使用混合结构学习的方式,用pc算法构造最大频繁项集初始网络;
[0134]
步骤七二、改进粒子群算法具体为:
[0135]
改进粒子群算法的速度更新规则:
[0136]
粒子群算法是一种进化计算技术,在对动物集群活动行为观察基础上,利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得最优解,为更好地融入到贝叶斯网络结构学习中,对粒子群算法的粒子编码规则、更新公式进行改进,得到改进的离散粒子群算法。
[0137]
在改进粒子群速度更新规则的过程中,贝叶斯网络被视为可优化的粒子,并使用相同规模的矩阵表示,每次循环都根据改变粒子的速度和位置信息。粒子的速度和位置信息同样采用矩阵的编码形式。
[0138]
粒子的位置编码规则为:
[0139][0140]
粒子的速度的编码规则为:
[0141][0142]
改进粒子群算法的速度更新公式为:
[0143]
v(t+1)=w
1vd
(t)+w2[p(t)-x(t)]+w3[g(t)-x(t)]
[0144]
其中,vd(t)为离散处理后的第t次迭代粒子速度,p(t)为第t次迭代中的个体最优位置,x(t)为第t次迭代粒子位置,g(t)为第t次迭代中的群体最优位置,v(t+1)为第t+1次迭代粒子移动速度;v
ij
为v(t+1)中第i行第j列得到元素;为vd(t)中第i行第j列得到元素;
[0145]
w1、w2、w3分别为惯性权重系数、个体学习因子、群体学习因子;
[0146]
限制w1+w2+w3=1;
[0147]
所述粒子的速度的编码形式的编码过程具体过程为:
[0148]
为使速度的值限制在特定的集合内,使用调整后的sigmoid函数对改进粒子群算法的离散速度的值进行映射,表达式为:
[0149][0150]
其中,s(v
ij
)为v
ij
映射结果,*为相乘;
[0151]
表达式函数图形如图5所示,不同于传统的离散pso中s(v
ij
)表示x
ij
取1的概率,本文中定义的s(v
ij
)表示粒子的状态倾向,s(v
ij
)越接近于-1,表示其越倾向于删边,越接近于1,则越倾向于加边。而根据映射函数的特点,只有速度的大小低于0.22时粒子才会倾向于静止,当速度的值高于0.22时粒子均倾向于运动,这样的方式驱使粒子更倾向于运动,有利于跳出局部最优。
[0152]vij
具体判定方式如下:
[0153]
当v
ij
≥0时:
[0154][0155]
当v
ij
<0时,
[0156][0157]
其中,rand()为0-1之间的随机数;
[0158]
改进粒子群算法的位置更新公式为:
[0159][0160]
其中,x(t)为第t次迭代粒子位置,v(t+1)为第t+1次迭代粒子移动速度,x(t+1)为第t+1次迭代粒子位置;
[0161]
改进离散粒子群算法的位置更新过程如图4所示;
[0162]
步骤七三、根据融合先验知识的正则化评分函数以及改进粒子群算法对贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构,通过这个最优结构来反映高速公路交通事故中各因素的关联。
[0163]
通过最优贝叶斯网络结构来反映随机变量中最准确的关联性。
[0164]
粒子群算法是一种进化计算技术,在对动物集群活动行为观察基础上,利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得最优解,为更好地融入到贝叶斯网络结构学习中,对粒子群算法的粒子编码规则、更新公式进行改进,得到改进的离散粒子群算法。
[0165]
其它步骤及参数与具体实施方式一至九之一相同。
[0166]
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
技术特征:
1.基于改进pso优化贝叶斯网络的高速公路事故成因分析系统,其特征在于:所述系统包括:数据获取模块、关联规则分析模块、贝叶斯网络学习模块、先验知识名单获取模块、罚项模块、评分函数模块、改进粒子群搜索模块、测试模块;所述数据获取模块用于获取数据集;数据集由随机变量组成;所述随机变量指贝叶斯网络中的节点;所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;所述关联规则分析模块用于根据随机变量间的关联规则,构建关联规则集;所述强关联规则分析模块用于根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;所述贝叶斯网络学习模块用于从数据集中提取频繁项集,对频繁项集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;所述先验知识名单获取模块用于根据强关联规则集和最大频繁项集的贝叶斯网络结构,提取黑白名单,加入先验知识;所述罚项模块用于根据提取的黑白名单数据构建罚项;所述评分函数模块用于根据罚项和bic评分函数得到融合先验知识的正则化评分函数;所述改进粒子群搜索模块用于根据融合先验知识的正则化评分函数以及改进粒子群算法循环搜索得到最优贝叶斯网络结构。测试模块用于将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系。2.基于权利要求1基于改进pso优化贝叶斯网络的高速公路事故成因分析系统的高速公路事故成因分析方法,其特征在于:所述基于改进pso优化贝叶斯网络的高速公路事故成因分析方法具体过程为:步骤一、获取高速公路交通事故中数据集;数据集由随机变量组成;所述随机变量指贝叶斯网络中的节点;所述随机变量代表驾驶员信息、汽车运行状态或道路环境条件等;步骤二、根据随机变量间的关联规则,构建关联规则集;步骤三、根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;步骤四、从数据集中提取频繁项集,对频繁项数据集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;步骤五、根据强关联规则集和最大频繁项数据集的贝叶斯网络结构,提取黑白名单;根据提取的黑白名单数据构建罚项;步骤六、根据罚项和bic评分函数得到融合先验知识的正则化评分函数;步骤七、根据步骤六得到的融合先验知识的正则化评分函数以及改进粒子群算法对步骤四得到的最大频繁项集的贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构;步骤八、将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系。
3.根据权利要求2所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤二中根据随机变量间的关联规则,构建关联规则集;具体过程为:随机变量间的关联规则为随机变量间的支持度以及随机变量间的置信度;对于任意两个随机变量v
i
,v
j
∈v,计算随机变量间的支持度和随机变量间的置信度,公式如下所示:sup(v
i
→
v
j
)=p(v
i
∪v
j
)其中:v表示数据集;sup(v
i
→
v
j
)表示随机变量v
i
,v
j
的支持度,即随机变量v
i
、v
j
同时发生的概率p(v
i
∪v
j
);con(v
i
→
v
j
)表示随机变量v
i
,v
j
的置信度,即在变量v
i
发生的情况下,变量v
j
发生的条件概率p(v
j
|v
i
);sup(v
i
)表示变量v
i
的支持度。4.根据权利要求3所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤三中根据随机变量间的关联规则以及支持度阈值、置信度阈值构建强关联规则集;具体过程为:设置支持度阈值和置信度阈值;当随机变量间的支持度大于等于支持度阈值且随机变量间的置信度大于等于置信度阈值时,将两个随机变量对应的节点对加入强关联规则集。5.根据权利要求4所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤四中从数据集中提取频繁项集,对频繁项数据集进行贝叶斯网络结构学习,得到最大频繁项集的贝叶斯网络结构;具体过程为:步骤四一、使用apriori算法从数据集中提取频繁项集频繁项集指数据集中支持度大于等于支持度阈值的数据的集合;其中,表示第i个频繁项集;步骤四二、若某个频繁项集不为其他任何频繁项集的子集,定义为最大频繁项集;步骤四三、使用mmhc算法对最大频繁项集进行结构学习,得到最大频繁项集的贝叶斯网络结构;具体过程为:其中,bn
max
表示最大频繁项集的贝叶斯网络结构,表示第i个频繁项集对应的贝叶斯网络结构,表示n个频繁项集对应的贝叶斯网络结构集的并集。6.根据权利要求5所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤五中根据强关联规则集和最大频繁项数据集的贝叶斯网络结构,提取黑白名单;根据提取的黑白名单数据构建罚项;具体过程为:当数据集中的随机变量对属于强关联规则集且属于最大频繁项集的贝叶斯网络结构
中连接的节点对,则将随机变量加入白名单;当数据集中的随机变量对不属于关联规则集且不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单;当数据集中的随机变量对不属于关联规则集或不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则随机变量既不加入白名单也不加入黑名单。7.根据权利要求6所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述当数据集中的随机变量对属于强关联规则集且属于最大频繁项集的贝叶斯网络结构中连接的节点对,则将随机变量加入白名单;当数据集中的随机变量对不属于关联规则集且不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单;具体过程为:对数据集中的随机变量对(v
i
→
v
j
)∈bn
max
,若(v
i
→
v
j
)∈str,则将变量对(v
i
→
v
j
)加入白名单,即若数据集中的随机变量对不属于关联规则集或不属于最大频繁项数据集的贝叶斯网络结构中连接的节点对,则将随机变量加入黑名单,即其中,str为强关联规则集合,(v
i
→
v
j
)为随机变量对,为白名单;为黑名单。8.根据权利要求7所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤五中根据提取的黑白名单数据构建罚项;具体过程为:构建的罚项为:其中:m表示满足(v
i
→
v
j
)∈g的变量个数;v
i
为变量,v
j
为变量;为二进制变量,当第k个元素满足时,反之则反之则为二进制变量,当第k个元素满足时,反之则λ1与λ2为控制权重系数。9.根据权利要求8所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方法,其特征在于:所述步骤六中根据罚项和bic评分函数得到融合先验知识的正则化评分函数;具体过程为:f(g)=bic(g)+φg其中f(g)表示融合先验知识的正则化评分函数,bic(g)表示bic评分函数。10.根据权利要求9所述的基于改进pso优化贝叶斯网络的高速公路事故成因分析方
法,其特征在于:所述步骤七中根据步骤六得到的融合先验知识的正则化评分函数以及改进粒子群算法对步骤四得到的最大频繁项集的贝叶斯网络结构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构;具体过程为:步骤七一、用pc算法构造最大频繁项集初始网络;步骤七二、改进粒子群算法具体为:改进粒子群算法的速度更新规则:粒子的速度的编码规则为:改进粒子群算法的速度更新公式为:v(t+1)=w
1vd
(t)+w2[p(t)-x(t)]+w3[g(t)-x(t)]其中,v
d
(t)为离散处理后的第t次迭代粒子速度,p(t)为第t次迭代中的个体最优位置,x(t)为第t次迭代粒子位置,g(t)为第t次迭代中的群体最优位置,v(t+1)为第t+1次迭代粒子移动速度;v
ij
为v(t+1)中第i行第j列得到元素;为v
d
(t)中第i行第j列得到元素;w1、w2、w3分别为惯性权重系数、个体学习因子、群体学习因子;限制w1+w2+w3=1;所述粒子的速度的编码形式的编码过程具体过程为:使用调整后的sigmoid函数对改进粒子群算法的离散速度的值进行映射,表达式为:其中,s(v
ij
)为v
ij
映射结果,*为相乘;v
ij
具体判定方式如下:当v
ij
≥0时:当v
ij
<0时,其中,rand()为0-1之间的随机数;改进粒子群算法的位置更新公式为:其中,x(t)为第t次迭代粒子位置,v(t+1)为第t+1次迭代粒子移动速度,x(t+1)为第t+1次迭代粒子位置;步骤七三、根据融合先验知识的正则化评分函数以及改进粒子群算法对贝叶斯网络结
构进行循环搜索,通过不断的增、减边、逆转边操作,直至输出具有最高融合先验知识的正则化评分的最优贝叶斯网络结构,得到最优贝叶斯网络结构。
技术总结
基于改进PSO优化贝叶斯网络的高速公路事故成因分析方法,本申请涉及高速公路交通事故成因分析方法。本发明的目的是为了解决现有方法对高速公路交通事故确定各因素的关联关系准确度低的问题。过程为:一、获取高速公路交通事故中数据集;二、构建关联规则集;三、构建强关联规则集;四、得到最大频繁项集的贝叶斯网络结构;五、构建罚项;六、得到正则化评分函数;七、根据正则化评分函数以及改进粒子群算法对最大频繁项集的贝叶斯网络结构进行循环搜索,得到最优贝叶斯网络结构;八、将待测高速公路交通事故中各随机变量数据输入最优贝叶斯网络结构,输出高速公路交通事故中各随机变量之间的关联关系。本发明用于高速公路事故数据处理领域。理领域。理领域。
技术研发人员:漆巍巍 冯健茜 蓝图博尔 黄伟彬 凌家正 香梓伟
受保护的技术使用者:华南理工大学
技术研发日:2023.04.06
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
