一种用于自动驾驶车辆的道路多目标快速识别方法
未命名
08-15
阅读:167
评论:0
1.本发明属于自动驾驶目标识别技术领域,具体涉及一种用于自动驾驶车辆的道路多目标快速识别方法。
背景技术:
2.近年来,随着人民经济水平的不断提高,个人所拥有的汽车数量也不断增长,带来了交通拥堵及行驶安全等一系列问题。因此,改善汽车安全性能、降低交通事故率已成为各国政府和科研机构共同面临的重要难题,为此自动驾驶车辆应运而生。自动驾驶车辆的关键技术包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及测试与验证,其中最关键的三大技术是感知定位,决策规划以及行为控制,这三大技术体系可简单概括为“感知、规划与执行”。而作为自动驾驶系统的核心技术之一,车辆对于周围交通环境的高效感知对于之后路径规划和后续的控制执行至关重要。
3.传统的目标检测算法,多是基于滑动窗口技术完成目标识别,即输入一张待检测的目标图像,利用滑动窗口针对图像中存在的目标设置候选框,再根据候选框中目标特征信息的不同,完成特征信息提取,最后利用级联分类器进行目标识别。在整个识别过程中容易产生大量的冗余候选框,导致检测速度慢,此外分类器的特征识别为手动选取,鲁棒性低,对于不同交通场景的泛化性能较差。
4.近些年来,随着机器学习,尤其是深度学习算法的推陈出新,基于深度学习的目标识别方法日渐成为主流,其大致可以分为两类。
5.第一类称为“two-stage”检测算法,例如faster-rcnn等,此类算法将检测问题分成两个阶段:首先确定候选区域,之后再进行分类识别。但总体来看,采用faster-rcnn识别目标精度较高,但存在训练时间长,整体模型参数量大,对计算性能要求高等问题,不适用于移动设备的端侧实时检测。
6.第二类称为“one-stage”检测算法,例如yolo,ssd等,它们是基于回归预测模型,不包含区域建议阶段,经过单次预测得到最终的检测结果。并且从各类ssd检测方案来看,虽然检测速度更快,但ssd检测性能好坏主要取决于特征提取的设计方案,并且对于道路交通拥堵,重叠车辆较多时,目标检测性能比较弱。
7.综上所述,在自动驾驶车辆的移动目标识别上,应用yolo系列模型最为适宜,该模型经过轻量化处理,更便于部署到端侧检测设备。根据网络的宽度以及深度,yolo提供了yolov5s,yolov5m,yolov5l和yolov5x四种网络结构,其中,yolov5s是轻量化网络的首选,其结构主要包含输入端,骨干网络,颈部网络,检测层四个部分。尽管yolov5s用于图像目标检测的速度较快,但也存在收敛速度慢、误检,误删等问题。
技术实现要素:
8.针对yolov5s对目标识别所存在的问题,本发明的主要目的是在yolov5s网络的基础上进行改进,提供一种用于自动驾驶车辆的道路多目标快速识别方法,即target-yolo网
络模型,可针对汽车,卡车,公交车,人,自行车,摩托车六类移动目标开展识别,为自动驾驶车辆目标识别研究提供理论依据和执行方案。
9.本发明提供的技术方案包括:分别在yolov5s的骨干网络和颈部网络引入注意力机制来测试最佳引入位置;优化骨干网络层提高特征提取能力;改进训练过程,提高模型收敛速度;改进后处理算法避免检测框的误删误检;整合所有改进方案,提出最终的改进模型,即target-yolo模型,并通过自动驾驶数据集加以验证。具体涉及方案的步骤如下:
10.步骤一、在yolov5s的骨干网络和颈部网络这两部分上分别测试cbam注意力机制的最佳引入位置。
11.步骤二、采用res2net类残差网络替换骨干网络中的bottleneck部分,提高多尺度特征提取能力。
12.步骤三、采用varifocal loss损失函数优化模型的训练过程,加快模型的收敛速度。
13.步骤四、采用soft-nms软阈值算法替代后处理算法中的nms硬阈值算法,避免检测框的误删或者误检。
14.步骤五、整合以上改进方案,提出“target-yolo”目标检测模型并通过自动驾驶图像数据集target加以验证。
15.优选地,步骤一中测试注意力机制引入位置时需要分别在yolov5s的骨干网络和颈部网络验证最佳引入位置。具体操作是将cbam注意力机制引入yolov5s网络后,分别通过target自动驾驶数据集来验证检测结果,选择结果最优的一种注意力机制引入位置。
16.优选地,步骤二中是利用res2net类残差结构替换掉原始yolov5s的骨干网络的bottleneck层,以此来提升网络模型整体的多尺度特征提取范围,来感知更细粒度的特征信息。
17.优选地,步骤三中采用varifocal loss损失函数去替换掉目标置信度损失和分类损失所使用的bce-withlogits loss损失函数,在训练过程中去平衡正负样本,以期达到加速收敛速度的效果。
18.优选地,步骤四中使用soft-nms软阈值算法替换掉nms硬阈值算法,避免nms硬阈值算法导致的检测框出现误检误删问题。
19.优选地,步骤五中通过对前述步骤中所有改进方案的分析比较,结合所有改进确定出最终的整体改进方案,提出“target-yolo”检测模型,并通过自动驾驶图像数据集target验证模型效果。
20.采用上述技术方案所产生的有益效果为:本发明提出的target-yolo网络通过对原始yolov5s的骨干网络层,损失函数以及后处理算法三个方面进行替换优化,结合res2net的类残差结构去提高多尺度特征感知范围,利用varifocal loss损失函数去平衡训练过程中的正负样本权重,使用soft-nms算法替换了原始的nms算法,并通过引入注意力机制来提高特征融合能力,上述改进综合提升了模型本身的特征提取能力,使其更加有利于对大小多类目标的识别。
附图说明
21.图1为本发明实施例中target-yolo网络结构图;
22.图2为本发明实施例中原始yolov5s网络结构图;
23.图3为本发明实施例中cbam注意力机制示意图;
24.图4为本发明实施例中主干网络注意力机制融合示意图;
25.图5为本发明实施例中颈部网络注意力机制融合示意图;
26.图6为本发明实施例中主干网络改进结构图;
27.图7为本发明实施例中损失函数改进前后对比图;(a)目标置信度损失;(b)目标分类损失
28.图8为本发明实施例中后处理环节假想检测框输出图;
29.图9为本发明实施例中后处理算法改进前后对比图;(a)yolov5s卡车识别结果;(b)结合soft-nms改进后卡车识别结果;(c)yolov5s摩托车骑手识别结果;(d)结合soft-nms改进后摩托车骑手识别结果。
30.图10为本发明实施例中多类模型检测结果对比;(a)yolov5s卡车识别结果;(b)ssd卡车识别结果;(c)faster-rcnn卡车识别结果;(d)target-yolo卡车识别结果。
具体实施方式
31.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
32.如图1所示,一种用于自动驾驶车辆的道路多目标快速识别方法,即依据yolov5s改进的target-yolo网络模型,包括以下步骤:
33.步骤一、在yolov5s的骨干网络和颈部网络这两部分上分别测试cbam注意力机制的最佳引入位置。
34.首先在原始yolov5s的网络结构基础上,在其骨干网络层和颈部网络层上分别引入cbam注意力机制,采用如下两种方案进行改进。yolov5s网络结构图如图2所示,cbam注意力机制示意图如图3所示。
35.方案1:与主干网络中的csp模块相融合。主干网络使用多层卷积神经网络,实现图像的特征提取,其中结合了cspnet的csp模块,增强卷积神经网络的学习能力,以保证模型轻量化的同时保持准确性。csp模块与cbam的融合,可以使模型在聚合多层次特征后,再次进行特征加强,二者融合后的结构如图4所示。
36.方案2:cbam注意力机制与颈部网络的concat层相融合。颈部网络采用fpn+pan的结构,fpn自上向下传递强语义特征,将特征图的高层特征信息通过上采样的方式进行传递,得出后续预测的特征图,pan自下向上传达强定位特征,弥补并加强底层网络模糊的目标定位信息。concat层负责将深、浅层信息互相融合,因此将cbam注意力机制置于concat层之后,对融合后的特征进行重构,其融合策略如图5所示。
37.在数据测试过程中,设置yolov5s的网络宽度为0.5,深度为0.33,数据集图片大小设定为608
×
608,训练批次为300轮,每一批次选取64张图片,其余参数设置依据yolov5s默认设置进行。具体的训练参数如下表1所示。
38.表1训练参数
1模型中,cbam注意力机制添加到主干网络末端,此时特征提取步骤已经完成,识别精度有所提高,但召回率却出现了下降。而在yolov5s-2模型中,cbam注意力机制添加在颈部网络,可以将融合后的特征参数进行加权,预测精准度和召回率均取得明显改善。相较于yolov5s-1模型来说,yolov5s-2模型的整体优势较为突出,可作为整体模型优化的基本配置。
51.步骤二、采用res2net类残差网络替换骨干网络中的bottleneck部分,提高多尺度特征提取能力。
52.yolov5s的原始主干网络,采用由cnn演化而来的cspnet,通过分割梯度流、切换串联和过渡步骤实现更加丰富的梯度组合,以此增强cnn的学习能力,消除计算瓶颈。与此同时,网络中存在着大量的梯度信息重复。为了使yolov5s的主干网络在更细的粒度水平上进行多尺度特征表示,有效减少梯度信息特征的重复,通过对cspnet中的bottleneck层进行替换后,增加了输出特征所代表的尺度数量,在更细的粒度上增加了每个网络层的特征提取范围,更好地实现了对于图片中包含特征的细节感知,有效降低了原始梯度信息的重复,进一步提升了主干网络部分的特征提取性能,改进后的主干网络结构如图6所示。根据上述改进方案,采用res2net替换yolov5s中的主干网络部分,用于target数据集的六类目标检测,模型训练参数与表1相同,检测结果的评价指标如下表所示。
53.表3主干网络改进前后结果对比
[0054][0055]
由上表可见,骨干网络层结合res2net类残差结构后,在所有类别平均之后的精准度,召回率和平均精度均高于原始模型,提高幅度分别为2%,1.1%,0.008。由此可知,结合res2net在yolov5s的骨干网络进行替换后,较于之前的cspnet网络,骨干网络层的特征提取能力得到了加强,对于后续颈部网络层的特征融合以及预测端的识别精度也起到了很大程度上的提升。
[0056]
针对六类检测目标car,truck,bus,person,bike,motor分别进行改进前后平均精度(map)计算,对比结果如下表所示。
[0057]
表4六类目标改进前后平均精度对比
[0058][0059]
由上表可知,六类大小不同的目标经过res2net对骨干网络的改进后,其平均精度
均有不同程度的提升,原因在于res2net的类残差结构将原始的3
×
3过滤器替换为多组的残差卷积,如此操作多次卷积后,特征图尺寸逐渐缩小,感受野逐渐增大,大小不同多种尺度的特征图在类残差结构中进行聚合,更加利于多尺度特征的识别,进而实现了对图像中不同大小目标识别精度的提升。
[0060]
步骤三、采用varifocal loss损失函数优化模型的训练过程,加快模型的收敛速度。
[0061]
原始yolov5s的损失函数包含三个部分:目标框定位损失l
bbox
、目标置信度损失l
conf
、分类损失l
classes
。在训练过程中,认为包含待检测目标的部分为正样本,其余部分为负样本。正样本的输出概率越大损失值越小,负样本的输出概率越小损失值越小,但由于训练数据集中负样本数目远远多于正样本,而yolov5s原有的bce(binary cross entropy)-withlogits loss在训练过程中对于正负样本采用均衡处理的方式,因此训练过程中会出现负样本方向的偏差,导致收敛速度变慢,模型精度变低。
[0062]
目标置信度损失l
conf
、分类损失l
classes
采用bce-withlogits loss函数,表达式如下:
[0063][0064]
其中,p为置信度的值,q为目标得分,前景类中,正样本的q为边界框和ground-truth之间的iou,否则为0,背景类中所有样本q均为0。
[0065]
为了使训练过程更加专注于正样本,提高收敛速度,可以采用focal loss来将正负样本在训练过程中的损失值计算进行加权,使得负样本产生的损失值加权后变小,原理公式如下式所示。
[0066][0067]
其中,p为置信度的值,q为目标得分,α为正负样本平衡因子,前景类中,正样本的q为边界框和ground-truth之间的iou,否则为0,背景类中所有样本q均为0。
[0068]
focal loss的上述改进可以减轻负样本对于损失值计算的影响,但训练数据集存在另一个问题,即易分样本和难分样本的存在,这两类样本和正负样本交互影响损失值的梯度下降过程。
[0069]
表5样本分类
[0070] 难分样本易分样本正样本正难正易负样本负难负易
[0071]
易分样本的置信度得分高,对于损失的计算过程影响很小,而难分样本置信度得分低,但对于损失的迭代计算影响很大。因此在训练过程中更应该聚焦于难分样本,增加其在损失计算中所占有的比例。而正负样本平衡因子α虽然对于负样本进行了权重缩减,但是对于难易样本的权重平衡并无帮助。则引出下式来缩小易分类样本的权重。
[0072]
[0073]
其中,p为置信度的值,α为正负样本平衡因子,γ为难易样本平衡因子,q为目标得分,前景类中,正样本的q为边界框和ground-truth之间的iou,否则为0,背景类中所有样本q均为0。
[0074]
focal loss通过上述改进实现了对于正负样本和难易样本的平衡,但正负样本平衡因子α和难易样本平衡因子γ这两个超参数都是通过实验测定的。且设定完成后在损失的计算过程中不会进行变化,为静态的loss函数。因此考虑上述缺陷,引出varifocal loss。varifocal loss借鉴了focal loss的加权思想来解决密集目标数据集训练时的类不平衡问题。但不同于focal loss,varifocal loss通过动态缩放样本集中的负样本,以此来加强训练过程中的正样本权重,并将正样本与训练目标进行加权,保证正样本对于损失计算的贡献更大。并且实现了将正负样本平衡因子α和难易样本平衡因子γ融合起来,同时保证了正负样本和难易样本的平衡。
[0075]
其原理表达式如下。
[0076][0077]
其中,p为iacs预测值,q为目标得分,前景类中,正样本的q为边界框和ground-truth之间的iou,否则为0,背景类中所有样本q均为0,p
γ
为负样本的缩放因子,α为正负样本的平衡因子。
[0078]
根据上述改进方案,将yolov5s模型的目标置信度损失l
conf
、分类损失l
classes
替换为varifocal loss函数,其他训练参数同表1。采用target数据集完成模型测试,损失函数改进前后的置信度损失和分类损失的变化情况,如图7所示,由图可见,采用varifocal loss函数后,模型在训练过程中的收敛速度快于原始的yolov5s,可以在更少的训练批次上趋于平缓,最终的目标置信度损失达到0.0035,分类损失达到0.002后基本维持稳定,原因在于varifocal loss通过缩放负样本的策略,加强了训练过程中的正样本权重,保证训练过程更加集中于正样本,从而提高了收敛速度,保证了较低的损失。
[0079]
步骤四、采用soft-nms软阈值算法替代后处理算法中的nms硬阈值算法,避免检测框的误删或者误检。
[0080]
nms硬阈值处理算法是通过对目标框进行筛选,通过不断迭代,以最大得分的框与其他框做iou,过滤iou较大的框。在整个迭代过程中,nms会删除所有iou大于阈值的检测框,即相邻检测框的分数强制归零。如果iou阈值过小,会出现误删,若过大则容易产生误检。
[0081]
一旦预测框超出设定阈值,即通过如下分数重置算法进行重置。
[0082][0083]
其中,si为置信度得分,n
t
为阈值,m为置信度最高的检测框,bi为其相邻检测框。
[0084]
由上述可知,nms采用硬阈值判断相邻的检测框是否应保留,即检测框的得分超出iou阈值则置0,小于阈值则保留。若假设网络输出识别框如图8所示,nms工作原理如下。
[0085]
(1)网络模型针对六个输出检测框进行置信度得分的排序,若a为置信度得分最高的检测框,则依次将b,c,d,e,f分别与a进行iou计算,判断是否高于阈值,若b,c框高于阈
值,则删除,并将a框保留。
[0086]
(2)选取剩下的d,e,f框中置信度最高的检测框,若e框置信度得分最高,则继续执行d,f检测框与e检测框的iou计算,并如步骤1所示进行重复。
[0087]
依据上述工作原理,显然,若阈值过小,最大置信度得分检测框a的相邻框b,c,d超出了阈值,但内部检测有其他物体,则会造成误删。若阈值过大,最大置信度得分检测框a的相邻框b,c,d就不会删除,容易造成误检,这就会带来目标检测的缺失,因此本文以soft-nms软阈值算法替代nms硬阈值算法,其表达式如下:
[0088][0089]
其中,si为置信度得分,n
t
为阈值,m为置信度最高的检测框,bi为其相邻检测框。
[0090]
预测框超出iou阈值时,通过不断的迭代去线性衰减检测框的置信度分数,而不是单纯置0。如此操作保留了最大置信度得分的检测框,同时避免了分数突变导致检测结果序列出现较大变动,最终得到最优的预测结果。网络输出检测框仍假设为图8,soft-nms软阈值算法工作原理如下:
[0091]
(1)网络模型针对六个输出检测框进行置信度得分的排序,若a为置信度得分最高的检测框,则依次将b,c,d,e,f分别与a进行iou计算,判断是否高于阈值,若b,c框高于阈值,则通过线性衰减的方法来降低检测框的iacs得分,并将a框标记后保留。
[0092]
(2)选取剩下的d,e,f框中置信度最高的检测框,若e框置信度得分最高,则继续执行d,f检测框与e检测框的iou计算,并如步骤1所示进行重复。
[0093]
根据改进方案,将yolov5s模型中nms硬阈值算法替换为soft-nms软阈值算法,模型其他训练参数同表1所示。target数据集中部分图片的检测结果如图9所示。从图9的对比结果可见,在原始yolov5s模型的检测结果中,图9(a)中的卡车以及图9(c)中的摩托车骑手,均出现了一物多检的现象,而且图9(a)中的卡车存在明显的识别错误,这是由于iou阈值无法准确确定,从而导致的误检。反观soft-nms算法对yolov5s模型改进后,图9(b)和图9(d)均避免了一物多检问题的出现,说明soft-nms算法通过线性衰减检测框,有效地避免了检测框重叠时的误删或者误检情况。
[0094]
步骤五、整合以上改进方案,提出“target-yolo”目标检测模型,并通过自动驾驶图像数据集target加以验证。
[0095]
根据前述注意力机制融合实验评价结果,选取yolov5s-2为后续改进的基础模型,在此模型基础上首先进行backbone结构改进,将原始backbone结构所采用的cspnet网络中的bottleneck替换为res2net,之后替换目标置信度损失和分类损失采用的bce-withlogits loss函数为varifocal loss,最终进行后处理算法改进,将非极大值抑制算法(nms)替换为soft-nms,最终的改进模型结构target-yolo如图1所示,网络执行流程如下所述。
[0096]
(1)原始图像经过输入端后,经由mosic数据增强模块进行随机缩放,再通过随机分布模块进行拼接,优化模型对于小尺度目标的检测能力,之后通过自适应图片填充模块来对训练集图片添加边缘黑框,达到图片尺寸缩放统一的目的,最后使用自适应锚框计算模块计算训练数据集中的最佳锚框值。
[0097]
(2)骨干网络使用res2net替换原有的bottleneck1_x模块,输入端图片输入后,在
此步骤通过focus进行图片切片后,依据res2net自身的类残差结构,对切片后的特征图进行多次卷积,进而在比原始网络更细粒度的层次上进行多尺度特征的提取,用于对网络学习的增强,骨干网络末端仍使用spp结构对特征图进行池化,提高模型检测精度。
[0098]
(3)颈部网络在原有的fpn+pan结合基础上,在每个concat层的后面添加了cbam注意力机制模块,保证在进行通道相加融合后,再次进行特征重构,进而提升特征提取的多样性。
[0099]
(4)检测层采用ciou_loss函数设置目标定位损失,最小化预测框和真实框之间的归一化距离,采用varifocal loss函数提高模型收敛速度,同时在预测框和真实框重复时,利用soft-nms软阈值处理算法来依次迭代选取最大置信度的检测框,保证检测结果的准确性。
[0100]
表6四类网络模型结果对比
[0101]
模型p(%)r(%)mapyolov5s86.790.30.893target-yolo89.591.60.911faster-rcnn79.770.60.764ssd74.378.50.785
[0102]
由表6可见,target-yolo模型的检测精准度比faster-rcnn、ssd模型分别提高了9.8%和15.2%,与原始的yolov5s相比,提高了2.8%,召回率比faster-rcnn、ssd模型分别提高了21%和13.1%,与原始的yolov5s相比,提高了1.3%,在平均检测精度评价指标上,target-yolo模型也比其余模型具有明显的检测优势。
[0103]
整体而言,改进后的target-yolo模型通过将cbam注意力机制与颈部网络的结合,大幅提高了特征提取的能力,res2net在骨干网络层的替换,也增强了网络的多尺度特征表达水平。通过上述定量的实验验证结果表明本文的改进方案起到了明显的精度提升效果。图10为四类模型对相同测试集图片的检测结果,由图中卡车目标的最终识别结果可见,ssd和yolov5s模型均存在明显的一物多检情况,具有明显的识别缺陷,表明这两类模型在target数据集上的检测性能较差。反观faster-rcnn模型的检测结果,虽然避免了一物多检,但在置信度上明显低于本文改进模型target-yolo的检测结果。
[0104]
综上所述,本发明针对自动驾驶领域的移动多目标检测问题,在yolov5s的网络架构基础上,建立了一种改进的target-yolo模型,目的是改善现有检测模型在收敛速度和检测精度方面的不足,引入cbam注意力机制,并探讨了与骨干网络和颈部网络的两种融合策略,通过实际数据分析,确定了与颈部网络融合的改进方案。采用res2net类残差结构来替换骨干网络层的bottleneck模块,增强了图像中移动目标的多尺度特征提取能力。利用varifocal loss函数来取代目标置信度损失和分类损失所采用的bce-withlogits loss损失函数,提升训练过程中正样本所占的权重,优化收敛速度,从而避免了由于负样本权重过大造成的训练偏差。在模型的后处理算法中,采用soft-nms替代原有的nms非极大值抑制算法,优化检测识别框的判定方法,从而避免了误删或者误检情况的出现。
[0105]
以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
技术特征:
1.一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,该方法包括如下步骤:步骤一、在yolov5s的骨干网络和颈部网络这两部分上分别测试cbam注意力机制的最佳引入位置;步骤二、采用res2net类残差网络替换骨干网络中的bottleneck部分,提高多尺度特征提取能力;步骤三、采用varifocalloss损失函数优化模型的训练过程,加快模型的收敛速度;步骤四、采用soft-nms软阈值算法替代后处理算法中的nms硬阈值算法,避免检测框的误删或者误检;步骤五、整合以上改进方案,提出“target-yolo”目标检测模型并通过自动驾驶图像数据集target加以验证。2.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤一具体为,测试注意力机制引入位置时需要分别在yolov5s的骨干网络和颈部网络验证最佳引入位置;具体操作是将cbam注意力机制引入yolov5s网络后,分别通过target自动驾驶数据集来验证检测结果,选择结果最优的一种注意力机制引入位置。3.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤二中是利用res2net类残差结构替换掉原始yolov5s的骨干网络的bottleneck层,以此来提升网络模型整体的多尺度特征提取范围,来感知更细粒度的特征信息。4.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤三中采用varifocalloss损失函数去替换掉目标置信度损失和分类损失所使用的bce-withlogitsloss损失函数,在训练过程中去平衡正负样本,以期达到加速收敛速度的效果。5.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤四中使用soft-nms软阈值算法替换掉nms硬阈值算法,避免nms硬阈值算法导致的检测框出现误检误删问题。6.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤五中通过对前述步骤中所有改进方案的分析比较,结合所有改进确定出最终的整体改进方案,提出“target-yolo”检测模型,并通过自动驾驶图像数据集target验证模型效果。
技术总结
本发明公开了一种用于自动驾驶车辆的道路多目标快速识别方法,在YOLOv5s的网络架构基础上,建立了一种改进的Target-YOLO模型。采用Res2Net类残差结构来替换骨干网络层的BottleNeck模块,增强了图像中移动目标的多尺度特征提取能力。利用VarifocalLoss函数来取代目标置信度损失和分类损失所采用的BCE-WithLogitsLoss损失函数,提升训练过程中正样本所占权重,优化收敛速度,从而避免了由于负样本权重过大造成的训练偏差。在模型的后处理算法中,采用Soft-NMS替代原有的NMS非极大值抑制算法,优化检测识别框的判定方法,从而避免了误删或者误检情况的出现,为自动驾驶车辆目标识别研究提供理论依据和执行方案。目标识别研究提供理论依据和执行方案。目标识别研究提供理论依据和执行方案。
技术研发人员:张建宇 姚正崇 郝腾龙 王留震 冯梦洁 肖勇 许文豪
受保护的技术使用者:北京工业大学
技术研发日:2023.03.20
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
