一种基于YOLOv5改进的口罩佩戴检测方法
未命名
07-23
阅读:235
评论:0
一种基于yolov5改进的口罩佩戴检测方法
技术领域
1.本发明属于目标检测领域,具体为一种基于yolov5改进的口罩佩戴检测方法。
背景技术:
2.如今在一些煤矿、矿井等特定的工作区域,标准规范佩戴防尘口罩是安全工作的要求。对于在密闭的煤矿、矿井环境中,如果没有合理佩戴防尘口罩,将会对工人的健康造成严重的安全隐患,而且对于小目标口罩以及在人群密集处的检测容易出现漏检和误检问题。因此,为保障工人的安全以及秩序工作,检测佩戴口罩的问题最为重要。
3.当前基于深度学习的目标检测技术迅速发展,其主要应用在工业检测、交通安全等领域。基于深度学习的目标检测分为两类分别为:两阶段和单阶段目标检测。两阶段目标检测主要以mask_rcnn为代表,该类方法检测精确度高但实时性差。单阶段目标检测主要以yolo、ssd为代表,该类方法检测精度较两阶段稍差一些,但能保障实时检测问题。因此,基于深度学习的目标检测技术为口罩佩戴问题提供了一种全新的解决方法。
技术实现要素:
4.本发明目的是为解决当前yolov5目标检测模型对小目标口罩佩戴检测效果不足,提出一种基于yolov5改进的口罩佩戴检测方法,不仅提升了口罩佩戴检测精确度,还改善对远距离以及密集人群处佩戴口罩小目标检测效果,降低了误检漏检情况。
5.本发明所采用的技术方案是,
6.一种基于yolov5改进的口罩佩戴检测方法,具体按照如下步骤进行:
7.步骤1:收集佩戴和未佩戴口罩图像数据,采用labelimg工具进行标注,制作数据集;
8.步骤2:搭建改进的yolov5网络模型;
9.步骤3:将口罩数据集中的训练集图像数据输入至步骤2改进后的yolov5网络模型中进行训练,保存训练过程中改进yolov5模型在验证集上准确率最高的模型参数,将其文件命名为best.pt;
10.步骤4:输入含有佩戴和未佩戴口罩目标的待检测图像至改进的yolov5模型,加载步骤3中的最优权重文件best.pt至检测模型中进行推理检测,获取待检测图像中的目标是否佩戴口罩。
11.优选的,步骤1具体包括:
12.步骤1.1:通过对百度图片和飞桨开源数据在线搜集的方式收集佩戴和未佩戴口罩图像数据为7952张,主要包含正确佩戴口罩和未佩戴口罩图片数据;
13.步骤1.2:使用labelimg进行图片标注,生成对应的xml标注文件;
14.步骤1.3:将生成的xml文件转换为可用于yolov5模型训练的txt文件,并将其按照8:2划分为训练集:验证集,可用于模型训练。
15.优选的,步骤2具体包括:
16.步骤2.1:在骨干网络中,将acmix注意力模块添加在骨干网络的第9层,增加集成自注意力和卷积注意力的acmix注意力模块,兼顾全局特征和局部特征,获取更大的感受野以及捕捉小目标物体更多的特征信息,增强改进网络对小目标物体的检测效果。同时与纯卷积或自注意计算相比,acmix模块具有最小的计算开销;
17.acmix模块原理流程如下:输入h
×w×
c的特征,输入特征经3个1
×1×
c卷积后得到3
×
n个尺寸均为(h
×w×
c/n)的特征,特征进入下一阶段。下一阶段分为卷积分支和自注意力分支,卷积分支即卷积核大小为k的卷积路径,子特征先通过一个全连接层,生成k2个特征,生成的特征经移位、聚合等传统卷积操作,收集局部感受野信息,形成该分支的h
×w×
c最新特征。对于自注意分支,将输入的3
×
n特征分别分为3组,每组n个特征,分别对应值、键和查询,按照传统的自注意力模式进行收集信息,最后得到该阶段的h
×w×
c的特征。最后,对卷积分支和自注意分支分别得到的输出进行并行操作,分支中强度分别由α、β标量控制,公式如下所示:
18.f
out
=αf
att
+βf
conv
ꢀꢀ
(1)
19.上式(1)中,f
att
、f
conv
分别为自注意力分支输出结果、卷积分支输出结果,f
out
为最终分支的输出结果;
20.步骤2.2:在yolov5颈部结构中,采用一种加权双向金字塔网络(bifpn)替换原始特征融合层。原始的目标检测模型特征融合层采用自顶向下的fpn网络,易受到单向信息交流限制且精度较低。加权双向金字塔网络(bifpn)运用了自顶向下和自底向上的双向融合方法,将不同尺度的特征进行特征融合,采用上采样和下采样的方法统一不同分辨率的尺度,并在同一尺度上建立双向连接,以实现更高层次、不同尺度之间的特征融合,通过加权双向金字塔网络(bifpn)结构实现低维和高维特征融合,在一定程度上解决小目标物体特征信息丢失问题。带权特征融合不同于传统的之间简单特征叠加或相加的特征融合方法,加权双向金字塔网络(bifpn)更好地平衡不同尺度的特征信息,针对学习不同输入信息特征的重要性,区分融合不同的输入特征,是一种简单而且高效的加权特征融合机制,因此加权双向金字塔网络(bifpn)采用快速归一化方法(fast normalized fusion)。相比基于softmax的融合(softmax-based fusion)方法,该方法速度更快。快速归一化方法定义为:
[0021][0022]
上式(2)中,ο代表加权特征融合的最终结果,wi、wj代表权重且wi、wj≥0,∈是一个很小的值用来保障数值稳定,lni表示输入的特征;
[0023]
步骤2.3:为减轻一定的模型复杂度且保持一定的精度,改进的网络模型在颈部结构中,将传统卷积模块替换为鬼影混洗卷积(gsconv)模块。鬼影混洗卷积(gsconv)模块结合标准卷积与深度可分离卷积以及通道混洗操作,在一定程度上保持了精度且降低模型复杂度。相比深度可分离卷积,鬼影混洗卷积(gsconv)模块解决了通道信息大量丢失问题。相比标准卷积,鬼影混洗卷积(gsconv)模块减少了占用大量的计算资源问题。
[0024]
由于输入的图片数据必须经过主干网络的转换过程,即特征信息由空间信息向通道传输,且每次将对特征图进行空间压缩和通道扩展,虽密集卷积在最大程度上保留了通道之间的连接,但稀疏卷积将其切断,导致会出现语义信息丢失问题。在yolov5模型颈部结构中引入鬼影混洗卷积(gsconv)模块,在一定程度上保留了通道之间连接,降低模型复杂
度,保证目标检测的准确率。改进的网络模型只在neck结构中使用鬼影混洗卷积(gsconv)模块,若模型整个阶段都使用鬼影混洗卷积(gsconv)模块,将会导致模型网络层数加深,进而引起模型推理时间增加。当特征图进入颈部结构中,通道维度最大,高宽维度最小,使用鬼影混洗卷积(gsconv)模块将会使得模型精确度最佳,提高模型推理速度。
[0025]
鬼影混洗卷积(gsconv)模块原理如下:设置输入的通道为c1,输出通道为c2。输入特征图经标准卷积后得到输出通道为c2/2的特征张量,该特征张量经深度可分离卷积后得到另一特征张量,将处理后的两个特征张量进行拼接操作。再经通道打乱后,将生成的信息渗透到深度可分离卷积生成的特征张量的每个部分;
[0026]
步骤2.4:针对改进的yolov5网络模型使用最优anchor参数,运用k-means++算法对口罩数据集中的目标框宽高进行重新聚类分析,取得与口罩相匹配的先验框尺寸,优化模型对目标的误检率。首先,该聚类方法随机选取口罩数据集中一个样本作为初始聚类中心。其次,则对选取的样本与每个样本之间的距离d(x)进行计算。最后,则计算样本点被选为下个聚类中心的概率p,p公式为如下(3)所示:
[0027][0028]
重复上述步骤,直至选取k个聚类中心,以此来确定改进模型的anchor参数最优值;
[0029]
步骤2.5:改进的网络损失函数,设置siou_loss代替yolov5网络中bounding box的损失函数。siou_loss则引入了真实框和预测框之间的向量角度,重新定义了损失函数,使其模型的训练速度和推理能力都有所提升。siou_loss主要包含三部分角度损失,距离损失和形状损失。
[0030]
角度损失公式:其中ch为预测框与真实框中心点之间的高度差,σ为预测框与真实框中心点之间的距离,α为角度,为真实框中心坐标点,为预测框中心坐标点,若角度α为或0时,角度损失为0,若角度α在训练过程中小于最小化则使用α,反之则是最小化β,
[0031][0032][0033][0034][0035]
距离损失公式:其中(cw,ch)为预测框与真实框最小外接矩形的宽与高,随着角度逐渐趋于0,距离损失的贡献成本下降,反之,当角度逐渐趋于距离损失的贡献成本越大,因此,γ跟随角度的增大,被赋予时间优先距离值,
[0036]
[0037][0038][0039]
γ=2-λ
ꢀꢀ
(12)
[0040]
形状损失公式:其中θ控制对形状损失的关注程度,θ数值定义为2到6之间,(w,h)和(w
gt
,h
gt
)分别为预测框与真实框的宽和高,
[0041][0042][0043][0044]
siou的损失函数定义如下,角度损失的增加,使得损失函数的表达更加充分,使得模型训练更加平稳收敛,提升训练的回归精度,提高训练速度,减少模型预测误差,
[0045][0046]
优选的,步骤3具体包括:
[0047]
步骤3.1:将口罩数据集中的训练集图片数据输入到改进后的网络模型中,使用gpu训练,设置改进后的网络模型参数,训练轮数为150轮,动量为0.937,初始学习率为0.01,最小学习率为0.0001,权重衰减系数为0.00005,采用sgd优化器,batch-size为16。模型训练过程中,会保存准确率最优的模型参数,将其命名为best.pt。
[0048]
优选的,步骤4具体包括:
[0049]
步骤4.1:为检测改进后的模型性能,采用精确率(precision)、平均精度均值(map)作为模型算法的评价指标。通过模型检测目标的准确度即为精确率,精确率定义概念为正确预测为正样本的占全部预测为正样本的比例,
[0050][0051][0052][0053][0054]
上式中,recall为召回率,tp代表样本中正确预测为正样本的个数,fp代表样本中被错误预测为正样本的负样本的个数。n代表类别个数,api代表第i类平均精度(ap)。
附图说明
[0055]
图1为本发明一种基于yolov5改进的口罩佩戴检测方法的流程图;
[0056]
图2为本发明一种基于yolov5改进的口罩佩戴检测方法的总体网络模型架构图;
[0057]
图3为本发明一种基于yolov5改进的口罩佩戴检测方法中acmix注意力模块原理
结构图;
[0058]
图4为本发明一种基于yolov5改进的口罩佩戴检测方法中使用加权双向特征金字塔网络(bifpn)的原理结构图;
[0059]
图5为本发明一种基于yolov5改进的口罩佩戴检测方法中使用的鬼影混洗卷积(gsconv)的原理结构图;
[0060]
图6为本发明一种基于yolov5改进的口罩佩戴检测方法中的改进后的yolov5网络模型训练过程曲线图;
[0061]
图7为改进后的yolov5网络模型口罩佩戴检测效果图。
[0062]
图8为原始yolov5网络模型口罩佩戴检测效果图。
[0063]
图9为改进后的yolov5网络模型口罩佩戴检测效果图。
[0064]
图10为原始yolov5网络模型口罩佩戴检测效果图。
[0065]
图11为改进后的yolov5网络模型口罩佩戴检测效果图。
[0066]
图12为原始yolov5网络模型口罩佩戴检测效果图。
具体实施方式
[0067]
为了使本发明的目的、特征和优点更加清晰,下面结合附图和具体实施方式对本发明一种基于yolov5改进的口罩佩戴检测方法进行清晰、完整地描述。此外,本发明所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
[0068]
本发明的目的在于克服当前技术的不足,提供基于yolov5改进的口罩佩戴检测方法,解决面向煤矿、矿井场合下工人佩戴口罩目标物体小,佩戴口罩密集而导致的漏检、误检等情况。具体如图1至图5所示,一种基于yolov5改进的口罩佩戴检测方法,包含一下步骤:
[0069]
步骤1:收集佩戴和未佩戴口罩图像数据,采用labelimg工具进行标注,制作数据集;
[0070]
通过对百度图片和飞桨开源数据在线搜集的方式收集佩戴和未佩戴口罩图像数据为7952张,主要包含正确佩戴口罩和为佩戴口罩图片数据。通过使用labelimg标注软件对图片进行标注,生成对应图片的xml标注文件。将生成的xml文件转换成可用于yolov5模型训练的txt文件,并将其按照8:2划分为训练集:验证集,可用于模型训练。
[0071]
步骤2:搭建改进的yolov5网络模型;
[0072]
yolov5是一种单阶段目标检测算法,该模型有着速度更快的推理速度以及更小巧的网络结构。根据图2可以看出,yolov5网络模型结构主要包含四部分,即input输入端、backbone主干网络、neck颈部结构和head输出层。通过对原始yolov5网络模型改进,得到改进后的目标检测模型。
[0073]
步骤2.1:添加注意力模块acmix到yolov5骨干网络中;
[0074]
在骨干网络中,将acmix模块添加在骨干网络的第9层,增加集成自注意力和卷积注意力的acmix注意力模块,兼顾全局特征和局部特征,获取更大的感受野以及捕捉小目标物体更多的特征信息,增强改进网络对小目标物体的检测效果。同时与纯卷积或自注意计算相比,acmix模块具有最小的计算开销。
[0075]
步骤2.2:采用一种加权双向金字塔网络(bifpn)替换原始特征融合层作为改进
yolov5的特征融合网络;
[0076]
加权双向金字塔网络(bifpn)运用了自顶向下和自底向上的双向融合方法,将不同尺度的特征进行特征融合,采用上采样和下采样的方法统一不同分辨率的尺度,并在同一尺度上建立双向连接,以实现更高层次、不同尺度之间的特征融合,通过加权双向金字塔网络(bifpn)结构实现低维和高维特征融合,在一定程度上解决小目标物体特征信息丢失问题。
[0077]
步骤2.3:改进的网络模型在颈部结构中,将传统卷积模块替换为鬼影混洗卷积(gsconv)模块,为减轻一定的模型复杂度且保持一定的精度;
[0078]
鬼影混洗卷积(gsconv)结构结合标准卷积与深度可分离卷积以及通道混洗操作,在一定程度上保持了精度且降低模型复杂度。相比深度可分离卷积,鬼影混洗卷积(gsconv)模块解决了通道信息大量丢失问题。相比标准卷积,鬼影混洗卷积(gsconv)模块减少了占用大量的计算资源问题。在yolov5模型颈部结构中引入鬼影混洗卷积(gsconv)模块,在一定程度上保留了通道之间连接,降低模型复杂度,保证目标检测的准确率。改进的网络模型只在颈部结构中使用鬼影混洗卷积(gsconv)模块,若模型整个阶段都使用鬼影混洗卷积(gsconv)模块,将会导致模型网络层数加深,进而引起模型推理时间增加。当特征图进入颈部结构中,通道维度最大,高宽维度最小,使用鬼影混洗卷积(gsconv)模块将会使得模型精确度最佳,提高模型推理速度。
[0079]
步骤2.4:采用k-means++算法代替k-means算法来获取anchor参数,优化目标锚框;
[0080]
在yolov5算法中,针对不同数据集问题,都会设定初始锚框长宽。而在网络模型训练过程中,网络是在初始锚框基础上进行输出预测框,在与真实框进行对比,计算两者差距。因此,设定初始候选框的参数值对改进目标检测模型训练至关重要。针对改进的yolov5网络模型使用最优anchor参数,运用k-means++算法对口罩数据集中的目标框宽高进行重新聚类分析,取得与口罩相匹配的先验框尺寸,优化模型对目标的误检率。
[0081]
步骤2.5:改进的网络损失函数,设置siou_loss代替yolov5网络中bounding box的损失函数。
[0082]
原始yolov5采用giou_loss做bounding box损失函数,但是其收敛速度较慢,且当真实框与预测框相互覆盖时,giou-loss是一个定值。但siou_loss则引入了真实框和预测框之间的向量角度,重新定义了损失函数,使其模型的训练速度和推理能力都有所提升,siou_loss主要包含三部分角度损失,距离损失和形状损失。
[0083]
角度损失公式如下所示:其中ch为预测框与真实框中心点之间的高度差,σ为预测框与真实框中心点之间的距离,α为角度,为真实框中心坐标点,为预测框中心坐标点,若角度α为或0时,角度损失为0.若角度α在训练过程中小于最小化则使用α,反之则是最小化β,
[0084][0085]
[0086][0087][0088]
距离损失公式:其中(cw,ch)为预测框与真实框最小外接矩形的宽与高,随着角度逐渐趋于0,距离损失的贡献成本下降,反之,当角度逐渐趋于距离损失的贡献成本越大,因此,γ跟随角度的增大,被赋予时间优先距离值,
[0089][0090][0091][0092]
γ=2-λ
ꢀꢀ
(8)
[0093]
形状损失公式:其中θ控制对形状损失的关注程度,θ数值定义为2到6之间,(w,h)和(w
gt
,h
gt
)分别为预测框与真实框的宽和高,
[0094][0095][0096][0097]
siou的损失函数定义如下,角度损失的增加,使得损失函数的表达更加充分,使得模型训练更加平稳收敛,提升训练的回归精度,提高训练速度,减少模型预测误差,
[0098][0099]
步骤3:将口罩数据集中的训练集图像数据输入至步骤2改进后的yolov5网络模型中进行训练,保存训练过程中改进yolov5模型在验证集上准确率最高的模型参数,将其文件命名为best.pt;
[0100]
本发明一种基于yolov5改进的口罩佩戴检测方法实验环境配置为选用ubuntu20.04操作系统,使用nvidia geforce rtx 3090显卡,深度学习框架为pytorch。具体配置如下表1所示:
[0101]
表1实验环境配置表
[0102][0103]
将口罩数据集中的训练集图片数据输入到改进后的网络模型中,使用gpu训练,设置改进后的网络模型参数,训练轮数为150轮,动量为0.937,初始学习率为0.01,最小学习率为0.0001,权重衰减系数为0.00005,采用sgd优化器,batch-size为16。模型训练过程中,会保存准确率最优的模型参数,将其命名为best.pt。
[0104]
步骤4:输入含有佩戴和未佩戴口罩目标的待检测图像至改进的yolov5模型,加载步骤3中的最优权重文件best.pt至检测模型中进行推理检测,获取待检测图像中的目标是否佩戴口罩。
[0105]
为检测改进后的模型性能,采用精确率(precision)、平均精度均值(map)作为模型算法的评价指标。通过模型检测目标的准确度即为精确率,精确率定义概念为正确预测为正样本的占全部预测为正样本的比例,
[0106][0107][0108][0109][0110]
上式中,recall为召回率,tp代表样本中正确预测为正样本的个数,fp代表样本中被错误预测为正样本的负样本的个数。n代表类别个数,api代表第i类平均精度(ap)。
[0111]
图6中为模型训练150轮过程中各项指标的变化曲线,模型训练完成后,经验证集测试,其验证集的precision达到96.5%,map达到94.1%。与原始yolov5相比,本文算法在precision上提升了2.1%,map提升了0.3%。其中,precision代表模型的准确度,该指标越大说明模型识别效果好;map代表模型在所有类别上的好坏,该指标越大说明模型网络性能好。算法指标对比表如表2所示,证明了本发明算法的可行性。
[0112]
表2算法性能对比表
[0113][0114]
该改进算法应用在在煤矿、矿井环境场合中,通过获取煤矿工人现场图像,将现场图像输入改进的yolov5模型中,经加载最优权重文件best.pt至检测模型中进行推理检测,
获取待检测图像中的目标是否佩戴口罩。
[0115]
通过本文提出的算法针对煤矿、矿井场合下的小目标口罩物体、人群密集处的口罩遮挡问题,本文提出的算法降低了对小目标口罩物体的误检和漏检情况,提升了对小目标口罩物体检测的精确度。如图7、图9和图8、图10所示,前者分别为本文提出的算法所获取的检测效果图、后者为原始yolov5的检测效果图,可看出本文改进的算法比原始yolov5针对小目标口罩物体、人群密集处的口罩遮挡问题,检测精度高且正确识别。图12为原始yolov5的检测效果图,该检测效果存在漏检、误检问题,图11为本文算法的检测效果图,解决了原始yolov5网络中的漏检、误检问题。
[0116]
本发明所提出的一种基于yolov5改进的口罩佩戴检测方法,不仅提升了口罩佩戴检测精确度,还改善对小目标口罩物体、人群密集处的口罩遮挡检测问题,降低了误检漏检情况。
[0117]
上述实施例为本发明的一种实施方式,但本发明的实施方式不限定于此,对于从事本领域的技术人员在未背离本发明的原理和精神下所做的任何修改、替换、改进,均包含在本发明的保护范围内。
技术特征:
1.一种基于yolov5的口罩佩戴检测方法,其特征在于,具体按照如下步骤进行:步骤1:收集佩戴和未佩戴口罩图像数据,采用labelimg工具进行标注,制作数据集;步骤2:搭建改进的yolov5网络模型;步骤3:将口罩数据集中的训练集图像数据输入至步骤2改进后的yolov5网络模型中进行训练,保存训练过程中改进yolov5模型在验证集上准确率最高的模型参数,将其文件命名为best.pt;步骤4:输入含有佩戴和未佩戴口罩目标的待检测图像至改进的yolov5模型,加载步骤3中的最优权重文件best.pt至检测模型中进行推理检测,获取待检测图像中的目标是否佩戴口罩。2.根据权利要求1所述的一种基于yolov5的口罩佩戴检测方法,其特征在于,在步骤1中收集佩戴和未佩戴口罩图像数据,采用labelimg工具进行标注,制作数据集,具体包括以下步骤:步骤1.1:通过对百度图片和飞桨开源数据在线搜集的方式收集佩戴和未佩戴口罩图像数据为7952张,包含正确佩戴口罩和未佩戴口罩图片数据;步骤1.2:使用labelimg进行图片标注,生成对应的xml标注文件;步骤1.3:将生成的xml文件转换为可用于yolov5模型训练的txt文件,并将其按照8:2划分为训练集:验证集,可用于模型训练。3.根据权利要求1所述的一种基于yolov5的口罩佩戴检测方法,其特征在于,在步骤2中搭建改进的yolov5网络框架,具体包括以下步骤:步骤2.1:将集成自注意力和卷积注意力的acmix注意力模块添加在yolov5骨干网络的第9层,acmix注意力模块对卷积分支和自注意分支分别得到的输出进行并行操作,分支中强度分别由α、β标量控制,公式如下所示:f
out
=αf
att
+βf
conv
ꢀꢀꢀꢀꢀꢀ
(1)上式(1)中,f
att
、f
conv
分别为自注意力分支输出结果、卷积分支输出结果,f
out
为最终分支的输出结果;步骤2.2:在yolov5颈部结构中,采用一种加权双向金字塔网络(bifpn)替换原始特征融合层。一种加权双向金字塔网络(bifpn)采用快速归一化方法(fast normalized fusion)。相比基于softmax的融合(softmax-based fusion)方法,该方法速度更快。快速归一化方法定义为:上式(2)中,ο代表加权特征融合的最终结果,w
i
、w
j
代表权重且w
i
、w
j
≥0,∈是一个很小的值用来保障数值稳定,ln i表示输入的特征;步骤2.3:改进yolov5颈部结构的传统卷积模块,将传统卷积模块替换为结合标准卷积与深度可分离卷积以及通道混洗操作的鬼影混洗卷积(gsconv)模块;步骤2.4:针对改进的yolov5网络模型使用最优anchor参数,运用k-means++算法对口罩数据集中的目标框宽高进行重新聚类分析,取得与口罩相匹配的先验框尺寸,优化模型对目标的误检率,首先,该聚类方法随机选取口罩数据集中一个样本作为初始聚类中心,其次,则对选取的样本与每个样本之间的距离d(x)进行计算,最后,则计算样本点被选为下个
聚类中心的概率p,p公式为如下(3)所示:重复上述步骤,直至选取k个聚类中心,以此来确定改进模型的anchor参数最优值;步骤2.5:改进的网络损失函数,设置siou_loss代替yolov5网络中bounding box的损失函数,siou_loss则引入了真实框和预测框之间的向量角度,重新定义了损失函数,使其模型的训练速度和推理能力都有所提升,siou_loss主要包含三部分角度损失,距离损失和形状损失。角度损失公式:其中c
h
为预测框与真实框中心点之间的高度差,σ为预测框与真实框中心点之间的距离,α为角度。为真实框中心坐标点,为预测框中心坐标点,若角度α为或0时,角度损失为0.若角度α在训练过程中小于最小化则使用α,反之则是最小化β,是最小化β,是最小化β,是最小化β,距离损失公式:其中(c
w
,c
h
)为预测框与真实框最小外接矩形的宽与高,随着角度逐渐趋于0,距离损失的贡献成本下降,反之,当角度逐渐趋于距离损失的贡献成本越大,因此,γ跟随角度的增大,被赋予时间优先距离值,此,γ跟随角度的增大,被赋予时间优先距离值,此,γ跟随角度的增大,被赋予时间优先距离值,γ=2-λ
ꢀꢀꢀꢀꢀꢀꢀ
(12)形状损失公式:其中θ控制对形状损失的关注程度,θ数值定义为2到6之间,(w,h)和(w
gt
,h
gt
)分别为预测框与真实框的宽和高,)分别为预测框与真实框的宽和高,)分别为预测框与真实框的宽和高,siou的损失函数定义如下,角度损失的增加,使得损失函数的表达更加充分,使得模型训练更加平稳收敛,提升训练的回归精度,提高训练速度,减少模型预测误差,
4.根据权利要求1所述的一种基于yolov5的口罩佩戴检测方法,其特征在于,在步骤3中将口罩数据集中的训练集图像数据输入至步骤2改进后的yolov5网络模型中进行训练,保存训练过程中改进yolov5模型在验证集上准确率最高的模型参数,将其文件命名为best.pt,具体包括以下步骤:步骤3.1:将口罩数据集中的训练集图片数据输入到改进后的网络模型中,使用gpu训练,设置改进后的网络模型参数,训练轮数为150轮,动量为0.937,初始学习率为0.01,最小学习率为0.0001,权重衰减系数为0.00005,采用sgd优化器,batch-size为16。模型训练过程中,会保存准确率最优的模型参数,将其命名为best.pt。5.根据权利要求1所述的一种基于yolov5的口罩佩戴检测方法,其特征在于,在步骤4中输入含有佩戴和未佩戴口罩目标的待检测图像至改进的yolov5模型,加载步骤3中的最优权重文件best.pt至检测模型中进行推理检测,获取待检测图像中的目标是否佩戴口罩,具体包括以下步骤:步骤4.1:为检测改进后的模型性能,采用精确率(precision)、平均精度均值(map)作为模型算法的评价指标。通过模型检测目标的准确度即为精确率,精确率定义概念为正确预测为正样本的占全部预测为正样本的比例,预测为正样本的占全部预测为正样本的比例,预测为正样本的占全部预测为正样本的比例,预测为正样本的占全部预测为正样本的比例,上式中,recall为召回率,tp代表样本中正确预测为正样本的个数,fp代表样本中被错误预测为正样本的负样本的个数。n代表类别个数,ap
i
代表第i类平均精度(ap)。
技术总结
本发明涉及一种基于YOLOv5改进的口罩佩戴检测方法,属于目标检测领域。该方法包含以下步骤:挖掘目标图像样本数据,构建用于口罩佩戴检测的样本数据集;分析口罩佩戴检测存在的问题,针对问题对目标检测模型YOLOv5进行改进。采用K-means++算法代替K-means算法来获取anchor参数,优化目标锚框;添加注意力模块ACmix以及将原始YOLOv5网络颈部结构替换为加权双向特征金字塔网络(BiFPN),优化对小目标的检测效果,提升目标检测精确度;使用结合标准卷积和深度可分离卷积并进行通道清洗的鬼影混洗卷积(GSConv)模块替换传统卷积模块,提升网络速度;引入SIoU_Loss作为基于YOLOv5改进算法损失函数的Bounding Box Regression Loss,使得损失函数平稳收敛,降低预测误差,提升回归精度。本发明算法采用改进YOLOv5检测算法不仅提升了口罩佩戴检测精确度,还改善对远距离以及密集人群处佩戴口罩小目标检测效果,降低了误检漏检情况。降低了误检漏检情况。降低了误检漏检情况。
技术研发人员:王媛媛 陈秀川 张兴潮 沈俞 王超 江飞龙 张海艳 任珂 严少峰
受保护的技术使用者:淮阴工学院
技术研发日:2023.04.14
技术公布日:2023/7/21
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
