一种基于背景建模和目标检测的厨房老鼠检测方法

未命名 07-22 阅读:216 评论:0


1.本发明涉及计算机视觉技术领域,尤其涉及一种基于背景建模和目标检测的厨房老鼠检测方法。


背景技术:

2.当前随着国家经济快速发展和外卖行业的兴起,社会上出现了各种各样的餐饮单位,随之而来的食品安全事件频频发生,食品安全卫生引起越来越多人的关注,人们对餐饮行业的要求也随之提高。同时随着计算机视觉技术的快速发展,计算机视觉的相关技术被应用到各个领域,尤其是视频监管智能检测分析方面被应用于各领域中。计算机技术可以很好的解决食品领域的安全卫生问题,具有视频监管智能检测分析方面的技术逐渐在餐饮行业中发挥重要作用。相比于传统的人工监管,视频监管智能检测技术不需要人工干预,利用计算机视觉技术对视频序列进行自动分析,实现目标的实时检测。
3.目前的目标检测算法是将图像全部输入到检测网络,然后输出检测结果。老鼠这种移动速度快且特征不明显的小目标,其检测的环境过于复杂且存在一定的干扰因素,单独利用机器学习的目标检测算法难以实现目标检测。随着背景建模技术的逐步成熟发展,已经被广泛应用于目标检测中。针对复杂背景下的移动目标,采用混合高斯背景建模(gaussian mixture model,gmm)算法提取移动目标所在的区域,消除背景信息对目标检测的干扰,然后将gmm算法提取的前景目标框作为目标检测算法模型的输入并进行目标检测。
4.基于深度学习的目标检测的算法主要包括:单阶段和双阶段目标检测算法。单阶段目标检测典型算法有yolov系列、ssd,双阶段目标检测典型算法有rcnn系列。单阶段目标检测算法直接对图像进行计算生成检测结果,检测速度快,但精度较低。双阶段目标检测算法先根据图像提取候选框,然后基于候选区域做二次修正得到检测点结果,检测精度较高,但检测速度较慢。单阶段目标检测主要应用于需要对视频进行实时目标检测的项目中,保证目标检测的实时性和高效性。现有的单阶段目标检测算法只适用于单一背景和目标特征明显的场景中,但不适用于复杂背景下和目标特征不明显的场景中。在餐饮后厨中通过摄像头采集到的视频数据对老鼠进行检测过程中,由于老鼠的特征信息不足,且移动速度快,同时在厨房中存在干扰因素。因此,通过目标检测算法实现准确高效的对老鼠实时检测是一个亟待解决的难题。


技术实现要素:

5.本发明的目的在于提供一种基于背景建模和目标检测的厨房老鼠检测方法,解决了存在有干扰因素的复杂背景下的老鼠检测精度低的问题,该方法得出一种老鼠检测的通用模型,可以适用在餐饮后厨、食品加工等多种场景下,实现老鼠检测的智能化,减少人工监管所耗费的时间和精力,一定程度上解决老鼠对食品及商品的危害。
6.为了实现上述发明目的,本发明采用技术方案具体为:一种基于背景建模和目标检测的厨房老鼠检测方法,包括以下步骤:
7.s1、样本数据采集:
8.(1)利用网络爬虫技术创建老鼠检测数据集;
9.(2)对爬虫到的数据集使用标注工具标注出bbox框;
10.s2、通过后厨的监控摄像头拍摄到的视频数据,使用混合高斯背景建模法,建立背景模型;
11.s3、针对指定帧之后的每一帧图像做前景检测,提取当前帧图像中所有的前景运动目标的目标框;
12.s4、对所述目标框建立混合高斯分布模型;
13.s5、老鼠检测:
14.(1)对现有的yolov5目标检测算法进行优化并建立老鼠检测模型;
15.(2)模型剪枝;
16.(3)对s3中提取出的区域进行目标检测。
17.s6、输出目标检测结果。
18.对于步骤s1,本发明采用简单灵活的python网络爬虫技术,相较于其他爬虫技术,python抓取网页文档接口更加简洁;提供了简洁的文档处理功能,可以用很短的代码完成大部分文档处理;本发明标注工具采用可视化的图像标定工具labelimg,labelimg基于python的pyqt5进行制作,用qt作为图形界面,最后生成txt文件;
19.对于步骤s2,本发明中厨房的监控摄像头是固定的,监控摄像头不可自动旋转移动,监控场景稳定,背景的变化是缓慢的。使用混合高斯背景建模法构建背景模型时,背景图像中的每一个像素分别用由k个高斯分布构成的混合高斯模型来建模:
[0020][0021][0022]
式中,g是背景模型,x
t
是输入的像素,n是混合高斯模型,ω
k,t
是混合高斯模型中t时刻像素点x对应的第k个高斯分布的权值,μ
k,t
和σ
k,t
分别表示混合高斯模型中t时刻像素点x对应的第k个高斯分布的均值和标准差。
[0023]
对于步骤s2,本发明中采用背景建模流程如下:
[0024]
(1)初始化:选择高斯分布的个数k和学习率;输入第一帧图像,对每个像素x
t
,分别初始化k个均值μ
k,t
,标准差为σ
k,t
的高斯函数,对应的权重分别为ω
k,t
,k。
[0025]
(2)判断像素与k个高斯分布是否匹配
[0026]
获取第k帧图像,像素为x
t
,查看像素与k个高斯分布是否匹配,若满足(3)式,则认为该像素点与高斯分布模型匹配,否则认为不匹配,如果有多个匹配,从中选择最好的一个。
[0027]
|x
t-μ
k,t-1
|《2.5σ
k,t-1
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0028]
式中,x
t
为当前像素点,μ
k,t-1
和σ
k,t-1
分别为第k个高斯分布在t-1时刻的均值和标准差。
[0029]
(3)高斯分布的参数更新
[0030]
若当前像素值满足(3)式的判断标准,则该点为背景点。此时需要对该匹配模型的
各参数进行如下更新:
[0031][0032][0033]
其中ω
k,t
为不同时刻权重值,决定了该高斯分量可匹配度高低,越高权重值越大。α为学习率,β表示各参数更新快慢,为方差,m
k,t
为模型是否匹配调控值,匹配时取1,不匹配时取0;
[0034]
若当前像素点与高斯分布均不匹配,则用当前帧的均值,初始化一个较大方差、较小权重的高斯分布替换掉背景模型中权重系数最小的高斯分布;权重更新时,m
k,t
在不匹配时取0;对于其他高斯分布,其均值和方差取值不变。
[0035]
(4)分布排序
[0036]
将高斯分布的优先级按的值从大到小排列。
[0037]
(5)确定背景模型
[0038]
在对各个模型参数进行更新之后,几个发生变化的权重值需要采取归一化处理,这里通过权重与方差的比值排序来对比各个模型的取舍,这是因为当权重太低时进行背景判断的结果是很难作为一个参考的。一般选取前m个作为后续用到的匹配模型,选取合适的t值(t越大,算法复杂度越高,但同时检测效果更佳),则m可表示为:
[0039][0040]
式中t是选择前m各背景分布的阈值;确定当前点为前景点是由k个模型均不满足(3)式得到的。此时由于前面有舍弃掉权重小的模型,所以此时通过当前像素点来确定一个新高斯分量。同样设该高斯分量当前值为均值,方差依照步骤(1)中的方式来确定。此时由于添加了新的高斯分量,则需要再进行一次权值更新以及归一化:
[0041]
ω

k,t
=(1-α)ω
k,t-1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0042][0043]
在背景模型m
t
(x,y)确定以后,再通过与原图像i
t
(x,y)简单的背景差分就可以得到前景二值化图像素值:
[0044]dt
(x,y)=|i
t
(x,y)-m
t
(x,y)|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0045]
对于步骤s3,本发明针对指定帧之后的每一帧图像做前景检测,提取当前帧图像中所有的前景运动目标的目标框;具体前景检测流程如下:
[0046]
(1)构建(x,y)位置的历史像素集合b(x,y);m(x,y)={v1(x,y),v2(x,y),v3(x,y),

,vn(x,y)},其中vi(x,y)表示第i帧图像中(x,y)位置的像素值;当运行至指定帧之后时﹐计算位置(x,y)处的像素点与对应的历史像素值集合中各元素的距离;所述距离为位置(x,y)处的像素点的像素值与历史像素值集合中任一元素的像素值差。
[0047]
(2)统计距离小于阈值t的元素数量q;若所述元素数小于阈值q
min
,则记该位置(x,
y)处的像素点为前景,否则该位置(x,y)处的像素点为背景,并将该像素点更新至历史像素值集合m(x,y)中,对背景模型进行更新。
[0048][0049]
式中,r(x,y)为前景检测结果,q为历史像素值集合中与位置(x,y)处的像素点的距离小于阈值t的元素数量。
[0050]
(3)按以上步骤处理下一帧图像,不断迭代。
[0051]
(4)接下来对提取出的前景运动目标进行处理,然后采用边界寻找得到包围边界点集的最小矩形。
[0052]
对于步骤s5,本发明采用基于单阶段目标识别算法yolov5作为老鼠检测算法。由于老鼠的体积过小且有一定的移动速度,采用单阶段的目标检测算法难以精准快速的检测。因此对原有的yolov5目标检测算法进行多尺度特征融合的优化,来解决老鼠检测目标占整幅图像的比例过小的问题,因此对原算法进行多尺度特征融合优化。同时,原始yolov5中使用giou来计算定位损失,与ou不同,giou不仅关注真实框与预测框之间的重叠面积,还关注其他的非重叠区域,因此giou相较于iou能更好的反应两者之间的重合度,但glou始终只考虑真实框与预测框之间的重叠率这一个因素,不能很好地描述目标框的回归问题。当预测框在真实框内部时,且预测框的大小相同时,此时glou会退化为lou,无法区分各个预测框之间的位置关系,所以发明选择ciou替代giou作为目标回归的损失函数。
[0053][0054][0055][0056]
式中,lou是锚框损失函数,其结果是由预测框和真实框两个区域重叠的部分除以两个区域的集合部分得出;b,b
gt
分别是预测框和真实框的中心点;ρ2(b,b
gt
)是预测框和真实框的中心点的欧式距离;c是能够同时包含预测框和真实框的最小闭包区域的对角线距离;α是一个平衡参数,不参与梯度计算;v是用来衡量长宽比一致性的参数;w,h分别是预测框的宽和高;w
gt
,h
gt
分别是真实框的宽和高。
[0057]
ciou综合考虑了真实框与预测框之间的重叠率、中心点距离、长宽比,使得目标框回归过程中更加稳定,收敛的精度更高。通过网络爬虫及餐饮后厨摄像头视频资料获取老鼠数据集并对数据预处理、标注信息、格式转换,对处理完的数据集利用优化后的算法进行训练,最后获得老鼠目标检测模型。
[0058]
为了提升算法模型的检测速度,将训练后的yolov5算法模型输入到剪枝网络进行模型剪枝,得到模型参数较少、检测速度快的改进yolov5算法模型。网络剪枝采用通道稀疏化的方法,通道稀疏化(channel-wise)是将和一个通道有关联的所有输入和输出的连接全都裁剪掉。首先对每一个通道引人一个缩放因子γ,将此缩放因子和通道的输出相乘。然后联合训练网络权重和这些缩放因子,接着将缩放因子小的通道直接删除掉,最后微调剪枝后的网络。此过程中,目标函数定义如公式(14)所示。
[0059][0060]
式中:(x,y)是训练的数据和标签;w是网络的可训练参数;∑l(f(x,w),y)是网络的损失函数;g(γ)=|γ|是缩放因子上的乘法项即l1正则化;λ是两者的平衡因子。
[0061]
yolov5的backbone部分的卷积层后都接着使用bn(batch normalization)层,直接将bn层的γ参数作为缩放因子,bn层的转换公式如(15)所示,z
in
和z
out
分布是bn层的输入与输出,b是指bn层使用mini-batch的统计特性对激活值进行归一化。
[0062][0063]
式中,γ和β是可学习的参数,μb和分别是均值和方差;引入缩放因子正则化后,训练出来的模型很多因子都会趋近于0,然后对训练后的缩放因子按绝对值排序,从小到大排序中的某个位置的缩放因子为阈值,最后就得到一个参数少、紧凑的yolov5模型。
[0064]
将s3中提取到的当前帧图像中的前景运动目标的目标框作为yolov5老鼠检测模型的输入,并进行检测,最后输出目标检测结果。
[0065]
与现有技术相比,本发明的有益效果为:
[0066]
1、本发明的方法能够解决在背景复杂、存有干扰因素情况下对目标的精准定位,通过混合高斯背景建模提取老鼠的前景目标锚框;首先通过背景建模确定背景模型,然后根据获取的视频帧提取目标前景框,该方法的检测精度高,实时性好。
[0067]
2、本发明的方法能够解决复杂场景下的特征不明显且移动的小目标检测问题,通过混合高斯背景建模提取老鼠的目标区域的位置信息,将待检测区域位置信息输入到优化和训练后的单阶段目标识别算法中检测,得出一种老鼠检测的通用模型,可以适用在餐饮后厨、食品加工等多种场景下。
[0068]
3、本发明的方法可以应用于餐饮后厨复杂场景中,集成到“明厨亮灶”监控平台现有的系统中,实现模型的即插即用,将检测结果以日志的形式发送给管理员,及时检测并制止卫生隐患行为
附图说明
[0069]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0070]
图1为本发明中基于混合高斯背景建模和目标识别的后厨房老鼠实时识别方法的流程图。
[0071]
图2为本发明中混合高斯背景建模的流程图。
[0072]
图3为本发明中基于目标检测算法进行复杂背景下移动小目标检测的流程图。
具体实施方式
[0073]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0074]
实施例1
[0075]
参见图1至图3,本实施例提供其技术方案为,一种基于背景建模和目标检测的厨房老鼠检测方法,其中,包括以下步骤:
[0076]
s1、样本数据采集:
[0077]
(1)利用聚焦网络爬虫技术获取老鼠的数据,并把采集到的图片格式转换为.jpg进行储存;
[0078]
(2)使用labelimg标注工具标注出老鼠的锚框,在使用labelimg标注工具之前,需要创建两个文件夹,一个存放已经采集好的图片,另一个存放准备标定后的xml文件,并修改data文件夹下的predefined_classes.txt类文件并保存。其次需要配置anaconda环境,运行anaconda prompt,在终端通过pip install labelimg命令安装labelimg,并启用。进入labelimg界面需要点击open dir选择存放采集好的图片文件夹,然后再选择存放txt文件的文件夹,最后开始制作数据集;
[0079]
s2、通过后厨的监控摄像头拍摄到的视频数据,使用混合高斯背景建模法,建立背景模型;
[0080]
本实施例中采用背景建模流程如下:
[0081]
(1)初始化:选择高斯分布的个数k和学习率;
[0082]
(2)判断像素与k个高斯分布是否匹配;
[0083]
(3)高斯分布的参数更新;
[0084]
(4)分布排序:将高斯分布的优先级按的值从大到小排列;
[0085]
(5)确定背景模型。
[0086]
s3、针对指定帧之后的每一帧图像做前景检测,提取当前帧图像中所有的前景运动目标的目标框;
[0087]
(1)构建(x,y)位置的历史像素集合b(x,);m(x,y)={v1(x,y),v2(x,y),v3(x,y),

,vn(x,y)},其中vi(x,y)表示第i帧图像中(x,y)位置的像素值;
[0088]
(2)统计距离小于阈值t的元素数量q;
[0089]
(3)按以上步骤处理下一帧图像,不断迭代;
[0090]
(4)接下来对提取出的前景运动目标进行处理,然后采用边界寻找得到包围边界点集的最小矩形。
[0091]
s4、对所述目标框建立混合高斯分布模型;
[0092]
s5、在原始yolov5骨干网络的基础上对原始输入图片增加一个4倍下采样的过程,原始图片经过4倍下采样后送入到特征融合网络得到新的尺寸的特征图,该特征图能够全部覆盖老鼠的全部部位,且特征感受野较小,位置信息相对丰富,能够提升对特征不明显目标的检查效果;原始yolov5中使用giou来计算定位损失,与lou不同,giou不仅关注真实框与预测框之间的重叠面积,还关注其他的非重叠区域,因此giou相较于iou能更好的反应两者之间的重合度,但glou始终只考虑真实框与预测框之间的重叠率这一个因素,不能很好地描述目标框的回归问题。当预测框在真实框内部时,且预测框的大小相同时,此时glou会退化为lou,无法区分各个预测框之间的位置关系。本实施例选择ciou替代giou作为目标回归的损失函数,ciou综合考虑了真实框与预测框之间的重叠率、中心点距离、长宽比,使得目标框回归过程中更加稳定,收敛的精度更高。
[0093]
通过网页爬虫技术和线下餐饮后厨的视频数据获取的老鼠的数据集,并对收集的数据集进行预处理。数据集包含3000张分辨率为640
×
360的jpg图像。为了提高训练模型的稳定性,防止数据的过拟合,对数据集进行扩充,随机进行了逆时针90、180
°
、270
°
旋转,亮度增强,锐度增强等常见方式进行数据增强。使用上述方法将数据集扩充至6500张,随机划分前80%进行训练,后20%作为验证集进行验证。使用标注工具labelimg对数据集进行人工标注老鼠标签,并转换txt文件格式并保存,然后对优化后的算法模型进行训练,获得老鼠检测模型。
[0094]
然后将获得的老鼠检测算法模型输入到剪枝网络进行模型剪枝,得到模型参数较少、检测速度快的改进yolov5算法模型。
[0095]
s6、输出目标识别结果,结果有两种,分别是出现老鼠和未出现老鼠。
[0096]
为了验证本实施例方法的有效性,分别在pc机、嵌入式设备上进行老鼠检测实验。本方法使用python语言编写,先在pc机上用pycharm验证了代码的正确性;后把该代码部署到嵌入式hi3516dv300编译运行,实验结果显示也具有较好的速率和准确率。
[0097]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,包括以下步骤:s1、样本数据采集:(1)利用网络爬虫技术创建老鼠检测数据集;(2)对爬虫到的数据集使用标注工具标注出bbox框;s2、通过后厨的监控摄像头拍摄到的视频数据,使用混合高斯背景建模法,建立背景模型;s3、针对指定帧之后的每一帧图像做前景检测,提取当前帧图像中所有的前景运动目标的目标框;s4、对所述目标框建立混合高斯分布模型;s5、老鼠检测:(1)对现有的yolov5目标检测算法进行优化并建立老鼠检测模型;(2)模型剪枝;(3)对步骤s3中提取出的区域进行目标检测;s6、输出目标检测结果。2.根据权利要求1所述的基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,所述步骤s1中,采用python网络爬虫技术,python抓取网页文档接口,用短的代码完成大部分文档处理;标注工具采用可视化的图像标定工具labelimg,labelimg基于python的pyqt5进行制作,用qt作为图形界面,最后生成xml文件。3.根据权利要求1所述的基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,所述步骤s3中,使用混合高斯背景建模法构建背景模型时,背景图像中的每一个像素分别用由k个高斯分布构成的混合高斯模型来建模:用由k个高斯分布构成的混合高斯模型来建模:式(1)中,g是背景模型,x
t
是t时刻输入的像素,n是混合高斯模型,ω
k,t
是混合高斯模型中t时刻像素点x对应的第k个高斯分布的权值,μ
k,t
和σ
k,t
分别表示混合高斯模型中t时刻像素点x对应的第k个高斯分布的均值和标准差;式(2)中,x是输入的像素,μ和σ是混合高斯模型中模型分布的均值和标准差,σ2是混合高斯模型中模型分布的方差。4.根据权利要求1所述的基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,所述步骤s2中,采用背景建模流程如下:(1)初始化:选择高斯分布的个数k和学习率;输入第一帧图像,对每个像素x
t
,分别初始化k个均值μ
k,t
,标准差为σ
k,t
的高斯函数,对应的权重分别为ω
k,t
,k;(2)判断像素与k个高斯分布是否匹配获取第k帧图像,像素为x
t
,查看像素与k个高斯分布是否匹配,若满足(3)式,则认为该像素点与高斯分布模型匹配,否则认为不匹配,如果有多个匹配,从中选择最好的一个;|x
t-μ
k,t-1
|<2.5σ
k,t-1
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式中,x
t
为当前像素点,μ
k,t-1
和σ
k,t-1
分别为第k个高斯分布在t-1时刻的均值和标准差;
(3)高斯分布的参数更新若当前像素值满足(3)式的判断标准,则该点为背景点,此时需要对该匹配模型的各参数进行如下更新:数进行如下更新:其中,ω
k,t
为不同时刻权重值,决定了该高斯分量可匹配度高低,越高权重值越大,α为学习率,β表示各参数更新快慢,为方差,m
k,t
为模型是否匹配调控值,匹配时取1,不匹配时取0;若当前像素点与高斯分布均不匹配,则用当前帧的均值,初始化一个较大方差、较小权重的高斯分布替换掉背景模型中权重系数最小的高斯分布;权重更新时,m
k,t
在不匹配时取0;对于其他高斯分布,其均值和方差取值不变;(4)分布排序将高斯分布的优先级按μ
k,t
/的值从大到小排列;(5)确定背景模型在对各个模型参数进行更新之后,几个发生变化的权重值需要采取归一化处理,这里通过权重与方差的比值μ
k,t
/排序来对比各个模型的取舍,选取前m个作为后续用到的匹配模型,选取合适的t值,则m表示为:式中,t是选择前m各背景分布的阈值;确定当前点为前景点是由k个模型均不满足(3)式得到的,由于前面有舍弃掉权重小的模型,通过当前像素点来确定一个新高斯分量,同样设该高斯分量当前值为均值,方差依照步骤(1)中的方式来确定,此时由于添加了新的高斯分量,则需要再进行一次权值更新以及归一化:ω

k,t
=(1-α)ω
k,t-1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)在背景模型m
t
(x,y)确定以后,再通过与原图像i
t
(x,y)简单的背景差分得到前景二值化图像素值:d
t
(x,y)=|i
t
(x,y)-m
t
(x,y)|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)5.根据权利要求1所述的基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,所述步骤s3中,针对指定帧之后的每一帧图像做前景检测,提取当前帧图像中所有的前景运动目标的目标框;具体前景检测流程如下:(1)构建(x,y)位置的历史像素集合b(x,y);m(x,y)={v1(x,y),v2(x,y),v3(x,y),

,v
n
(x,y)},其中v
i
(x,y)表示第i帧图像中(x,y)位置的像素值;当运行至指定帧之后时﹐计算位置(x,y)处的像素点与对应的历史像素值集合中各元素的距离;所述距离为位置(x,y)处
的像素点的像素值与历史像素值集合中任一元素的像素值差;(2)统计距离小于阈值t的元素数量q;若所述元素数小于阈值q
min
,则记该位置(x,y)处的像素点为前景,否则该位置(x,y)处的像素点为背景,并将该像素点更新至历史像素值集合m(x,y)中,对背景模型进行更新;式中,r(x,y)为前景检测结果,q为历史像素值集合中与位置(x,y)处的像素点的距离小于阈值t的元素数量;(3)按以上步骤处理下一帧图像,不断迭代;(4)接下来对提取出的前景运动目标进行处理,然后采用边界寻找得到包围边界点集的最小矩形。6.根据权利要求1所述的基于背景建模和目标检测的厨房老鼠检测方法,其特征在于,所述步骤s5,采用基于单阶段目标识别算法yolov5作为老鼠检测算法,对原有的yolov5目标检测算法进行多尺度特征融合的优化,原始yolov5中使用giou来计算定位损失,与lou不同,giou不仅关注真实框与预测框之间的重叠面积,还关注其他的非重叠区域,因此giou相较于iou能更好的反应两者之间的重合度,但glou只考虑真实框与预测框之间的重叠率这一个因素,不能描述目标框的回归问题,当预测框在真实框内部时,且预测框的大小相同时,此时glou会退化为lou,无法区分各个预测框之间的位置关系,选择ciou替代giou作为目标回归的损失函数;目标回归的损失函数;目标回归的损失函数;式中,lou是锚框损失函数,其结果是由预测框和真实框两个区域重叠的部分除以两个区域的集合部分得出;b,b
gt
分别是预测框和真实框的中心点;ρ2(b,b
gt
)是预测框和真实框的中心点的欧式距离;c是能够同时包含预测框和真实框的最小闭包区域的对角线距离;α是一个平衡参数,不参与梯度计算;v是用来衡量长宽比一致性的参数;w,h分别是预测框的宽和高;w
gt
,h
gt
分别是真实框的宽和高;ciou综合考虑了真实框与预测框之间的重叠率、中心点距离、长宽比,通过网络爬虫及餐饮后厨摄像头视频资料获取老鼠数据集并对数据预处理、标注信息、格式转换,对处理完的数据集利用优化后的算法进行训练,最后获得老鼠目标检测模型;为了提升算法模型的检测速度,将训练后的yolov5算法模型输入到剪枝网络进行模型剪枝,得到模型参数较少、检测速度快的改进yolov5算法模型,网络剪枝采用通道稀疏化的方法,通道稀疏化(channel-wise)是将和一个通道有关联的所有输入和输出的连接全都裁剪掉,首先对每一个通道引入一个缩放因子γ,将此缩放因子和通道的输出相乘,然后联合训练网络权重和这些缩放因子,接着将缩放因子小的通道直接删除掉,最后微调剪枝后的网络,此过程中,目标函数定义如公式(14)所示:
式中:(x,y)是训练的数据和标签;w是网络的可训练参数;∑l(f(x,w),y)是网络的损失函数;g(γ)=|γ|是缩放因子上的乘法项,即l1正则化;λ是两者的平衡因子;yolov5的backbone部分的卷积层后都接着使用bn(batch normalization)层,直接将bn层的γ参数作为缩放因子,bn层的转换公式如(15)所示,z
in
和z
out
分布是bn层的输入与输出,b是指bn层使用mini-batch的统计特性对激活值进行归一化;式中,γ和β是可学习的参数,μ
b
和分别是均值和方差;引入缩放因子正则化后,训练出来的模型很多因子都会趋近于0,然后对训练后的缩放因子按绝对值排序,从小到大排序中的某个位置的缩放因子为阈值,最后就得到一个参数少、紧凑的yolov5模型;将步骤s3中提取到的当前帧图像中的前景运动目标的目标框作为yolov5老鼠检测模型的输入,并进行检测,最后输出目标检测结果。

技术总结
本发明提供了一种基于背景建模和目标检测的厨房老鼠检测方法,属于计算机视觉技术领域。解决了存在有干扰因素的复杂背景下的老鼠检测精度低的问题。其技术方案为:包括以下步骤:S1、样本数据采集;S2、建立背景模型;S3、提取当前帧图像中所有的前景运动目标的目标框;S4、对目标框建立混合高斯分布模型;S5、老鼠检测;S6、输出目标检测结果。本发明的有益效果为:该方法得出一种老鼠检测的通用模型,可以适用在餐饮后厨、食品加工等多种场景下,实现老鼠检测的智能化,减少人工监管所耗费的时间和精力,一定程度上解决老鼠对食品及商品的危害。害。害。


技术研发人员:仲新 曹睿吉 张月月 王金凤 吴赛林 冯浩宸 李跃华 胡彬
受保护的技术使用者:南通大学
技术研发日:2023.03.14
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐