一种共享指导模块的目标检测方法与流程
未命名
10-09
阅读:101
评论:0
1.本发明涉及一种计算机视觉技术领域,具体涉及一种共享指导模块的目标检测方法。
背景技术:
2.随着智能监控的大规模应用,目标检测算法重要性也大大提升。例如,基于视频的车辆违停、行人越界等都需要目标检测算法将目标的位置和类别输出。所以,提升目标检测效果就显得非常重要。
3.在yolov8算法中,使用了距离聚焦损失(distribution focal loss)提升了算法检测效果。距离聚焦损失可以计算出检测框四边到中心点的距离分布,通过这个分布可以判断出边界框的不确定性,从而指导分类分支。但是在yolov8算法中并未使用该方法,导致检测效果不理想。
4.距离聚焦损失第二版(distribution focal loss v2)中,提出了使用top-k(四边到中心点的距离分布距离最高的k个值)和均值(四边到中心点的距离分布均值)来指导分类,在多个检测算法中得到有效提升;
5.虽然距离聚焦损失第二版在多个检测算法中得到提升,但其问题有两个:第一,只使用top-k和均值指导分类,忽略了概率小的距离同样对分类有指导意义,因为概率小的距离可能代表此处有遮挡或者模糊,不能简单的丢弃;第二,yolov8算法是多分支的,不同分支均需要在头部(head)中提取特征指导分类,导致算法速度降低。
技术实现要素:
6.本发明所要解决的技术问题是提供了一种共享指导模块的目标检测方法,以解决上述背景技术中提到的技术问题。
7.本发明共享指导模块的目标检测方法是通过以下技术方案来实现的:
8.具体分为以下步骤:
9.s1、图像输入:将图像输入算法模型;
10.s2、特征提取:对输入图像进行特征提取;
11.s3、特征融合:将提取的特征进行融合,形成一个以上的融合特征;
12.s4、解码预测:将融合特征进行解码,并得出预测结果;
13.融合特征内添加指导模块;一个以上的指导模块进行权重共享;一个以上的指导模块包括定位分支与分类分支;指导模块添加于定位分支与分类分支之间。
14.作为优选的技术方案,定位分支包括三层及以上的第一卷积模块;指导模块包括三层及以上的第二卷积模块;分类分支三层及以上的第三卷积模块;
15.指导模块输入定位分支上信息;三层及以上的第二卷积模块末端设置有sigmoid模块;信息经过三层及以上的第二卷积模块的提取特征后输入sigmoid模块;
16.sigmoid模块将特征归一化作为权重与分类分支相乘,得到分类分支的输出。
17.作为优选的技术方案,sigmoid模块的归一化函数:
18.作为优选的技术方案,s2、特征提取:经过backbone提取特征;backbone输出三种尺度的特征,分别用来预测大、中、小三种目标。
19.作为优选的技术方案,s3、特征融合:三种尺度特征经过neck融合后分别输入特征提取;特征提取包括head1、head2、head3。
20.本发明的有益效果是:
21.1、通过使用定位指导分类,提高了目标检测的效果;
22.2、指导模块的输入不是只使用top-k和均值,而是使用了定位输出的所有信息,提高了定位指导分类的能力;
23.3、通过共享权重,在未降低目标检测效果的情况下降低了内存消耗,提高了运行速度。
附图说明
24.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1为本发明共享指导模块的目标检测方法的算法流程图;
26.图2为本发明共享指导模块的目标检测方法的算法网络结构图。
具体实施方式
27.本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
28.本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
29.在本发明的描述中,需要理解的是,术语“一端”、“另一端”、“外侧”、“上”、“内侧”、“水平”、“同轴”、“中央”、“端部”、“长度”、“外端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
30.此外,在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
31.本发明使用的例如“上”、“上方”、“下”、“下方”等表示空间相对位置的术语是出于便于说明的目的来描述如附图中所示的一个单元或特征相对于另一个单元或特征的关系。空间相对位置的术语可以旨在包括设备在使用或工作中除了图中所示方位以外的不同方位。例如,如果将图中的设备翻转,则被描述为位于其他单元或特征“下方”或“之下”的单元将位于其他单元或特征“上方”。因此,示例性术语“下方”可以囊括上方和下方这两种方位。设备可以以其他方式被定向(旋转90度或其他朝向),并相应地解释本文使用的与空间相关
的描述语。
32.在本发明中,除非另有明确的规定和限定,术语“设置”、“套接”、“连接”、“贯穿”、“插接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
33.如图1-图2所示,本发明的一种共享指导模块的目标检测方法,具体分为以下步骤:
34.s1、图像输入:将图像输入算法模型;采集检测图片,形成训练集;
35.s2、特征提取:对输入图像进行特征提取,经过backbone提取特征,backbone输出三种尺度的特征,分别用来预测大、中、小三种目标;
36.s3、特征融合:将提取的三种尺度特征经过neck进行分别融合,形成一个以上的融合特征;融合特征包括head1、head2、head3;
37.s4、解码预测:将融合特征进行解码,并得出预测结果;
38.融合特征内添加指导模块;一个以上的指导模块进行权重共享;一个以上的指导模块包括定位分支与分类分支;指导模块添加于定位分支与分类分支之间。
39.本实施例中,定位分支包括三层及以上的第一卷积模块;指导模块包括三层及以上的第二卷积模块;分类分支三层及以上的第三卷积模块;
40.指导模块输入定位分支上信息;三层及以上的第二卷积模块末端设置有sigmoid模块;信息经过三层及以上的第二卷积模块的提取特征后输入sigmoid模块;sigmoid模块将特征归一化作为权重与分类分支相乘,得到分类分支的输出;
41.指导模块的输入不是只使用top-k和均值,而是使用了定位输出的所有信息,包括低概率和中等概率值等,为指导分类提供了更丰富的特征;考虑到指导模块的添加会增加计算消耗,并且对于head1,head2,head3而言定位指导分类的方式相似,所以将三个head中的指导模块进行权重共享,降低内存消耗,提高运行速度。
42.如图2所示,本实施例中,sigmoid模块的归一化函数:conv代表卷积模块,“*”代表相乘。
43.本实施例中,s2、特征提取:经过backbone提取特征;backbone输出三种尺度的特征,分别用来预测大、中、小三种目标。
44.本实施例中,s3、特征融合:三种尺度特征经过neck融合后分别输入特征提取;特征提取包括head1、head2、head3。
45.工作过程如下:将每个尺度的特征分别送入一个解码预测模块中,定位分支和分类分支分别对其进行处理,定位分支的输出送入指导模块进行特征提取,为了降低内存消耗,提高运行速度,本发明将三个head中的指导模块进行权重共享;最后经过sigmoid函数输出一个0到1之间的数值作为权重,将其和分类分支输出的分类概率相乘,得到最终的分类分支输出。
46.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的
保护范围应该以权利要求书所限定的保护范围为准。
技术特征:
1.一种共享指导模块的目标检测方法,其特征在于:具体分为以下步骤:s1、图像输入:将图像输入算法模型;s2、特征提取:对输入图像进行特征提取;s3、特征融合:将提取的特征进行融合,形成一个以上的融合特征;s4、解码预测:将融合特征进行解码,并得出预测结果;融合特征内添加指导模块;一个以上的指导模块进行权重共享;一个以上的指导模块包括定位分支与分类分支;指导模块添加于定位分支与分类分支之间。2.根据权利要求1所述的共享指导模块的目标检测方法,其特征在于:定位分支包括三层及以上的第一卷积模块;指导模块包括三层及以上的第二卷积模块;分类分支三层及以上的第三卷积模块;指导模块输入定位分支上信息;三层及以上的第二卷积模块末端设置有sigmoid模块;信息经过三层及以上的第二卷积模块的提取特征后输入sigmoid模块;sigmoid模块将特征归一化作为权重与分类分支相乘,得到分类分支的输出。3.根据权利要求2所述的共享指导模块的目标检测方法,其特征在于:sigmoid模块的归一化函数:4.根据权利要求1所述的共享指导模块的目标检测方法,其特征在于:所述s2、特征提取:经过backbone提取特征;backbone输出三种尺度的特征,分别用来预测大、中、小三种目标。5.根据权利要求1所述的共享指导模块的目标检测方法,其特征在于:所述s3、特征融合:三种尺度特征经过neck融合后分别输入特征提取;特征提取包括head1、head2、head3。
技术总结
本发明公开了一种共享指导模块的目标检测方法,具体分为以下步骤:S1、图像输入:将图像输入算法模型;S2、特征提取:对输入图像进行特征提取;S3、特征融合:将提取的特征进行融合,形成一个以上的融合特征;S4、解码预测:将融合特征进行解码,并得出预测结果;融合特征内添加指导模块;一个以上的指导模块进行权重共享;本发明通过使用定位指导分类,提高了目标检测的效果;指导模块的输入不是只使用Top-k和均值,而是使用了定位输出的所有信息,提高了定位指导分类的能力;通过共享权重,在未降低目标检测效果的情况下降低了内存消耗,提高了运行速度。了运行速度。了运行速度。
技术研发人员:樊治国 李金洺
受保护的技术使用者:青岛高重信息科技有限公司
技术研发日:2023.06.28
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
