人脸检测模型训练方法和装置与流程

未命名 09-13 阅读:107 评论:0
人脸检测模型训练方法和装置【
技术领域
:】1.本技术涉及机器视觉领域,尤其涉及一种人脸检测模型训练方法和装置。
背景技术
::2.在通过人脸检测模型执行人脸检测算法时,输出结果的准确度会与输入图像中的干扰因素相关。输入图像中的人物姿态、表情、肤色、亮度、遮挡、尺度变换等因素都会对识别结果造成影响。若要克服这些干扰因素所带来的影响,就需要更换算力更高的模型对这些干扰因素进行训练。3.但是,由于终端设备性能要求以及硬件设备等客观条件的限制,部署于终端设备上的人脸检测模型往往需要使用轻量化的网络结构,很难在不增加计算量的前提下提高人脸检测的准确度。技术实现要素:4.有鉴于此,本发明实施例提供了一种人脸检测模型训练方法和装置。基于标签分配策略为输入图像分配标签时,在通过人脸矩形框生成正样本的同时,还使用人脸关键点信息生成集中包含人脸信息的正样本,并以人脸关键点信息作为评价标准对生成的正样本进行筛选,以解决现有技术中无法准确获取人脸信息进行模型训练的问题。5.第一方面,本发明实施例提供了一种人脸检测模型训练方法,所述方法包括:6.根据第一图像中标注的人脸关键点确定人脸关键点矩形框;7.根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本;8.根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。9.可选的,所述根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本,包括:10.确定所述人脸关键点矩形框的第一中心点,以及所述人脸矩形框的第二中心点;11.根据所述第一中心点确定出所述第一图像的第一正样本和第一负样本,根据所述第二中心点确定出所述第一图像的第二正样本和第二负样本;12.根据所述第一正样本和所述第二正样本确定出所述目标正样本,根据所述目标正样本确定出所述目标负样本。13.可选的,所述根据所述第一中心点确定出所述第一图像的第一正样本和第一负样本,包括:14.根据所述第一中心点在所述第一图像中的位置坐标,从所述第一图像的若干预设栅格中确定出所述第一中心点所位于的第一栅格;15.确定为所述第一栅格预设的各预设锚框;16.将所述各预设锚框中,与人脸矩形框间交集并集比iou比例高于第一iou阈值的至少一个锚框确定为第一锚框;17.将所述第一锚框所对应的图像区域确定为所述第一正样本,将除所述第一锚框之外的其他锚框所对应的图像区域确定为所述第一负样本。18.可选的,所述根据所述第一正样本和所述第二正样本确定出所述目标正样本,包括:19.根据所述第一正样本和所述第二正样本对应的图像区域,在所述第一图像上确定出若干第二锚框;20.将各所述第二锚框中,与人脸矩形框间iou比例高于第二iou阈值的至少一个锚框确定为第三锚框;21.根据各所述第三锚框中包含所述人脸关键点的数量,从所述第三锚框中确定出第四锚框;22.将所述第四锚框所对应的图像区域确定为所述目标正样本,将除所述第四锚框之外的其他锚框所对应的图像区域确定为所述目标负样本。23.可选的,所述根据各所述第三锚框中包含所述人脸关键点的数量,从所述第三锚框中确定出第四锚框,包括:24.根据第四锚框的需求数量,将全部所述第三锚框中,包含所述人脸关键点数量更多的第三锚框确定为所述第四锚框;25.对于任意两个所包含人脸关键点数量相同的第三锚框,将iou比例更高的第三锚框确定为所述第四锚框。26.可选的,所述根据所述第一正样本和所述第二正样本确定出所述目标正样本,所述方法还包括:27.将所述第一正样本和所述第二正样本共同确定为所述目标正样本。28.可选的,所述根据所述目标正样本和所述目标负样本对人脸检测模型进行训练,包括:29.当所述人脸检测模型包含特征金字塔fpn+pan结构时,对fpn网络中的各网络层设置辅助检测头;30.将所述目标正样本和所述目标负样本输入所述辅助检测头,获取辅助检测头预测结果;31.根据所述辅助检测头预测结果监督所述人脸检测模型的分类任务。32.第二方面,本发明实施例提供了一种人脸检测模型训练装置,包括:33.第一确定模块,根据第一图像中标注的人脸关键点确定人脸关键点矩形框;34.第二确定模块,根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本;35.训练模块,根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。36.第三方面,本发明实施例提供了一种电子设备,包括:37.至少一个处理器;以及38.与所述处理器通信连接的至少一个存储器,其中:39.所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面任一所述的方法。40.第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行第一方面任一所述的方法。41.通过上述方案,尽可能得将包含人脸信息更多的图像区域作为目标正样本供人脸检测模型进行训练,以提高分类精度,降低误检概率。【附图说明】42.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。43.图1为本发明实施例提供的一种人脸检测模型训练方法的流程图;44.图2为本发明实施例提供的一种第一图像的示意图;45.图3为本发明实施例提供的另一种第一图像的示意图;46.图4为本发明实施例提供的一种人脸检测模型训练装置的结构示意图;47.图5为本发明实施例提供的一种电子设备的结构示意图。【具体实施方式】48.为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。49.应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。50.人脸检测算法是目标检测中的一种。将一张图像输入到人脸检测模型中时,人脸检测模型会通过执行分类任务确定输入的图像中是否包含人脸,并在确定图像中包含人脸时,通过执行回归任务输出人脸边框的坐标。51.当前主流的人脸检测模型都是以卷积神经网络模型为基础,通过对大量的人脸图像中的特征进行学习,以训练得到的。在通过人脸检测模型进行检测的实际场景中,往往会受到图像中人物姿态、人物表情、图像亮度、图像尺度变化、图像是否存在遮挡,以及复杂背景等诸多因素的干扰,从而对识别结果的准确性造成干扰。为了使人脸检测算法获得更好的效果,需要依赖于更大、算力更强的卷积神经网络模型,对上述干扰因素全部加以训练,才可以避免其造成的干扰。52.但是,由于终端设备性能要求以及硬件设备等客观条件的限制,部署于终端设备上的人脸检测模型往往需要使用轻量化的网络结构。轻量化的网络结构很难直接满足各种复杂的场景,而如果选择使用更大的卷积神经网络模型又会导致计算量增加,增大在手机等终端设备上部署的难度。53.在一些实施例中,为了在不增加算法计算量的同时还可以提高人脸检测算法的准确性,通过标签分配策略为图像上的不同区域分配正负样本标签,即确定图像中哪里是正样本,哪里是负样本。在人脸检测模型的训练过程中,通过对图像正负样本中的特征进行集中学习,以提高人脸检测算法的精度。54.但是传统的标签分配策略并未考虑人脸这一目标的具体特性,导致分配得到的正负样本往往不能准确的反应图像中的人脸特征,即可能会丢失部分重要的人脸特征。同时对正负样本的评价标准也并未针对人脸这一目标进行具体的设计。55.如图1所示,为本发明实施例提供的一种人脸检测模型训练方法,参见图1,该方法的具体步骤包括:56.s101,根据第一图像中标注的人脸关键点确定人脸关键点矩形框。57.具体的,第一图像为输入人脸检测模型,用于对人脸检测模型进行训练的图像。第一图像中预先标注有人脸关键点。人脸关键点一般为人脸中的双眼瞳孔、鼻尖、双侧嘴角五个点。在第一图像中根据各人脸关键点确定外接矩形框,并将确定出的外接矩形框向外扩展1.2倍,以得到人脸关键点矩形框。58.除人脸关键点矩形框外,第一图像中还标注有人脸矩形框(groundtruth),即人脸的外接矩形框。59.如图2所示,为本发明实施例提供的一种第一图像的示意图,在第一图像中,将人脸的双眼瞳孔、鼻尖、双侧嘴角五个点确定为人脸关键点,将五个人脸关键点的外接矩形框的向外扩展后得到人脸关键点矩形框。第一图像中还根据人脸位置,预设有人脸矩形框。60.s102,根据人脸关键点矩形框以及预设的人脸矩形框,在第一图像中确定出目标正样本和目标负样本。61.具体的,确定出人脸关键点矩形框中的第一中心点,并确定出人脸矩形框中的第二中心点。分别根据第一中心点确定出第一图像的第一正样本和第一负样本,并根据第二中心点确定出第一图像的第二正样本和第二负样本。再基于图像的实际情况选择合适的确定方法,根据第一正样本和第二正样本确定出最终用于模型训练的目标正样本和目标负样本。62.其中,在根据第一中心点确定第一图像的第一正样本和第一负样本时,需要确定第一中心点在第一图像中所处的栅格(grid),从为该栅格预设的若干预设锚框中确定最适宜的锚框,并将该锚框所对应的图像区域确定为第一正样本。63.具体的,预先通过在第一图像中划分栅格,以将第一图像划分为若干区域。每一个栅格均预设有若干大小不一的预设锚框(anchor)。预设锚框的中心点与其对应的栅格相重合,所围成图像区域的大小可以超出与其对应的栅格,也可以小于与其对应的栅格。64.根据第一中心点在第一图像中的位置坐标,确定出第一中心点位于第一图像中的哪一个栅格中。将第一中心点所处的栅格确定为第一栅格。确定出为第一栅格预设的各预设锚框,分别计算各预设锚框与人脸矩形框的交集并集比(intersectionoverunion,iou),即分别确定各预设锚框与人脸矩形框的重合度。将iou比例高于第一iou阈值的至少一个锚框确定为第一锚框,并将第一锚框在第一图像中所对应的区域确定为第一正样本。将除第一锚框外的其他锚框,即第一栅格中iou比例未达到第一iou阈值的预设锚框,或其他栅格中的预设锚框在第一图像中所对应的区域确定为第一负样本。65.根据第二中心点确定第一图像的第二正样本和第二负样本的方法与上述方法相同,同样根据第二中心点所处的栅格,以及该栅格内各预设锚框与人脸矩形框的iou比例确定。66.其中,预设锚框与人脸矩形框的iou比例越高,则说明预设锚框与人脸矩形框的重合度越高,预设锚框中所包含的人脸信息就越多,无效信息就越少,通过对该预设锚框进行学习所训练得到的人脸检测模型的预测准确性就越高。67.在确定出第一正样本、第一负样本、第二正样本和第二负样本后,需要确定出最终用于输入人脸检测模型进行训练的目标正样本和目标负样本。68.具体的,为了提高正样本的数量,降低正负样本不均衡所造成的过拟合现象所带来的影响,可以直接将得到的第一正样本和第二正样本共同确定为目标样本,将第一负样本和第二负样本确定为目标负样本。69.可选的,为了继续增加模型训练的精准度,可以进一步对已经获取到的第一正样本和第二正样本进行筛选,从中确定出包含人脸信息更多的目标正样本。70.基于已经确定出的第一正样本和第二正样本所对应的图像区域,在第一图像上重新确定出若干第二锚框,第二锚框为用于确定第一正样本的锚框和用于确定第二正样本的锚框的合集。依次确定各第二锚框与人脸矩形框间的iou比例,将iou比例高于第二iou阈值的锚框确定为第三锚框。再根据第三锚框中所包含人脸关键点的数量由大到小的顺序,确定出需求数量的第四锚框,将第四锚框所对应的图像区域确定为目标正样本,除第四锚框之外其他锚框所对应的图像区域确定为目标负样本。此时的目标负样本包括第一负样本、第二负样本,以及被筛选掉的第一正样本和第二正样本所对应的图像区域。71.可选的,当满足第二iou阈值的第三锚框的数量超出需求数量,且包含人脸关键点的数量相同,无法进一步根据人脸关键点数量进行筛选时,将iou比例更高的一个或几个锚框确定为第四锚框。72.例如,最终需要确定出一个目标正样本,即需要确定出一个第四锚框,但是iou比例高于第二iou阈值的第三锚框有两个,且两个第三锚框中所包含的人脸关键点同为5个时,需要根据这两个第三锚框的iou比例再次筛选。两个锚框的iou比例分别为0.95和0.9,则将iou比例为0.95的第三锚框确定为第四锚框。73.在一个具体的实施例中,为本发明实施例提供的一种第一图像的示意图。如图3所示,根据人脸的双眼瞳孔、鼻尖、双侧嘴角这五个点确定出人脸关键点矩形框,并在人脸关键点矩形框中确定出第一中心点,在预设的人脸矩形框中确定出第二中心点。第一中心点位于第五行第三列的栅格内,将其确定为第一栅格,根据第一栅格各预设锚框与人脸矩形框的iou确定出第一锚框,并确定出第一正样本。第二中心点位于第五行第四列的栅格内,同理根据该栅格各预设锚框与人脸矩形框的iou确定出第二锚框,并确定出第二正样本。74.进一步,对第一正样本和第二正样本进行筛选,以确定出目标正样本。第一正样本和第二正样本所对应的第二锚框的iou比例分别为0.7和0.75,均满足第二iou阈值。但是第一正样本中包含5个人脸关键点,第二正样本中只包含2个人脸关键点,所以将第一正样本作为目标正样本,将第二正样本和第一负样本、第二负样本一起作为目标负样本。75.可选的,也可以直接将第一正样本和第二正样本共同确定为目标正样本。76.其中,由于人脸发生了偏转,所以根据第二中心点所确定出的第二正样本中包含了大部分脸颊。由于人脸信息大多集中于眼睛、鼻子、嘴巴附近,所以与第一正样本相比,第二正样本中遗漏了部分关键人脸信息,在对人脸检测模型进行训练时的精准度会有所下降。所以在本实施例中,将第一正样本作为最终的目标样本,输入人脸检测模型进行训练。77.可选的,在一些实施例中,当应用的人脸检测算法为无锚框anchorfree算法时,虽然并未对第一图像的栅格预设有预设锚框,但是仍是直接根据人脸矩形框的中心点或角点分配对应的栅格,同样可以通过人脸关键点外接矩形的第一中心点确定出包含更多人脸信息的正样本。78.s103,根据目标正样本和目标负样本对人脸检测模型进行训练。79.具体的,将获取到的目标正样本和目标负样本输入人脸检测模型。人脸检测模型通过对目标正样本和目标负样本中的特征进行学习,以分别执行分类任务和回归任务的训练。80.可选的,当人脸检测模型中包含特征金字塔(featurepyramidnetworks,fpn)fpn+panet结构时,可以对fpn网络中的各网络层分别设置检测头。将目标正样本和目标负样本输入各层的辅助检测头中。辅助检测头输出预测结果,用于对人脸检测模型的分类任务进行监督。81.本发明实施例在为输入图像分配标签时,在通过人脸矩形框生成正样本的同时,还使用人脸关键点信息生成集中包含人脸信息的正样本,并以人脸关键点信息作为评价标准对生成的正样本进行筛选,尽可能得将包含人脸信息更多的图像区域作为目标正样本供人脸检测模型进行训练。同时在训练过程中,还通过人脸关键点辅助分类损失,监督人脸检测模型的分类任务,以提高分类精度,降低误检概率。82.对应上述人脸检测模型训练方法,本发明实施例还提供了一种人脸检测模型训练装置,所述人脸检测模型训练装置应用于终端设备。参见图4,为本发明实施例提供的一种人脸检测模型训练装置的结构示意图。如图4所示,该装置可以包括:第一确定模块401、第二确定模块402和训练模块403。83.第一确定模块401,根据第一图像中标注的人脸关键点确定人脸关键点矩形框。84.第二确定模块402,根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本。85.训练模块403,根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。86.图4所示实施例提供的人脸检测模型训练装置可用于执行本说明书所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。87.图5为本说明书电子设备一个实施例的结构示意图。电子设备可以实现为部署有人脸检测模型的终端设备。如图5所示,上述电子设备可以包括至少一个处理器;以及与上述处理单元通信连接的至少一个存储器,其中:存储器存储有可被处理单元执行的程序指令,上述处理器调用上述程序指令能够执行本实施例提供的人脸检测模型训练方法。88.其中,上述电子设备可以为能够与用户进行智能对话的设备,本说明书实施例对上述电子设备的具体形式不作限定。可以理解的是,这里的电子设备即为方法实施例中提到的机器。89.图5示出了适于用来实现本说明书实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本说明书实施例的功能和使用范围带来任何限制。90.如图5所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器510、通信接口520、存储器530,连接不同系统组件(包括存储器530、通信接口520和处理器510)的通信总线540。91.通信总线540表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industrystandardarchitecture;以下简称:isa)总线,微通道体系结构(microchannelarchitecture;以下简称:mac)总线,增强型isa总线、视频电子标准协会(videoelectronicsstandardsassociation;以下简称:vesa)局域总线以及外围组件互连(peripheralcomponentinterconnection;以下简称:pci)总线。92.电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。93.存储器530可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(randomaccessmemory;以下简称:ram)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。存储器530可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本说明书各实施例的功能。94.具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器530中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。95.处理器510通过运行存储在存储器530中的程序,从而执行各种功能应用以及数据处理,例如实现本说明书所示实施例提供的人脸检测模型训练方法。96.本说明书实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本说明书所示实施例提供的人脸检测模型训练方法。97.上述非暂态计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(readonlymemory;以下简称:rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory;以下简称:eprom)或闪存、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。98.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。99.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。100.可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(localareanetwork;以下简称:lan)或广域网(wideareanetwork;以下简称:wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。101.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。102.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。103.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本说明书的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本说明书的实施例所属
技术领域
:的技术人员所理解。104.取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。105.需要说明的是,本说明书实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer;以下简称:pc)、个人数字助理(personaldigitalassistant;以下简称:pda)、无线手持设备、平板电脑(tabletcomputer)、手机、mp3播放器、mp4播放器等。106.在本说明书所提供的实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。107.另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。108.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本说明书各个实施例所述方法的部分步骤。109.以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。当前第1页12当前第1页12
技术特征:
1.一种人脸检测模型训练方法,其特征在于,所述方法包括:根据第一图像中标注的人脸关键点确定人脸关键点矩形框;根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本;根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本,包括:确定所述人脸关键点矩形框的第一中心点,以及所述人脸矩形框的第二中心点;根据所述第一中心点确定出所述第一图像的第一正样本和第一负样本,根据所述第二中心点确定出所述第一图像的第二正样本和第二负样本;根据所述第一正样本和所述第二正样本确定出所述目标正样本,根据所述目标正样本确定出所述目标负样本。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一中心点确定出所述第一图像的第一正样本和第一负样本,包括:根据所述第一中心点在所述第一图像中的位置坐标,从所述第一图像的若干预设栅格中确定出所述第一中心点所位于的第一栅格;确定为所述第一栅格预设的各预设锚框;将所述各预设锚框中,与人脸矩形框间交集并集比iou比例高于第一iou阈值的至少一个锚框确定为第一锚框;将所述第一锚框所对应的图像区域确定为所述第一正样本,将除所述第一锚框之外的其他锚框所对应的图像区域确定为所述第一负样本。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一正样本和所述第二正样本确定出所述目标正样本,包括:根据所述第一正样本和所述第二正样本对应的图像区域,在所述第一图像上确定出若干第二锚框;将各所述第二锚框中,与人脸矩形框间iou比例高于第二iou阈值的至少一个锚框确定为第三锚框;根据各所述第三锚框中包含所述人脸关键点的数量,从所述第三锚框中确定出第四锚框;将所述第四锚框所对应的图像区域确定为所述目标正样本,将除所述第四锚框之外的其他锚框所对应的图像区域确定为所述目标负样本。5.根据权利要求4所述的方法,其特征在于,所述根据各所述第三锚框中包含所述人脸关键点的数量,从所述第三锚框中确定出第四锚框,包括:根据第四锚框的需求数量,将全部所述第三锚框中,包含所述人脸关键点数量更多的第三锚框确定为所述第四锚框;对于任意两个所包含人脸关键点数量相同的第三锚框,将iou比例更高的第三锚框确定为所述第四锚框。6.根据权利要求2所述的方法,其特征在于,所述根据所述第一正样本和所述第二正样本确定出所述目标正样本,所述方法还包括:
将所述第一正样本和所述第二正样本共同确定为所述目标正样本。7.根据权利要求1所述的方法,其特征在于,所述根据所述目标正样本和所述目标负样本对人脸检测模型进行训练,包括:当所述人脸检测模型包含特征金字塔fpn+panet结构时,对fpn网络中的各网络层设置辅助检测头;将所述目标正样本和所述目标负样本输入所述辅助检测头,获取辅助检测头预测结果;根据所述辅助检测头预测结果监督所述人脸检测模型的分类任务。8.一种人脸检测模型训练装置,其特征在于,包括:第一确定模块,根据第一图像中标注的人脸关键点确定人脸关键点矩形框;第二确定模块,根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本;训练模块,根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7任一所述的方法。

技术总结
本申请涉及机器视觉领域,尤其涉及一种人脸检测模型训练方法和装置。一种人脸检测模型训练方法,所述方法包括:根据第一图像中标注的人脸关键点确定人脸关键点矩形框;根据所述人脸关键点矩形框以及预设的人脸矩形框,在所述第一图像中确定出目标正样本和目标负样本;根据所述目标正样本和所述目标负样本对人脸检测模型进行训练。本发明实施例在模型训练过程中,结合人脸关键点,尽可能得将包含人脸信息更多的图像区域作为目标正样本供人脸检测模型进行训练,以提高分类精度,降低误检概率。降低误检概率。降低误检概率。


技术研发人员:石铭宽 刘千顺
受保护的技术使用者:展讯通信(天津)有限公司
技术研发日:2023.06.02
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐