标记点定位方法、装置、图像识别设备及存储介质与流程

未命名 08-25 阅读:115 评论:0


1.本发明涉及机器视觉技术领域,具体涉及一种标记点定位方法、装置、图像识别设备及存储介质。


背景技术:

2.随着社会的不断发展,机器视觉在工业领域扮演着越来越重要的角色,能起到代替人工的作用。深度学习作为一种图像处理方法,基于它强大的特征提取能力,已经慢慢出现在了机器视觉行业,相比于传统的视觉方法,深度学习在某些方面表现的更加优异。
3.在标记点定位的实际应用中,由于受到训练图像样本获取环境变化较大、获取样本图像时间受限等因素的影响,训练样本图像往往存在着数目过少、无法涵盖不同场景等问题。而训练样本图像不足,会导致训练阶段的图像特征不足以有效表示图像特征变化,从而导致训练出的标记点定位模型鲁棒性较差的技术问题。
4.因此,有必要提供一种标记点定位方法、装置、图像识别设备及存储介质,以产生更多的增强图像,使得通过增强图像训练出的目标标记点定位模型具备较好的鲁棒性。


技术实现要素:

5.有鉴于此,有必要提供一种标记点定位方法、装置、图像识别设备及存储介质,用以解决现有技术中存在的图像数量不足,导致训练出的目标标记点定位模型鲁棒性较差的技术问题。
6.一方面,本发明提供了一种标记点定位方法,包括:
7.获取多张初始图像,并确定多张所述初始图像的初始标记点所在的初始标记点区域和初始空白区域;
8.提取所述初始标记点,并将所述初始标记点按预设次数随机嵌入至所述初始空白区域,获得多张增强图像,所述增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;
9.构建初始标记点定位模型,并基于所述多张增强图像和所述多张初始图像对所述初始标记点定位模型进行训练,获得目标标记点定位模型;
10.根据所述目标标记点定位模型对待定位图像中的标记点进行定位。
11.在一些可能的实现方式中,所述至少一个目标标记点包括第一目标标记点和第二目标标记点;所述将所述初始标记点多次随机嵌入至所述初始空白区域,获得增强图像,包括:
12.将所述初始标记点随机嵌入至所述初始空白区域,获得所述第一目标标记点、所述第一目标标记点所在的过渡标记点区域和过渡空白区域;
13.将所述初始标记点随机嵌入至所述过渡空白区域,获得所述第二目标标记点、所述第一目标标记点和所述第二目标标记点所在的所述目标标记点区域和所述目标空白区域。
14.在一些可能的实现方式中,所述初始标记点区域为所述初始标记点的最小外接矩形。
15.在一些可能的实现方式中,所述标记点定位方法还包括:
16.对所述初始图像和/或所述增强图像进行二次增强处理,所述二次增强处理为水平镜像、垂直镜像、锐化、亮度调整、对比度调整以及添加高斯噪声中的至少一种。
17.在一些可能的实现方式中,所述根据所述目标标记点定位模型对待定位图像中的标记点进行定位,包括:
18.根据所述目标标记点定位模型确定所述待定位图像中的多个候选预测框以及所述多个候选预测框中各所述候选预测框的得分;
19.将得分最高的所述候选预测框作为所述标记点的目标位置。
20.在一些可能的实现方式中,所述多张初始图像包括多张正常初始图像和多张非正常初始图像。
21.在一些可能的实现方式中,在所述基于所述多张增强图像和所述多张初始图像对所述初始标记点定位模型进行训练之前,包括:
22.将所述多张增强图像和所述多张初始图像进行缩放,获得预设尺寸的多张缩放图像;
23.对所述多张缩放图像中的各张所述缩放图像进行归一化处理,获得多张归一化图像。
24.另一方面,本发明还提供了一种标记点定位装置,包括:
25.初始图像获取单元,用于获取多张初始图像,并确定多张所述初始图像的初始标记点所在的初始标记点区域和初始空白区域;
26.图像增强单元,用于提取所述初始标记点,并将所述初始标记点按预设次数随机嵌入至所述初始空白区域,获得多张增强图像,所述增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;
27.定位模型训练单元,用于构建初始标记点定位模型,并基于所述多张增强图像和所述多张初始图像对所述初始标记点定位模型进行训练,获得目标标记点定位模型;
28.标记点定位单元,用于根据所述目标标记点定位模型对待定位图像中的标记点进行定位。
29.另一方面,本发明还提供了一种图像识别设备,包括存储器和处理器,其中,
30.所述存储器,用于存储程序;
31.所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述任意一种可能的实现方式中所述的标记点定位方法中的步骤。
32.另一方面,本发明还提供了一种计算机可读存储介质,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时能够实现上述任意一种可能的实现方式中所述的标记点定位方法中的步骤。
33.采用上述实施例的有益效果是:本发明提供的标记点定位方法,通过提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得包括至少一个目标标记点所在的目标标记点区域和目标空白区域的增强图像,可实现对初始图像的增强,从而可扩充增强图像的数量和丰富度,进而可提高通过增强图像和初始图像训练出的目标标记点
定位模型对标记点的定位准确率和鲁棒性。
34.进一步地,本发明通过对初始标记点定位模型进行训练而获得的目标标记点定位模型对待定位图像中的标记点进行定位,可自动提取待定位图像中的特征,即使在环境因素变化较大的场景下获取待定位图像,也可通过目标标记点定位模型强大的特征提取能力实现对待定位图像的标记点进行准确定位,进一步提高对标记点进行定位的成功率和准确率。
附图说明
35.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1为本发明提供的标记点定位方法的一个实施例流程示意图;
37.图2为本发明图1中步骤s102的一个实施例流程示意图;
38.图3为本发明图1中步骤s104的一个实施例流程示意图;
39.图4为本发明提供的正常初始图像的一个实施例结构示意图;
40.图5为本发明提供的非正常初始图像的一个实施例结构示意图;
41.图6为本发明提供的对样本图像进行预处理的一个实施例流程示意图;
42.图7为本发明提供的标记点定位装置的一个实施例结构示意图;
43.图8为本发明提供的图像识别设备的一个实施例结构示意图。
具体实施方式
44.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.应当理解,示意性的附图并未按实物比例绘制。本发明中使用的流程图示出了根据本发明的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本发明内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
46.附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。
47.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
48.本发明提供了一种标记点定位方法、装置、图像识别设备及存储介质,以下分别进
行说明。
49.图1为本发明提供的标记点定位方法的一个实施例流程示意图,如图1所示,标记点定位方法包括:
50.s101、获取多张初始图像,并确定多张初始图像的初始标记点所在的初始标记点区域和初始空白区域;
51.s102、提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得多张增强图像,增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;
52.s103、构建初始标记点定位模型,并基于多张增强图像和多张初始图像对初始标记点定位模型进行训练,获得目标标记点定位模型;
53.s104、根据目标标记点定位模型对待定位图像中的标记点进行定位。
54.其中,初始标记点区域、初始空白区域、目标标记点区域和目标空白区域包括区域大小和区域位置。
55.与现有技术相比,本发明实施例提供的标记点定位方法,通过提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得包括至少一个目标标记点所在的目标标记点区域和目标空白区域的增强图像,可实现对初始图像的增强,从而可扩充增强图像的数量和丰富度,进而可提高通过增强图像和多张初始图像训练出的目标标记点定位模型对标记点的定位准确率和鲁棒性。
56.进一步地,本发明实施例通过对初始标记点定位模型进行训练而获得的目标标记点定位模型对待定位图像中的标记点进行定位,可自动提取待定位图像中的特征,即使在环境因素变化较大的场景下获取待定位图像,也可通过目标标记点定位模型强大的特征提取能力实现对待定位图像的标记点进行准确定位,进一步提高对标记点进行定位的成功率和准确率。
57.其中,目标标记点定位模型的模型结构可为如r-cnn、r-fcn、sppnet、fast r-cnn、faster r-cnn、yolo、densebox、ssd、rfbnet等结构中的任意一种。
58.为了避免增强图像中目标标记点的个数过多时,导致后续对增强图像进行较多的冗余训练,在本发明的一些实施例中,步骤s102中预设次数应小于或等于5。
59.需要说明的是:初始图像中可包括至少一个初始标记点,在本发明的具体实施例中,初始图像包括一个初始标记点。
60.为了避免预设次数大于1时,例如:至少一个目标标记点包括第一目标标记点和第二目标标记点时,出现第一目标标记点和第二目标标记点部分或全部重叠,导致嵌入的目标标记点失效的技术问题,在本发明的一些实施例中,如图2所示,步骤s102包括:
61.s201、将初始标记点随机嵌入至初始空白区域,获得第一目标标记点、第一目标标记点所在的过渡标记点区域和过渡空白区域;
62.s202、将初始标记点随机嵌入至过渡空白区域,获得第二目标标记点、第一目标标记点和第二目标标记点所在的目标标记点区域和目标空白区域。
63.本发明实施例通过设置将每次嵌入的目标标记点嵌入至上一次嵌入后的空白区域,以确保多次嵌入的目标标记点之间不发生部分或全部重叠,避免嵌入的目标标记点失效的技术问题,提高增强图像的成功率和利用率。
64.由于后续的标记点定位模型通过标记点区域对标记点进行定位,因此,为了提高对标记点定位的准确率,在本发明的一些实施例中,应当使初始标记点区域对初始标记点保持紧密包围,以此来提高对标记点定位的准确率。
65.在本发明的优选实施例中,初始标记点区域为初始标记点的最小外接矩形。
66.需要说明的是:初始标记点区域可采用开源工具labeling对初始图像打标签获得。其中,初始标记点的位置坐标会以可扩展的标识语言(extensiblemarkuplanguage,xml)的格式保存,且每一张初始图像对应一个xml文件。
67.为了进一步提高对初始标记点定位模型进行训练的图像数量与丰富性,在本发明的一些实施例中,标记点定位方法还包括:
68.对初始图像和/或增强图像进行二次增强处理,二次增强处理为水平镜像、垂直镜像、锐化、亮度调整、对比度调整以及添加高斯噪声中的至少一种。
69.本发明实施例通过对初始图像和/或增强图像进行二次增强处理,可从多个增强维度对初始图像和/或增强图像进行增强,进一步提高对初始标记点模型进行训练的图像数量与丰富性,从而可进一步提高获得的目标标记点定位模型对定位点进行定位的定位准确率和鲁棒性。
70.由于本发明实施例中初始图像中仅包括一个标记点,因此,为了消除冗余标记点,在本发明的一些实施例中,如图3所示,步骤s104包括:
71.s301、根据目标标记点定位模型确定待定位图像中的多个候选预测框以及多个候选预测框中各候选预测框的得分;
72.s302、将得分最高的候选预测框作为标记点的目标位置。
73.本发明实施例通过将得分最高的候选预测框作为标记点的目标位置,可消除其他的冗余候选预测框,进一步提高确定出的标记点的目标位置的准确性。
74.其中,候选预测框指的是通过目标标记点定位模型对待定位图像进行定位时自动生成的多个预测框。
75.其中,步骤s302具体为:首先将得分小于预设得分阈值的候选预测框删除,然后从剩余的候选预测框中确定出得分最高的候选预测框。
76.通过先删除得分小于预设得分阈值的候选预测框,可减少后续对候选预测框进行排序的工作量,从而可提高确定标记点目标位置的速度。
77.应当理解的是:预设得分阈值可根据实际应用场景或经验值进行设定或调整,在本发明的具体实施例中,预设得分阈值为0.5。
78.为了确保训练处的目标标记点定位模型的鲁棒性和泛化能力,在本发明的一些实施例中,多张初始图像包括多张正常初始图像和多张非正常初始图像,其中,正常图像是指可以正常被现有技术或者人眼识别图像,非正常图像是指不能正常的被现有技术或者人眼识别的图像,举例来说,非限制性的,正常初始图像为可被模板匹配算法识别的图像,非正常初始图像为不可被模板匹配算法识别的图像。
79.在本发明的具体实施例中,图4为正常初始图像,图5为非正常初始图像。可以看出:图4中标记点与其他区域的差别较大,因此,通过模板匹配算法可成功匹配到标记点;而图5中包括多个与标记点相似的区域,通过模板匹配算法无法成功匹配到标记点。
80.在本发明的一些实施例中,图像样本集包括多张样本图像,为了提高对初始标记
点定位模型的训练速度和稳定性,如图6所示,在本发明的一些实施例中,在步骤s103之前,还包括:
81.s601、将多张增强图像和多张初始图像中的各张图像进行缩放,获得预设尺寸的多张缩放图像;
82.s602、对多张缩放图像中的各张缩放图像进行归一化处理,获得多张归一化图像。
83.本发明实施例通过将各张增强图像缩放到预设尺寸,可降低对初始标记点定位模型的训练量,从而可提高初始标记点定位模型的训练速度。并且,通过将各张缩放图像进行归一化处理,可防止模型训练过程中出现梯度爆炸,从而可提高初始标记点定位模型训练过程中的稳定性。
84.需要说明的是:为了确保缩放图像中标记点的可见性,缩放图像中的标记点任意方向的长度均应当大于8个像素。
85.在本发明的具体实施例中,样本图像的大小为512
×
512,预设尺寸为448
×
448,样本图像中的标记点大小为50
×
50左右,经过缩放后变成了43
×
43。
86.在本发明的具体实施例中,归一化图像为单通道灰度图,其具体过程为:将缩放图像中的各像素的像素值均除以255,获得单通道灰度图。
87.为了验证本发明实施例提出的标记点定位方法的优越性,获取587张初始图像,其中2/5为正常初始图像,3/5为非正常初始图像,利用模型结构为yolo v5的初始标记点定位模型进行训练,获得目标标记点定位模型。并另外获取147张图像作为验证集,其中验证集中2/5为正常初始图像,3/5为非正常初始图像,通过验证集对目标标记点定位模型进行验证,验证结果为:能准确定位到145张图像中的定位点,即:标记点定位准确率高达98.6%。而利用模板匹配方法对这147张图像定位,准确率只有42.1%。可以看出:本发明实施例提出的目标标记点定位模型的定位准确率远好于模板匹配方法。
88.本发明实施例提出的标记点定位方法,特别适用于光伏电池加工技术领域,通常的,在光伏电池片加工的过程中,为了保持电池片的加工精度,通常在电池片上预设mark点(标记点)作为电池片定位标记,在加工过程中,电池片可能会存在一些色差等,或者会产生一些缺陷,导致对预设mark点(标记点)的视觉识别产生误差或错误。而且非正常电池片较少,难以收集,本发明的方法可实现对初始图像的增强,从而可扩充对初始标记点定位模型进行训练的增强图像数量和丰富度,从而有助于提高训练好的目标标记点定位模型的对标记点的定位准确率和鲁棒性。
89.为了更好实施本发明实施例中的标记点定位方法,在标记点定位方法基础之上,对应的,如图7所示,本发明实施例还提供了一种标记点定位装置700,包括:
90.初始图像获取单元701,用于获取多张初始图像,并确定多张初始图像的初始标记点所在的初始标记点区域和初始空白区域;
91.图像增强单元702,用于提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得多张增强图像,增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;
92.定位模型训练单元703,用于构建初始标记点定位模型,并基于多张增强图像和多张初始图像对初始标记点定位模型进行训练,获得目标标记点定位模型;
93.标记点定位单元704,用于根据目标标记点定位模型对待定位图像中的标记点进
行定位。
94.上述实施例提供的标记点定位装置700可实现上述标记点定位方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述标记点定位方法实施例中的相应内容,此处不再赘述。
95.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
96.如图8所示,本发明还相应提供了一种图像识别设备800。该图像识别设备800包括处理器801、存储器802及显示器803。图8仅示出了图像识别设备800的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
97.存储器802在一些实施例中可以是图像识别设备800的内部存储单元,例如图像识别设备800的硬盘或内存。存储器802在另一些实施例中也可以是图像识别设备800的外部存储设备,例如图像识别设备800上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
98.进一步地,存储器802还可既包括图像识别设备800的内部储存单元也包括外部存储设备。存储器802用于存储安装图像识别设备800的应用软件及各类数据。
99.处理器801在一些实施例中可以是一中央处理器(central processing unit,cpu),微处理器或其他数据处理芯片,用于运行存储器802中存储的程序代码或处理数据,例如本发明中的标记点定位方法。
100.显示器803在一些实施例中可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。显示器803用于显示在图像识别设备800的信息以及用于显示可视化的用户界面。图像识别设备800的部件801-803通过系统总线相互通信。
101.在本发明的一些实施例中,当处理器801执行存储器802中的标记点定位程序时,可实现以下步骤:
102.获取多张初始图像,并确定多张初始图像的初始标记点所在的初始标记点区域和初始空白区域;
103.提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得多张增强图像,增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;
104.构建初始标记点定位模型,并基于多张增强图像和多张初始图像对初始标记点定位模型进行训练,获得目标标记点定位模型;
105.根据目标标记点定位模型对待定位图像中的标记点进行定位。
106.应当理解的是:处理器801在执行存储器802中的标记点定位程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面相应方法实施例的描述。
107.进一步地,本发明实施例对提及的图像识别设备800的类型不做具体限定,图像识别设备800可以为平板电脑、个人数字助理(personal digitalassistant,pda)、可穿戴设备、膝上型计算机(laptop)等便携式图像识别设备。上述便携式图像识别设备也可以是其他便携式图像识别设备,诸如具有触敏表面(例如触控面板)的膝上型计算机(laptop)等。还应当理解的是,在本发明其他一些实施例中,图像识别设备800也可以不是便携式图像识别设备,而是具有触敏表面(例如触控面板)的台式计算机。
108.相应地,本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质用于存储计算机可读取的程序或指令,程序或指令被处理器执行时,能够实现上述各方法实施例提供的方法步骤或功能。
109.本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件(如处理器,控制器等)来完成,计算机程序可存储于计算机可读存储介质中。其中,计算机可读存储介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,randomaccess memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
110.以上对本发明所提供的标记点定位方法、装置、图像识别设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种标记点定位方法,其特征在于,包括:获取多张初始图像,并确定多张所述初始图像的初始标记点所在的初始标记点区域和初始空白区域;提取所述初始标记点,并将所述初始标记点按预设次数随机嵌入至所述初始空白区域,获得多张增强图像,所述增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;构建初始标记点定位模型,并基于所述多张增强图像和所述多张初始图像对所述初始标记点定位模型进行训练,获得目标标记点定位模型;根据所述目标标记点定位模型对待定位图像中的标记点进行定位。2.根据权利要求1所述的标记点定位方法,其特征在于,所述至少一个目标标记点包括第一目标标记点和第二目标标记点;所述将所述初始标记点多次随机嵌入至所述初始空白区域,获得增强图像,包括:将所述初始标记点随机嵌入至所述初始空白区域,获得所述第一目标标记点、所述第一目标标记点所在的过渡标记点区域和过渡空白区域;将所述初始标记点随机嵌入至所述过渡空白区域,获得所述第二目标标记点、所述第一目标标记点和所述第二目标标记点所在的所述目标标记点区域和所述目标空白区域。3.根据权利要求1所述的标记点定位方法,其特征在于,所述初始标记点区域为所述初始标记点的最小外接矩形。4.根据权利要求1所述的标记点定位方法,其特征在于,所述标记点定位方法还包括:对所述初始图像和/或所述增强图像进行二次增强处理,所述二次增强处理为水平镜像、垂直镜像、锐化、亮度调整、对比度调整以及添加高斯噪声中的至少一种。5.根据权利要求1-4任意一项所述的标记点定位方法,其特征在于,所述根据所述目标标记点定位模型对待定位图像中的标记点进行定位,包括:根据所述目标标记点定位模型确定所述待定位图像中的多个候选预测框以及所述多个候选预测框中各所述候选预测框的得分;将得分最高的所述候选预测框作为所述标记点的目标位置。6.根据权利要求1所述的标记点定位方法,其特征在于,所述多张初始图像包括多张正常初始图像和多张非正常初始图像。7.根据权利要求1所述的标记点定位方法,其特征在于,在所述基于所述多张增强图像和所述多张初始图像对所述初始标记点定位模型进行训练之前,包括:将所述多张增强图像和所述多张初始图像进行缩放,获得预设尺寸的多张缩放图像;对所述多张缩放图像中的各张所述缩放图像进行归一化处理,获得多张归一化图像。8.一种标记点定位装置,其特征在于,包括:初始图像获取单元,用于获取多张初始图像,并确定多张所述初始图像的初始标记点所在的初始标记点区域和初始空白区域;图像增强单元,用于提取所述初始标记点,并将所述初始标记点按预设次数随机嵌入至所述初始空白区域,获得多张增强图像,所述增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;定位模型训练单元,用于构建初始标记点定位模型,并基于所述多张增强图像和所述
多张初始图像对所述初始标记点定位模型进行训练,获得目标标记点定位模型;标记点定位单元,用于根据所述目标标记点定位模型对待定位图像中的标记点进行定位。9.一种图像识别设备,其特征在于,包括存储器和处理器,其中,所述存储器,用于存储程序;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述权利要求1至7中所述的标记点定位方法中的步骤。10.一种计算机可读存储介质,其特征在于,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时能够实现上述权利要求1至7中所述的标记点定位方法中的步骤。

技术总结
本发明提供了一种标记点定位方法、装置、图像识别设备及存储介质,其标记点定位方法包括:获取多张初始图像,并确定多张初始图像的初始标记点所在的初始标记点区域和初始空白区域;提取初始标记点,并将初始标记点按预设次数随机嵌入至初始空白区域,获得多张增强图像,增强图像包括至少一个目标标记点所在的目标标记点区域和目标空白区域;构建初始标记点定位模型,并基于多张增强图像和多张初始图像对初始标记点定位模型进行训练,获得目标标记点定位模型;根据目标标记点定位模型对待定位图像中的标记点进行定位。本发明通过对初始图像进行图像增强,可提高图像的数量和丰富度,从而提高目标标记点定位模型对标记点的定位准确率和鲁棒性。准确率和鲁棒性。准确率和鲁棒性。


技术研发人员:陈枫 艾辉 姚峰 孙小倩
受保护的技术使用者:武汉帝尔激光科技股份有限公司
技术研发日:2022.08.29
技术公布日:2023/8/24
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐