一种列车零部件识别模型训练方法、装置及设备
未命名
10-19
阅读:85
评论:0
1.本发明属于目标检测技术领域,尤其涉及一种列车零部件识别模型训练方法、装置及设备。
背景技术:
2.铁路运输是一种高效、安全、环保、经济的交通方式,具有高运载能力、固定路线、大区域连通和适应各种气候条件等特点。随着高铁建设的加速推进,列车数量的不断增加以及基础设施水平的提高,对列车安全检修工作也提出了较大的挑战。列车安全检修工作是确保列车在运行过程中顺利、稳定地运行的重要环节。安全检修工作可有效监测车辆系统的完整性,有助于避免由于设备老化和磨损引起的故障,从而确保列车运行的稳定和安全。
3.车底部分作为列车的重要支撑结构,其质量和安全直接关系到列车行驶的稳定性和安全性。由于运营时间长、运行里程高、环境条件复杂,列车车底各类零部件磨损、脱落、变形、断裂等故障频发,这直接威胁着列车的安全性和可靠性。定期对列车车底进行检修可以发现并排除潜在的故障隐患,确保车底部分的正常运作。
4.通过实际调研发现,在列车车底检测方面暂未有成熟的智能化检修装置,这是因为相关数据获取困难等问题所致,导致目前列车车底的安全检修工作主要依靠人工进行检测,通过目视或者探头的方式对列车车底零部件逐一排查完成检修。这一过程耗时极长,工作强度较大,同时极容易造成漏检问题。并且这一检修方式需要列车运行到指定地点才能进行,限制较大,在列车运行空窗期很难进行检测。
技术实现要素:
5.本发明实施例提供一种列车零部件识别模型训练方法、装置及设备,旨在解决背景技术当中的至少一个技术问题。
6.本发明实施例是这样实现的,一种列车零部件识别模型训练方法,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置上方的摄像装置,所述方法包括:
7.获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像;
8.对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集;
9.通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到所述列车零部件识别模型。
10.进一步地,获取所述摄像装置拍摄的列车零部件图像的步骤包括:
11.使所述列车零部件处于不同状态、控制所述夹持装置驱动所述列车零部件处于不同位姿和/或控制所述摄像装置移动到不同位置;
12.在所述列车零部件处于不同状态、所述列车零部件处于不同位姿和/或所述摄像装置处于不同位置下,分别控制所述摄像装置拍摄所述列车零部件图像
13.进一步地,所述列车零部件包括紧固件,所述状态包括紧固状态和松弛状态。
14.进一步地,所述夹持装置包括用于夹持所述列车零部件的夹持件、以及用于驱动所述夹持件旋转的驱动组件。
15.进一步地,所述摄像装置设置在圆形电动导轨上,所述摄像装置能够沿所述圆形电动导轨移动。
16.进一步地,所述圆形电动导轨上设有均匀布置的若干位置传感器,当所述摄像装置移动到任一所述位置传感器处时,控制所述摄像装置停止移动,直到其在当前位置拍摄完列车零部件图像。
17.进一步地,所述预设神经网络为改进的yolov5神经网络,所述改进的yolov5神经网络包括cspdarknet特征提取模块、fpn特征融合模块以及yolo head模块;
18.其中,通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失函数的步骤包括:
19.将所述数据集当中的训练图像输入到所述cspdarknet特征提取模块当中进行特征提取,得到有效特征层;
20.将所述有效特征层输入到所述fpn特征融合模块当中进行特征融合,得到融合后的有效特征层;
21.将所述融合后的有效特征层输入到所述yolo head模块当中进行输出,得到预测的列车零部件识别信息;
22.采用预设损失函数计算所述预测的列车零部件识别信息与标注的列车零部件识别信息之间的损失。
23.进一步地,所述预设损失函数loss为:
24.loss=a*l
class
+b*l
local
+c*l
conf
25.式中,l
class
、l
local
以及l
conf
分别为分类损失函数、定位损失函数和置信度损失函数,a、b和c分别为分类损失函数、定位损失函数和置信度损失函数的权重系数。
26.本发明实施例还提供了一种列车零部件识别模型训练装置,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述列车零部件识别模型训练装置包括:
27.图像获取模块,用于获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像;
28.图像标注模块,用于对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集;
29.模型训练模块,用于通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到
所述列车零部件识别模型。
30.本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的列车零部件识别模型训练方法。
31.本发明实施例还提供了一种列车零部件识别模型训练设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,还包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述处理器执行所述程序时实现如上述的列车零部件识别模型训练方法。
32.本发明所达到的有益效果为:通过搭建能够模拟仿真装置,以能够获取大量的列车零部件图像,解决了传统相关数据获取困难等问题,然后结合深度学习神经网络,能够训练得到自动对列车零部件进行识别检测的列车零部件识别模型,从而解决传统人工检修耗时、工作强度大、限制大要求多的技术问题。
附图说明
33.图1是本发明实施例当中提供的模拟仿真装置的结构图;
34.图2是本发明实施例当中提供的
35.图3是本发明实施例一当中的列车零部件识别模型训练方法的流程图;
36.图4是本发明实施例二当中提供的focus网络结构示意图;
37.图5为本发明实施例三当中的列车零部件识别模型训练装置的结构框图;
38.图6是本发明实施例四当中的列车零部件识别模型训练设备的结构框图。
具体实施方式
39.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
40.以下各实施例均可采用图1-图2示出的模拟仿真装置来获取列车零部件图像,图1-图2示出的模拟仿真装置又可以称之为列车车底复杂背景模拟仿真实验台,其主要包括支架100、固定于支架100底部并用于呈现列车底部图案的显示装置200、设置于显示装置200上方并用于固定列车零部件的夹持装置300、以及设置于夹持装置300上方的摄像装置400,摄像装置400能够对夹持装置300夹持的列车零部件在显示装置200显示的车底部图案背景下进行成像,从而通过仿真的方式来获取得到列车零部件图像。
41.具体地,夹持装置300包括卡箍301、与卡箍301转动连接的支撑臂302、与支撑臂302转动连接的用于夹持列车零部件的夹持件303、以及用于驱动夹持件303旋转的驱动组件,其中驱动组件具体固定于支撑臂302上且连接夹持件303。具体地,卡箍301具体通过螺栓等紧固件可拆卸的固定于支架100上,使得卡箍301能够相对支架100上下调节,支撑臂302与卡箍301具体通过铆接方式进行连接,使得在需要时可以将支撑臂302、驱动组件以及夹持件303转开,便于操作,同时也能够调整夹持件303夹持的列车零部件的位置。驱动组件具体包括固定于支撑臂302上的电机304、与电机304的输出轴固定连接的第一齿轮305、以及与第一齿轮305啮合的第二齿轮306,第二齿轮306与夹持件303固定连接,从而能够带动
夹持件303夹持的列车零部件转动,调整姿态,夹持件303具体可以为夹紧气缸、或者弹性夹臂等。具体地,模拟仿真装置具体包括设置在支架两侧的两个夹持装置300,优选地两个夹持装置300当中的一个不设置驱动组件,由于夹持装置300的高度可调,这样列车零部件在被两个夹持装置300各夹一端时,可以使列车零部件处于不同的倾斜状态。因此通过夹持装置300特殊的设计,并且驱动组件能够驱动夹持件303调整位姿,从而使列车零部件处于不同位姿,以提供列车零部件图像的多样性,提升模型训练可靠性。与此同时,摄像装置400设置在圆形电动导轨500上,圆形电动导轨500固定于支架100的顶端,摄像装置400能够沿圆形电动导轨500移动,从而调整不同的拍摄角度,以提供列车零部件图像的多样性,同样提升模型训练可靠性,具体地圆形电动导轨500的结构与原理与传统电动窗帘的电动导轨一致,在此不做详细描述。优选地,圆形电动导轨500上设有均匀布置的若干位置传感器501,当摄像装置移动到任一位置传感器501处时,控制摄像装置停止移动,直到其在当前位置拍摄完列车零部件图像,也即通过在不同位置布置位置传感器501,以对摄像装置进行到位检测,从而控制摄像装置在多个固定位置处进行拍摄。其中位置传感器501例如可以为接近开关、红外传感器等。
42.需要指出的是,图1-图2示出的结构并不构成对模拟仿真装置的限定,在其它实施例当中,该模拟仿真装置可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
43.实施例一
44.请参阅图3,所示为本发明实施例一当中的列车零部件识别模型训练方法,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括上述的模拟仿真装置,所述列车零部件识别模型训练方法具体可以通过软件和/或硬件来实现,所述方法具体包括步骤s01-步骤s03。
45.步骤s01,获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像。
46.在具体实施时,可以通过显示装置播放不同内容或者不同环境下的列车底部图片,以模拟列车车底复杂背景,然后将列车零部件夹持于夹持装置上,并启动摄像装置进行拍摄,从而获取得到列车零部件图像。
47.在较优实施例当中,获取所述摄像装置拍摄的列车零部件图像的步骤具体可以包括:
48.使所述列车零部件处于不同状态、控制所述夹持装置驱动所述列车零部件处于不同位姿和/或控制所述摄像装置移动到不同位置;
49.在所述列车零部件处于不同状态、所述列车零部件处于不同位姿和/或所述摄像装置处于不同位置下,分别控制所述摄像装置拍摄所述列车零部件图像。
50.需要说明的是,由于列车车底检测主要包括检测螺栓等紧固件的状态,即检测紧固件是否有松弛现象,如有则需要进行维护。因此在本实施例当中,列车零部件主要包括紧固件,同时所述状态包括紧固状态和松弛状态,其中紧固状态具体是指紧固件处于锁死无松动状态,松弛状态具体是指紧固件处于未锁死、松动状态。
51.也即,在具体实施时,可以先让紧固件处于紧固状态下并夹持于夹持装置上,并让夹持装置将紧固件置于其中一种预设位姿下(具体模拟紧固件在列车底部的不同位姿),然
后控制显示装置播放其中一张列车底部图片,再让摄像装置沿圆形电动导轨移动,以在不同拍摄位置下拍摄当前状态下的列车零部件图像,拍摄完后控制显示装置切换下一张列车底部图片,然后再让摄像装置沿圆形电动导轨移动拍摄一次,直到所有预存的列车底部图片全部拍摄完;然后让夹持装置将紧固件置于其中另外一种预设位姿下,重复执行上述的拍摄过程,直到所有预设位姿下全部都完成拍摄后,再让紧固件处于松动状态再重复上述步骤,从而拍摄得到不同状态、不同位姿、不同背景以及不同拍摄角度的大量列车零部件图像,从而为后续模型训练提供了充足、多样化、且具有正负样本的训练图像,提高模型训练的可靠性。在其他一些可选的实施例当中,还可以针对松弛状态进行具体细化,例如可以细化为不同松弛程度的松弛状态,从而使得训练的模型不仅能够对紧固件是否出现松弛进行识别,还能够对松弛程度进行识别。
52.步骤s02,对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集。
53.在具体实施时,可以在labelimg软件中对所有图片进行标注。由于深度学习算法的精确度与数据集密切相关,为提高算法模型的泛化能力与鲁棒性,对采集到的数据集样本进行数据增强。在数据增强中利用了水平与垂直随机翻转、等比与不等比随机缩放和随机对比度手段,模拟真实场景中的多样性和复杂性,可以有效地解决数据不平衡的问题。
54.步骤s03,通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到所述列车零部件识别模型。
55.综上,本实施例当中的列车零部件识别模型训练方法,通过搭建能够模拟仿真装置,以能够获取大量的列车零部件图像,解决了传统相关数据获取困难等问题,然后结合深度学习神经网络,能够训练得到自动对列车零部件进行识别检测的列车零部件识别模型,从而解决传统人工检修耗时、工作强度大、限制大要求多的技术问题。
56.实施例二
57.本发明实施例二同样提出一种列车零部件识别模型训练方法,本实施例当中的列车零部件识别模型训练方法与第一实施例当中的列车零部件识别模型训练方法的不同之处在于:
58.所述预设神经网络为改进的yolov5神经网络,所述改进的yolov5神经网络包括cspdarknet特征提取模块、fpn特征融合模块以及yolo head模块;
59.其中,通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失函数的步骤包括:
60.将所述数据集当中的训练图像输入到所述cspdarknet特征提取模块当中进行特征提取,得到有效特征层;
61.将所述有效特征层输入到所述fpn特征融合模块当中进行特征融合,得到融合后的有效特征层;
62.将所述融合后的有效特征层输入到所述yolo head模块当中进行输出,得到预测的列车零部件识别信息;
63.采用预设损失函数计算所述预测的列车零部件识别信息与标注的列车零部件识别信息之间的损失。
64.需要说明的是,传统的yolov5神经网络其采用backbone作为主干特征提取网络,而在本实施例提供的改进的yolov5神经网络中采用cspdarknet作为主干特征提取网络,在cspdarknet中,输入的图片会进行特征提取得到特征层。在主干部分共获得三个有效特征层,三个有效特征层包含了目标检测所需要的关键信息,用于后续的目标检测任务。同时,在cspdarknet中包含了spp结构和focus网络结构,即改进的yolov5的主干特征提取网络使用了残差网络residual,整个改进的yolov5的主干部分都由残差卷积构成。同时,在主干特征提取网络中使用了focus网络结构(如图4所示),focus网络结构的特征提取网络由一系列卷积层和池化层组成,其中最后一层是focus卷积层。这个卷积层的输入是特征图,输出是四个独立的特征层,每个特征层对应原始图像的四个不同区域。将这四个独立的特征层进行堆叠,这样宽高信息就被整合到了通道信息中。这种方法扩充了输入通道四倍,提高了模型的感受野和特征表达能力。
65.具体地,改进的yolov5提取多特征层进行目标检测,一共提取三个特征层。三个特征层分别位于主干部分cspdarknet的中间层、中下层、底层,在输入为(640,640,3)时,shape在三个特征层上分别为:
66.feat1=(80,80,250);
67.feat2=(40,40,512);
68.feat3=(20,20,1024);
69.fpn是一种用于目标检测和语义分割的卷积神经网络结构,视为算法中的加强特征提取网络,在主干部分获得的三个有效特征层会在fpn的特征融合网络中采样到高层次,并与高层次的特征图进行融合。fpn的特征金字塔可以被用于生成不同尺度的分割结果,并进行融合得到最终的分割结果。
70.yolo head是yolov5的分类器与回归器,yolo head使用在cspdarknet和fpn中提取的特征,来对每个预测框框进行分类和回归。分类器将每个预测框框中的目标物体分到正确的类别中,回归器则使用线性函数预测每个框框的中心位置和宽高。
71.具体地,所述预设损失函数loss为:
72.loss=a*l
class
+b*l
local
+c*l
conf
73.式中,l
class
、l
local
以及l
conf
分别为分类损失函数、定位损失函数和置信度损失函数,a、b和c分别为分类损失函数、定位损失函数和置信度损失函数的权重系数。
74.也即,在本实施例的改进的yolov5中包含了以下三种损失函数:classification loss(分类损失)、localization loss(定位损失)和confidence loss(置信度损失)。总体的损失即为以上三者的加权相加。
75.其中,分类损失函数l
class
为
[0076][0077]
其中,
[0078]
以上公式中n代表类别总个数,yi表示结果激活函数后得到的当前类别的概率,xi
表示当前类别预测值,代表当前类别的真实值。
[0079]
此外,在传统定位损失当中,通常采用平方损失来确定定位损失l
local
,即:
[0080]
l
local
=(x-x
*
)2+(y-y
*
)
2-(w-w
*
)2+(h-h
*
)2,式中,x,y为预测框的左上角坐标,w,h为预测框的宽高,x
*
和y
*
为标注的真实框的左上角坐标,w
*
和h
*
为标注的真实框的宽高;
[0081]
但在实际研究中发现,该方法存在一定问题,在使用平方损失时无法很好地衡量边界框与真实框的重叠区域面积与两者并集区域的面积之比。因此,为解决这个问题,本实施例具体采用ciou loss来确定定位损失l
local
,也即本实施例当中的定位损失l
local
具体为:
[0082][0083][0084][0085]
其中,b,b
gt
分别为预测框和真实框,iou(b,b
gt
)代表预测框和真实框的交集与并集的比值,v为预测框和真实框长宽比例差值的归一化,集的比值,v为预测框和真实框长宽比例差值的归一化,部分的值在0到π/4之间,乘以4/π后就可以转化为到0到1之间。而α为权衡长宽比例造成的损失和iou部分造成的损失的平衡因子。
[0086]
其中,置信度损失函数具体为:
[0087][0088]
式中,n是batch size,s是网格大小,表示模型对第i张图像中第j个边界框是否包含目标的预测,表示真实标签,如果该位置包括目标,则否则为0。当该位置没有目标时,用表示。
[0089]
实施例三
[0090]
本发明另一方面还提出一种列车零部件识别模型训练装置,请参阅图5,所示为本发明实施例三提供的列车零部件识别模型训练装置,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述列车零部件识别模型训练装置包括:
[0091]
图像获取模块11,用于获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像;
[0092]
图像标注模块12,用于对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集;
[0093]
模型训练模块13,用于通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到所述列车零部件识别模型。
[0094]
进一步地,在本发明一些可选实施例当中,所述图像获取模块11还用于使所述列车零部件处于不同状态、控制所述夹持装置驱动所述列车零部件处于不同位姿和/或控制所述摄像装置移动到不同位置;在所述列车零部件处于不同状态、所述列车零部件处于不同位姿和/或所述摄像装置处于不同位置下,分别控制所述摄像装置拍摄所述列车零部件图像。
[0095]
进一步地,在本发明一些可选实施例当中,所述列车零部件包括紧固件,所述状态包括紧固状态和松弛状态。
[0096]
进一步地,在本发明一些可选实施例当中,所述夹持装置包括用于夹持所述列车零部件的夹持件、以及用于驱动所述夹持件旋转的驱动组件。
[0097]
进一步地,在本发明一些可选实施例当中,所述摄像装置设置在圆形电动导轨上,所述摄像装置能够沿所述圆形电动导轨移动。
[0098]
进一步地,在本发明一些可选实施例当中,所述圆形电动导轨上设有均匀布置的若干位置传感器,当所述摄像装置移动到任一所述位置传感器处时,控制所述摄像装置停止移动,直到其在当前位置拍摄完列车零部件图像。
[0099]
进一步地,在本发明一些可选实施例当中,所述预设神经网络为改进的yolov5神经网络,所述改进的yolov5神经网络包括cspdarknet特征提取模块、fpn特征融合模块以及yolo head模块;
[0100]
其中,通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失函数的步骤包括:
[0101]
将所述数据集当中的训练图像输入到所述cspdarknet特征提取模块当中进行特征提取,得到有效特征层;
[0102]
将所述有效特征层输入到所述fpn特征融合模块当中进行特征融合,得到融合后的有效特征层;
[0103]
将所述融合后的有效特征层输入到所述yolo head模块当中进行输出,得到预测的列车零部件识别信息;
[0104]
采用预设损失函数计算所述预测的列车零部件识别信息与标注的列车零部件识别信息之间的损失。
[0105]
进一步地,在本发明一些可选实施例当中,所述预设损失函数loss为:
[0106]
loss=a*l
class
+b*l
local
+c*l
conf
[0107]
式中,l
class
、l
local
以及l
conf
分别为分类损失函数、定位损失函数和置信度损失函数,a、b和c分别为分类损失函数、定位损失函数和置信度损失函数的权重系数。
[0108]
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
[0109]
综上,本实施例当中的列车零部件识别模型训练装置,通过搭建能够模拟仿真装
置,以能够获取大量的列车零部件图像,解决了传统相关数据获取困难等问题,然后结合深度学习神经网络,能够训练得到自动对列车零部件进行识别检测的列车零部件识别模型,从而解决传统人工检修耗时、工作强度大、限制大要求多的技术问题。
[0110]
实施例四
[0111]
请参阅图6,本发明实施例四提出一种列车零部件识别模型训练设备,包括处理器10、存储器20以及存储在存储器上并可在处理器上运行的计算机程序30,还包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述处理器10执行所述程序30时实现如上述的列车零部件识别模型训练方法。
[0112]
其中,处理器10在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
[0113]
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是列车零部件识别模型训练设备的内部存储单元,例如该列车零部件识别模型训练设备的硬盘。存储器20在另一些实施例中也可以是列车零部件识别模型训练设备的外部存储装置,例如列车零部件识别模型训练设备上配备的插接式硬盘,智能存储卡(smartmedia card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器20还可以既包括列车零部件识别模型训练设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储安装于列车零部件识别模型训练设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
[0114]
需要指出的是,图6示出的结构并不构成对列车零部件识别模型训练设备的限定,在其它实施例当中,该列车零部件识别模型训练设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0115]
综上,本实施例当中的列车零部件识别模型训练设备,通过搭建能够模拟仿真装置,以能够获取大量的列车零部件图像,解决了传统相关数据获取困难等问题,然后结合深度学习神经网络,能够训练得到自动对列车零部件进行识别检测的列车零部件识别模型,从而解决传统人工检修耗时、工作强度大、限制大要求多的技术问题。
[0116]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的列车零部件识别模型训练方法。
[0117]
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0118]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器
(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0119]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0120]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0121]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种列车零部件识别模型训练方法,其特征在于,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置上方的摄像装置,所述方法包括:获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像;对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集;通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到所述列车零部件识别模型。2.如权利要求1所述的列车零部件识别模型训练方法,其特征在于,获取所述摄像装置拍摄的列车零部件图像的步骤包括:使所述列车零部件处于不同状态、控制所述夹持装置驱动所述列车零部件处于不同位姿和/或控制所述摄像装置移动到不同位置;在所述列车零部件处于不同状态、所述列车零部件处于不同位姿和/或所述摄像装置处于不同位置下,分别控制所述摄像装置拍摄所述列车零部件图像。3.如权利要求2所述的列车零部件识别模型训练方法,其特征在于,所述列车零部件包括紧固件,所述状态包括紧固状态和松弛状态。4.如权利要求2所述的列车零部件识别模型训练方法,其特征在于,所述夹持装置包括用于夹持所述列车零部件的夹持件、以及用于驱动所述夹持件旋转的驱动组件。5.如权利要求2所述的列车零部件识别模型训练方法,其特征在于,所述摄像装置设置在圆形电动导轨上,所述摄像装置能够沿所述圆形电动导轨移动。6.如权利要求5所述的列车零部件识别模型训练方法,其特征在于,所述圆形电动导轨上设有均匀布置的若干位置传感器,当所述摄像装置移动到任一所述位置传感器处时,控制所述摄像装置停止移动,直到其在当前位置拍摄完列车零部件图像。7.如权利要求1-6任一项所述的列车零部件识别模型训练方法,其特征在于,所述预设神经网络为改进的yolov5神经网络,所述改进的yolov5神经网络包括cspdarknet特征提取模块、fpn特征融合模块以及yolo head模块;其中,通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失函数的步骤包括:将所述数据集当中的训练图像输入到所述cspdarknet特征提取模块当中进行特征提取,得到有效特征层;将所述有效特征层输入到所述fpn特征融合模块当中进行特征融合,得到融合后的有效特征层;将所述融合后的有效特征层输入到所述yolo head模块当中进行输出,得到预测的列车零部件识别信息;采用预设损失函数计算所述预测的列车零部件识别信息与标注的列车零部件识别信息之间的损失。
8.如权利要7所述的列车零部件识别模型训练方法,其特征在于,所述预设损失函数loss为:loss=a*l
class
+b*l
local
+c*l
conf
式中,l
class
、l
local
以及l
conf
分别为分类损失函数、定位损失函数和置信度损失函数,a、b和c分别为分类损失函数、定位损失函数和置信度损失函数的权重系数。9.一种列车零部件识别模型训练装置,其特征在于,应用于列车零部件识别模型训练设备当中,所述列车零部件识别模型训练设备包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述列车零部件识别模型训练装置包括:图像获取模块,用于获取所述摄像装置拍摄的列车零部件图像,所述列车零部件图像为所述列车零部件以所述列车底部图案为背景的成像;图像标注模块,用于对所述列车零部件图像中的列车零部件进行标注,构建用于列车零部件识别模型训练的数据集;模型训练模块,用于通过所述数据集对预设神经网络进行训练,并计算所述预设神经网络的损失,并采用反向传播算法迭代更新所述预设神经网络的参数,从而训练得到所述列车零部件识别模型。10.一种列车零部件识别模型训练设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,还包括模拟仿真装置,所述模拟仿真装置包括用于呈现列车底部图案的显示装置、设置于所述显示装置上方并用于固定列车零部件的夹持装置、以及设置于所述夹持装置的上方的摄像装置,所述处理器执行所述程序时实现如权利要求1-8任一所述的列车零部件识别模型训练方法。
技术总结
本发明适用于目标检测技术领域,提供了一种列车零部件识别模型训练方法、装置及设备,所述方法包括:获取摄像装置拍摄的列车零部件图像,列车零部件图像为列车零部件以列车底部图案为背景的成像;对列车零部件图像中的列车零部件进行标注,构建数据集;通过数据集对预设神经网络进行训练,并计算预设神经网络的损失,并采用反向传播算法迭代更新预设神经网络的参数,从而训练得到列车零部件识别模型。本发明通过搭建能够模拟仿真装置,以能够获取大量的列车零部件图像,解决了传统相关数据获取困难等问题,然后结合深度学习神经网络,能够训练得到自动对列车零部件进行识别检测的列车零部件识别模型。车零部件识别模型。车零部件识别模型。
技术研发人员:胡军 徐思杰 徐帆 乔鹏 王妍慧
受保护的技术使用者:华东交通大学
技术研发日:2023.07.11
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
