一种齿轮非理想故障数据生成方法与流程

未命名 10-19 阅读:119 评论:0


1.本发明属于齿轮非理想故障数据方法应用领域,具体涉及一种基于深度迁移学习的齿轮非理想故障数据方法。


背景技术:

2.齿轮作为机械设备中一种必不可少的通用零部件,在直升机、歼击机、运输机等航空装备中得到了广泛的应用。由于其工作环境恶劣,容易受到损害和出现故障,这将直接影响设备的安全可靠运行,可能造成人员伤亡等严重后果。
3.随着机械设备监测数据量的快速增长,实际运行过程中采集的数据存在故障样本无标签与少标签、故障样本不足、退化数据不完整等三种非理想数据。许多学者采用深度迁移学习方法解决故障样本无标签与少标签的问题,其主要思路为应用域适配模型适配两个领域间的边缘分布。未考虑到两个领域间条件分布差异对迁移生成的影响。因此,当不能同时适配两个领域间的边缘分布与条件分布时,将会导致生成标签效果较差。


技术实现要素:

4.本发明的目的在于提供一种基于深度迁移学习方法的齿轮非理想故障数据生成方法解决上述齿轮非理想故障数据生成方法不足,取得了更佳的迁移生成效果,提高了模型的泛化性能。
5.实现本发明目的的技术解决方案为:
6.一种基于深度迁移学习的齿轮非理想故障数据生成方法,其包括以下步骤:
7.以一维卷积神经网络为特征分别从源域与目标域中提取可迁移故障特征,在训练过程中两个数据集的网络参数共享;
8.以最大均值差异的变体为衡量数据分布差异的距离指标,利用多核-最大均值差异度量可迁移故障特征的边缘分布差异;
9.以最大均值差异的变体为衡量数据分布差异的距离指标,将可迁移故障特征与伪标签输入到多核-局部最大均值差异中获得子域分布差异;
10.软标签学习提取源域软标签,联合源域软标签、目标域标签分布预测值与目标域标签生成软标签损失;
11.建立深度迁移学习网络的目标函数,对目标函数进行迭代训练,直到目标函数值达到阈值,并利用完成训练的模型扩充生成目标域标签,其中所述目标函数包括源域以及目标域的分类损失函数与子域分布差异。
12.优选地,步骤1中源域和目标域均为振动信号,其中有标签的源域为无标签的目标域为且源域远大于目标域。
13.优选地,步骤2中多核-最大均值差异可定义为
14.15.式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数;
16.优选地,步骤3中多核-局部最大均值差异可定义为
[0017][0018]
式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数;p
(c)
、q
(c)
分别为源域、目标域中类别c的分布;
[0019]
优选地,步骤4中软标签学习包含提取源域软标签与生成软标签损失两部分,源域软标签指源域中所有样本的平均标签预测值,通过公式可以获得源域的标签预测值,则源域软标签为
[0020][0021][0022]
式中,分别表示样本属于类别c的子域、子域样本数;τ表示相关类在训练过程中的影响系数。
[0023]
首先通过式(12)获得的源域软标签ys;然后根据目标域标签生成软标签最后结合目标域的标签预测值生成软标签损失,即为
[0024][0025]
最小化上式,可适配故障特征间的类别分布,即软标签学习的优化目标为
[0026][0027]
优选地,步骤5中的目标函数如下:
[0028][0029]
式中,d表示源域与目标域有标签的样本;α1表示软标签学习的惩罚系数;λ1表示分布适配层的平衡系数。
[0030]
优选地,步骤6中的目标函数如下:
[0031][0032]
式中,α2表示伪标签学习的惩罚系数;λ2表示子域适配的平衡系数。
[0033]
本发明与现有技术相比,其显著优点:本发明提出了一种深度迁移学习的齿轮非理想故障数据生成方法。所述方法采用多核-最大均值差异、多核-局部最大均值差异度量数据集的边缘分布差异、子域分布差异;同时采用伪标签生成方法生成目标域伪标签,软标签生成方法生成软标签损失。本发明解决了针对现代大型机械设备下实际运行过程中采集
的数据存在故障样本无标签与少标签的问题,基于联合分布适配层和软标签学习的扩充方法能较好的解决机械设备标签量少的问题,其扩充生成的标签正确率较高;基于子域适配的无监督学习标签生成方法能较好的解决机械设备无标签的问题,其生成的标签正确率较高。
附图说明
[0034]
下面结合附图和具体实施方式对本发明做进一步说明。
[0035]
图1为本发明所提供的齿轮非理想故障数据生成方法的步骤流程图
[0036]
图2为本发明的基于联合分布适配和软标签学习的齿轮非理想故障数据生成流程图。
[0037]
图3为本发明的基于子域适配的齿轮非理想故障数据生成流程图。
具体实施方式
[0038]
下面结合附图和实施例对本发明作进一步描述。
[0039]
参见图1、图2,本发明的基于深度迁移学习的齿轮非理想故障数据生成方法包括如下步骤:
[0040]
s100:以一维卷积神经网络为特征提取网络,分别从带标签的源域、无标签的目标域中提取可迁移故障特征,在训练过程中两个数据集的网络参数共享;
[0041]
步骤s100中的一维卷积神经网络共有7层,其中5个卷积层,1个全连接层,1个输出层,如图3所示。卷积层和全连接层的激活函数为rule函数,输出层的为softmax函数。源域和目标域均为振动信号,其中有标签的源域为无标签的目标域为且源域远大于目标域。
[0042]
s200:以最大均值差异的变体为衡量数据分布差异的距离指标,利用多核-最大均值差异可迁移故障特征的边缘分布差异;
[0043]
步骤s200中,最大均值差异被广泛应用于度量源域与目标域的分布差异。最大均值差异的计算流程为:在同一个映射函数下将源域和目标域映射到一个再生核希尔伯特空间,然后计算两域的分布差异。最大均值差异的效果取决于核函数的选择,核函数选择不当将影响其在域适配中的应用。多核-最大均值差异可以通过调整核的权重应对实际中不同的情况,其表征能力较单一核有一定的提高。
[0044]
步骤s200中多核-最大均值差异可定义为:
[0045][0046]
式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数,取高斯核函数;
[0047]
s300:,以最大均值差异的变体为衡量数据分布差异的距离指标,利用多核-局部最大均值差异可迁移故障特征的边缘分布差异与条件分布差异;
[0048]
步骤s300中,最大均值差异被广泛应用于度量源域与目标域的分布差异。最大均值差异的计算流程为:在同一个映射函数下将源域和目标域映射到一个再生核希尔伯特空间,然后计算两域的分布差异。采用局部最大均值差异测量两域的子域分布差异。局部最大
均值差异的效果取决于核函数的选择,核函数选择不当将影响其在域适配中的应用。多核-局部最大均值差异可以通过调整核的权重应对实际中不同的情况,其表征能力较单一核有一定的提高。
[0049]
步骤s300中多核-局部最大均值差异可定义为:
[0050][0051]
式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数,取高斯核函数;p
(c)
、q
(c)
分别为源域、目标域中类别c的分布;
[0052]
s400:,软标签学习提取源域软标签,联合源域软标签、目标域标签分布预测值与目标域标签生成软标签损失;
[0053]
步骤s400中,软标签学习包含提取源域软标签与生成软标签损失两部分,源域软标签指源域中所有样本的平均标签预测值,通过公式可以获得源域的标签预测值,则源域软标签为
[0054][0055][0056]
式中,分别表示样本属于类别c的子域、子域样本数;τ表示相关类在训练过程中的影响系数。
[0057]
首先通过式(12)获得的源域软标签ys;然后根据目标域标签生成软标签最后结合目标域的标签预测值生成软标签损失,即为
[0058][0059]
最小化上式,可适配故障特征间的类别分布,即软标签学习的优化目标为
[0060][0061]
s500:建立深度迁移学习网络的目标函数,对目标函数进行迭代训练,直到目标函数值达到阈值,并利用完成训练的模型扩充生成目标域标签。
[0062]
在步骤s500中,针对齿轮上的标签问题,本发明提供了两种具体的处理方案,包括齿轮非理想故障数据少标签的问题以及齿轮非理想故障数据无标签的问题,请参考以下内容具体进行理解:
[0063]
针对齿轮非理想故障数据少标签的问题,深度迁移学习网络的目标函数由三部分组成:源域与目标域的分类损失函数、源域与目标域的分布差异及软标签损失,对目标函数进行迭代训练,直到目标函数值达到阈值,并利用完成训练的模型扩充生成目标域标签;目标函数如下:
[0064][0065]
式中,d表示源域与目标域有标签的样本;α1表示软标签学习的惩罚系数;λ1表示分布适配层的平衡系数。
[0066]
针对齿轮非理想故障数据无标签的问题,深度迁移学习网络的目标函数由两部分组成:源域与目标域的分类损失函数与子域分布差异,对目标函数进行迭代训练,直到目标函数值达到阈值,利用训练完成的模型生成目标域的标签。
[0067]
目标函数如下:
[0068][0069]
式中,α2表示伪标签学习的惩罚系数;λ2表示子域适配的平衡系数。
[0070]
步骤5与步骤6中,作为分类问题应用效果较好的损失函数,交叉熵损失函数常用于卷积神经网络,交叉熵损失函数的公式为:
[0071][0072]
式中,m表示样本数;pi表示xi的概率值向量。
[0073]
通过采用本发明提供的方案,可以解决针对现代大型机械设备下实际运行过程中采集的数据存在故障样本无标签与少标签的问题,基于联合分布适配层和软标签学习的扩充方法能较好的解决机械设备标签量少的问题,其扩充生成的标签正确率较高;基于子域适配的无监督学习标签生成方法能较好的解决机械设备无标签的问题,其生成的标签正确率较高
[0074]
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

技术特征:
1.一种齿轮非理想故障的数据生成方法,其特征在于,包括以下步骤:以一维卷积神经网络为特征分别从源域与目标域中提取可迁移故障特征,在训练过程中两个数据集的网络参数共享;以最大均值差异的变体为衡量数据分布差异的距离指标,利用多核-最大均值差异度量可迁移故障特征的边缘分布差异;以最大均值差异的变体为衡量数据分布差异的距离指标,将可迁移故障特征与伪标签输入到多核-局部最大均值差异中获得子域分布差异;软标签学习提取源域软标签,联合源域软标签、目标域标签分布预测值与目标域标签生成软标签损失;建立深度迁移学习网络的目标函数,对目标函数进行迭代训练,直到目标函数值达到阈值,并利用完成训练的模型扩充生成目标域标签,其中所述目标函数包括源域以及目标域的分类损失函数与子域分布差异。2.根据权利要求1数据生成方法,其特征在于,所述目标函数还包括源域与目标域的分类损失函数。3.根据权利要求1所述的基于深度迁移学习的齿轮非理想故障数据生成方法,其特征在于,所述源域和所述目标域均为振动信号,其中有标签的源域为无标签的目标域为且所述源域大于所述目标域。4.根据权利要求1所述的数据生成方法,其特征在于:所述多核-最大均值差异根据以下公式得出:式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数。5.如权利要求1所述的数据生成方法,其特征在于:所述多核-局部最大均值差异根据以下公式得出:式中,h表示再生核希尔伯特空间;p、q分别表示源域、目标域的分布;e()表示数学期望;f()表示映射函数;p
(c)
、q
(c)
分别为源域、目标域中类别c的分布。6.如权利要求1所述的数据生成方法,其特征在于:所述源域软标签包括源域中所有样本的平均标签预测值,所述源域软标签以及软标签通过以下公式获得:本的平均标签预测值,所述源域软标签以及软标签通过以下公式获得:通过结合目标域的标签预测值生成软标签损失,即为
最小化上式,可适配故障特征间的类别分布,即软标签学习的优化目标为7.如权利要求2所述的数据生成方法,其特征在于:所述目标函数包括以下公式:式中,d表示源域与目标域有标签的样本;α1表示软标签学习的惩罚系数;λ1表示分布适配层的平衡系数。8.如权利要求1所述的数据生成方法,其特征在于:所述目标函数包括以下公式:式中,α2表示伪标签学习的惩罚系数;λ2表示子域适配的平衡系数。

技术总结
本发明公开了一种齿轮非理想故障的数据生成方法,包括以下步骤:从源域与目标域中提取可迁移故障特征;利用多核-最大均值差异度量可迁移故障特征的边缘分布差异;将可迁移故障特征与伪标签输入到多核-局部最大均值差异中获得子域分布差异;生成软标签损失;建立深度迁移学习网络的目标函数,对目标函数进行迭代训练,直到目标函数值达到阈值,并利用完成训练的模型扩充生成目标域标签,其中所述目标函数包括源域与目标域的分类损失函数以及子域分布差异。本发明解决了现代大型机械设备下实际运行过程中采集的数据存在故障样本无标签与少标签等非理想数据问题,子域适配的无监督学习方法解决齿轮非理想故障数据无标签的问题。问题。问题。


技术研发人员:揭震国 王景霖 单添敏 曹亮
受保护的技术使用者:中国航空工业集团公司上海航空测控技术研究所
技术研发日:2023.05.25
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐