滚动轴承故障诊断方法、故障特征提取方法、设备及介质与流程

未命名 07-12 阅读:288 评论:0


1.本发明涉及滚动轴承故障诊断技术领域,更具体地,涉及一种滚动轴承故障诊断方法、故障特征提取方法、设备及介质。


背景技术:

2.随着工业系统智能化,复杂化的发展,设备的维修难度和成本也日益增加,而机械轴承故障是导致工业系统故障的最大诱因。在工业设备中,轴承故障占所有电动机故障的65~70%。因此,开发有效的轴承故障诊断技术,对于及时判断故障的发生并避免相关故障引发更大的事故,就显得十分必要。
3.然而,传统的轴承故障诊断方法难以提取细微的轴承故障特征,轴承故障诊断效果也难以达到预设的精度和效率等的要求,轴承故障诊断偏差或迟滞致使的安全事故也时有发生。


技术实现要素:

4.针对背景技术提及的现有技术的至少一个缺陷或改进需求,本发明提供了一种滚动轴承故障诊断方法、故障特征提取方法、设备及介质,用于克服传统的轴承故障诊断方法难以提取细微的轴承故障特征,轴承故障诊断效果也难以达到预设的精度和效率等的要求,轴承故障诊断偏差或迟滞致使的安全事故也时有发生的技术缺陷,提升滚动轴承故障诊断的精度和效率,进而满足目前对轴承故障诊断效果越来越苛刻的技术需求。
5.为实现上述目的,按照本发明的第一个方面,提供了一种滚动轴承故障诊断方法,包括:
6.获取滚动轴承数据集;
7.利用所述滚动轴承数据集对改进型一维卷积神经网络进行训练,以获取训练好的改进型一维卷积神经网络;
8.将待检测的滚动轴承数据集输入至训练好的改进型一维卷积神经网络,输出滚动轴承故障诊断结果;
9.其中,所述改进型一维卷积神经网络包括三层或四层卷积神经网络,其在常规型一维卷积神经网络的基础上取消了全连接层,并引入了全局均值池化层。
10.进一步地,包括:在所述改进型一维卷积神经网络的每一层卷积神经网络前向传播时,使用批量归一化优化网络结构。
11.进一步地,包括:在所述改进型一维卷积神经网络的代价函数后面添加一个正则化项,以进行l2正则化。
12.进一步地,包括:在对改进型一维卷积神经网络进行训练时,引入dropout技术。
13.进一步地,所述改进型一维卷积神经网络的激活函数为relu函数和/或tanh函数。
14.进一步地,包括:在对改进型一维卷积神经网络进行训练时,采用交叉熵损失函数和adam优化器。
15.进一步地,所述改进型一维卷积神经网络为包括三层卷积神经网络的网络结构,其具体结构为:
16.卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(32,4,2,same,l2正则化)+relu激活+池化(2,2)+全局均值池化+dropout(0.4)。
17.按照本发明的第二个方面,还提供了一种滚动轴承故障特征提取方法,包括:
18.择取预设数量的负载中的任一种负载的滚动轴承数据集训练上述任一项所述的改进型一维卷积神经网络,以获取训练好的改进型一维卷积神经网络;
19.利用该训练好的改进型一维卷积神经网络测试预设数量的负载中的其他负载的滚动轴承数据集,以获取其测试缺失数据的性能结果;
20.加载该训练好的改进型一维卷积神经网络,使用缺失数据进行再训练,以获取其对预设数量的负载的滚动轴承数据集的测试结果。
21.按照本发明的第三个方面,还提供了一种电子设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述计算机程序被所述处理单元执行时,使得所述处理单元能够执行上述任一项所述方法的步骤。
22.按照本发明的第四个方面,还提供了一种存储介质,其存储有可由访问认证设备执行的计算机程序,当所述计算机程序在访问认证设备上运行时,使得所述访问认证设备能够执行上述任一项所述方法的步骤。
23.总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
24.(1)本发明的滚动轴承故障诊断方法将常规型一维卷积神经网络进行了改进,去除了全连接层并引入了全局均值池化层,且通过大量对照实验确定了三至四层的卷积神经网络层数。通过将如此改进的一维卷积神经网络进行训练和使用,可显著提升滚动轴承故障的诊断准确率和诊断效率。
25.(2)若用常规型一维卷积神经网络来进行训练和预测诊断同样也可以实现滚动轴承故障的诊断,只是准确率和效率无法保证满足技术需求。本发明的滚动轴承故障诊断方法聚焦于对常规型一维卷积神经网络的改进,其使用批量归一化、全局均值池化主要是为了加快训练速度和识别速度,其使用l2正则化、dropout技术则主要是为了避免过拟合并提高识别的准确率。激活函数可以影响模型训练的收敛速度,其组合的选择则是通过多组对照实验确定的,最后选择的是relu和tanh激活函数的组合来作为激活函数。优化器和损失函数的选择常常决定了模型的收敛速度和效果。选择了不合适的损失函数和优化器将可能导致模型落入局部最优点,这也会使损失函数的值在局部最优点附近徘徊,而无法达到局部最优点,从而导致最终训练出的模型准确性较差。本发明通过使用交叉熵损失函数来计算当前模型的概率分布和实际分布之间的差值,从而得到损失函数值。又对目前常用的5种优化器进行了对照实验,最终选择了adam优化器。adam优化器和交叉熵损失函数的组合选择使得最终训练出的卷积神经网络模型的准确性最优。
26.(3)通过大量对照实验,最终确定的最优的改进型一维卷积神经网络的模型结构为:卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(32,4,2,same,l2正则化)+relu激活+池化(2,2)+
全局均值池化+dropout(0.4)。对其进行训练并用于滚动轴承故障诊断,其总预测正确率可高达99.6%,可满足目前绝大多数情况下对轴承故障诊断效果的技术需求。
27.(4)一个滚动轴承故障诊断方法或系统不仅应该具有实时判断滚动轴承健康状况的能力,还应该有能不断学习新数据的特征而不用重新建立模型从头训练的可持续使用性。本发明的滚动轴承故障特征提取方法通过初始模型训练得到一个改进的卷积神经网络模型之后,再选取少量数据进行再训练,从而可以极大提升模型对各负载条件下的振动信号特征的提取能力,同时也验证了改进型一维卷积神经网络模型的强学习能力。
附图说明
28.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1为本发明实施例提供的一种滚动轴承故障诊断方法的流程示意图之一;
30.图2为本发明实施例提供的一种滚动轴承故障诊断方法的流程示意图之二;
31.图3为本发明实施例提供的全连接网络(左)和使用dropout后的网络(右)的网络结构对比图;
32.图4为本发明实施例提供的a1模型的性能曲线图;
33.图5为本发明实施例提供的b1模型的性能曲线图;
34.图6为本发明实施例提供的a2模型的性能曲线图;
35.图7为本发明实施例提供的b2模型的性能曲线图;
36.图8为本发明实施例提供的a3模型的性能曲线图;
37.图9为本发明实施例提供的b3模型的性能曲线图;
38.图10为本发明实施例提供的a4模型的性能曲线图;
39.图11为本发明实施例提供的b4模型的性能曲线图;
40.图12为本发明实施例提供的引入全局均值池化前的a3模型的网络结构图;
41.图13为本发明实施例提供的引入全局均值池化后的b3模型的网络结构图;
42.图14为本发明实施例提供的改进型一维卷积神经网络模型在测试集上测试输出的混淆矩阵;
43.图15为本发明实施例提供的适于实现上文描述的方法的电子设备的方框示意图;
44.其中,在图4至11中,training loss表示训练损失,validation loss表示验证损失,training accuracy表示训练精度,validation accuracy表示验证精度,epochs表示迭代轮次;
45.在图14中,true label表示实际类别标签,predicted label accuracy表示预测类别标签识别正确率,misclass表示识别错误率。
具体实施方式
46.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要
彼此之间未构成冲突就可以相互组合。
47.本技术的术语“包括”或“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备并没有限定于已列出的步骤或单元,而是可选地还可以包括没有列出的步骤或单元,或可选地还可以包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
48.针对传统的故障诊断方法难以提取细微的故障特征,以及提取效果难以达到要求的技术问题,本发明提出了一种基于改进型一维卷积神经网络的滚动轴承故障诊断方法。其寻找最佳的卷积神经网络超参数,并利用这种最佳的超参数组合训练出可供故障诊断的网络模型用于判断故障诊断是否发生以及发生的故障种类;其对原始振动信号进行预处理并按一定比例分割,使其可以作为卷积神经网络的输入;其直接使用原始数据信号进行相关研究,并将数据经过划分后作为模型的输入可以最大限度地保持原始的数据集的相关状态特征,减少人为的影响,降低实验的不准确性。
49.训练改进型一维卷积神经网络模型的数据集使用采样频率为12khz的凯斯西储大学的轴承数据集,同时本发明基于改进的一维卷积神经网络模型来设计一个行之有效的智能诊断方法或系统,并通过对照实验来合理确定卷积神经网络的层数,同时引入全局平均池化,添加正则化和dropout模块,确定合理的优化器以及利用批量归一化等对常规型一维卷积神经网络模型的结构进行优化,研究不同的网络结构及超参数对滚动轴承故障诊断测试的影响。最后再确定一个最优的超参数组合用于滚动轴承的故障诊断。参考图1和图2,在一个实施例中,一种滚动轴承故障诊断方法的大致步骤包括:
50.步骤1、获取作为卷积神经网络输入数据的用于训练卷积神经网络的滚动轴承数据集。
51.步骤2、建立基于改进的一维卷积神经网络并利用用于训练卷积神经网络的滚动轴承数据集,训练该基于改进的一维卷积神经网络,得到训练完毕的基于改进的一维卷积神经网络。其中,改进的一维卷积神经网络优选的包括3至4层卷积神经网络。改进的一维卷积神经网络引入了全局均值池化(gap)技术,并取消了常规的一维卷积神经网络的全连接层的设置,从而优化了神经网络模型,极大剔除了由全连接层带入的需要训练的参数数量,其算法思想是对最后一层经过卷积操作输出的特征图进行取全局均值。
52.进一步地改进在于,在每一层卷积神经网络前向传播时,使用批量归一化优化网络结构。批量归一化是目前应用在深度学习中很有效的训练优化方法之一,其作用主要是将输入的数据经过处理归一化成均值为0,方差为1数据,并使之符合标准正态分布。经过批量归一化后,既保留了样本的分布特征消除了层与层之间的分布差异,也极为有效地抑制了“梯度爆炸”和“梯度消失”的发生。而且批量归一化的收敛速度非常快,泛化能力也很强。
53.进一步地改进在于,为了防止训练的模型过拟合,提高模型的有效性,在实验中,可以进行l2正则化,即在代价函数后面添加一个正则化项。l2正则化的思想是,通过将原始损失函数的值与权重参数的平方和相加,从而实现了模型权重偏好的控制,并找到了最小化原始损失函数与寻找小权重之间的平衡点。
54.为了进一步改进一维卷积神经网络的结构,可引入dropout技术。dropout技术的思想与正则化技术思想完全不同,dropout是通过修改神经元之间的连接方式,即改变网络的本身结构来达到抑制过拟合的目的。使用dropout后,在网络训练期间,梯度传播更新参
数时随机地停止一部分权重参数的更新,也可以说是使一定比例的神经元保持沉默。如图3所示,dropout通过删除一些神经元降低了模型复杂度的同时,也降低了非正常数据获得学习机会的概率,从而减弱了异常数据对模型的影响程度。但这种删除并非永久,而只是暂时的,因为dropout技术仅在对模型进行训练时发挥其作用,而在对数据集进行测试的阶段,所有设计的神经元都会继续参与测试数据等工作。
55.激活函数可以影响模型训练的收敛速度,其组合的选择则是通过多组对照实验确定的,最后选择的是relu和tanh激活函数的组合来作为激活函数。优化器和损失函数的选择常常决定了模型的收敛速度和效果。选择了不合适的损失函数和优化器将可能导致模型落入局部最优点,这也会使损失函数的值在局部最优点附近徘徊,而无法达到局部最优点,从而导致最终训练出的模型准确性较差。本发明通过使用交叉熵损失函数来计算当前模型的概率分布和实际分布之间的差值,从而得到损失函数值。又对目前常用的5种优化器进行了对照实验,最终选择了adam优化器。adam优化器和交叉熵损失函数的组合选择使得最终训练出的一维卷积神经网络模型的准确性最优。
56.步骤3、将待检测的滚动轴承数据集输入至训练完毕的基于改进的一维卷积神经网络,输出滚动轴承故障诊断结果,即输出判断故障是否发生以及发生的故障种类,从而能够采取相对应的应对措施,以减少事故发生,降低可能造成的经济损失。
57.接下来,在一个更具体的实施例中提供一个实验方案,以验证改进的一维卷积神经网络性能的优越性。实验选取四种负载条件(电机负载端的载荷分别为0hp、1hp、2hp和3hp)下,每一种负载条件均选取10种滚动轴承状态数据,每种状态数据都按相同数量相同长度选取作为实验样本。开始训练前,会选取同一种负载条件下的10种不同状态数据,每种状态数据1000条,并将每一种状态数据进行预处理,按照7:1:2的比例划分为训练集、测试集以及验证集。表1是0hp负载,12khz采样频率下,9种滚动轴承故障状态类型(10种滚动轴承状态中除9种滚动轴承故障状态类型外,还有一种滚动轴承无故障状态类型)。
58.表1滚动轴承故障数据集
[0059][0060]
对轴承的10种状态,分别取一条长度为2048的时序数据,可分别绘制振动数据波
形图。从滚动轴承状态的振动数据波形图可以看到,每种状态的轴承的振动信号均在一定幅度内呈现规律性的震荡,这也为利用cnn(卷积神经网络)进行特征提取并进行故障分类提供了可能。
[0061]
尽可能选择最合适的超参数从而确定相对最优选择的cnn模型对于网络模型的有效性、高效性和实用性意义重大。从目前的实验情况来看,较为重要的超参数主要有卷积核参数的确定、激活函数的选择、池化核参数、合适的学习率以及合适的损失函数及优化器等。本实验根据相关情况,预先设计了一个测试准确度相对较高及训练速度相对较快的3层cnn的模型作为后续相关实验的基准模型。基于该基准模型,通过控制变量法对该基准模型逐一进行不同的参数配置从而考察所研究的参数对模型性能的影响。该基准模型的结构设计如表2所示,同时该模型使用了adam优化器及交叉熵损失函数(cross-entropy loss function),学习率是自适应调整。本实验采用tensorflow2.1和python3.7,使用keras深度学习框架,计算机为联想i5 8g windows10 64位配置。
[0062]
表2cnn故障诊断的基准模型
[0063][0064]
激活函数对于cnn的网络训练影响很大,合理运用激活函数可以极大增强模型对非线性的难以直观地察觉规律的复杂环境的良好表达能力,从而增强模型的有效性和实用性。同时,激活函数通常根据经验进行设置,但这种方法不确定性较大。所以需要设计对照实验研究每种激活函数在cnn中的性能表现情况。
[0065]
本实验根据表2的初始化网络模型,同时继续使用了交叉熵损失函数和adam自适应优化器作为本模型的超参数,并评估对比了cnn算法中最常见的三种激活函数在本实验中的表现效果。实验结果如表3所示,通过对比实验3、6和7可以得知,relu激活函数在卷积层上的表现最好。在准确率方面,实验3的所有卷积层和全连接层分别使用relu和tanh激活函数时,训练的准确率是最高的。而在运行时间方面,卷积层和全连接层均使用relu激活函数时,其训练耗时最短。综合以上分析,本文在后续的相关实验中会依情况综合使用relu函数和tanh函数作为相关结构的激活函数。
[0066]
表3不同配置的激活函数性能
[0067][0068]
由于cnn的模型结构对准确率和运行效率有显著影响,所以本实验为了考察层数不同的cnn对实验结果的影响,设计了如表4所示组别的模型结构及超参数。图4至图11为八种cnn模型(a1~a4为包括一至四层的普通型卷积神经网络模型,b1~b4为包括一至四层的经优化后的改进型卷积神经网络模型)的性能曲线图。
[0069]
表4不同结构cnn超参数
[0070]
[0071][0072]
表5为八种cnn模型的测试结果。
[0073]
表5不同结构的cnn测试准确率
[0074][0075]
从表5中可以明显观察到,使用相关的优化技术进行训练后,a3、b3两种模型在两个类别中的准确率都较高,尤其是使用优化技术后的b3模型的准确率达到了98%以上,同时通过对比分析也很容易发现运用优化技术可以抑制发生过拟合的问题。1层cnn的网络结构简单,虽然普通训练的训练集正确率很高,但测试集准确度只有53.9%,出现了明显的过拟合;而使用了优化技术进行改进训练后,正确率得到了明显的提升,但由于cnn层数太低,导致特征提取能力不足,测试集正确率仅有83.1%;而使用了4层的cnn模型反而不如使用了3层cnn的模型的测试准确度高,其原因在于本实验的滚动轴承的数据样本量不足,导致了深层网络结构极易出现过拟合和梯度消失的问题。综合来看使用了正则化以及dropout后,测试模型均极大地抑制了过拟合的发生,较为明显地提高了模型的准确度和泛化性。
[0076]
前面提到通过引入全局均值池化可以代替全连接层,降低了训练卷积神经网络时需要训练的参数,提高了模型的效率,现参考a3和b3模型的模型结构图图12和图13来考察一下这两种cnn模型的结构及参数量。
[0077]
从图12和图13可以看到,两个模型的不同之处在最后三层,a3模型没有引入全局均值池化,而b3模型引入了全局均值池化,可以看出,引入全局均值池化后,输出层的参数量大大减少了。
[0078]
表6展示了a3和b3两种模型的训练参数表。
[0079]
表6a3和b3两种模型的训练参数表
[0080][0081]
从表6可以看到,引入全局均值池化后的b3模型比未引入全局均值池化的a3模型减少了多达92.99%的参与训练的参数量,这可以显著降低网络训练的耗时,简化了网络结构,提高了模型的训练效率。
[0082]
在构建神经网络模型进行深度学习时,选择合适的优化器(optimizer)极为重要,因为这关系到模型训练时的收敛速度以及是否能取得相对最高的准确率。在模型训练期间,优化器主要通过计算和更新模型的网络参数来连续地优化损失函数的值,从而使模型达到全局最优点。在实际应用中,cnn训练的目标一般都是让网络的损失函数达到最小值,目前常用的损失函数主要有交叉熵损失函数、均方误差函数以及负对数似然函数。
[0083]
优化器和损失函数的选择常常决定了模型的收敛速度和效果。选择了不合适的损失函数和优化器将可能导致模型落入局部最优点,这也会使损失函数的值在局部最优点附近徘徊,而无法达到局部最优点,从而导致最终训练出的模型准确性较差。本实验通过使用交叉熵损失函数来计算当前模型的概率分布和实际分布之间的差值,从而得到损失函数值。
[0084]
目前最常用的优化器主要有sgd、adagrad、adadelta、rmsprop和adam这5种,本实验接下来对这5种优化器进行测试。在该测试中继续使用表2中的基准模型,并且卷积层的激活函数选择relu函数,并用全局均值池化代替全连接层以加快训练速度。优化器对比数据如表7所示。
[0085]
表7优化器的对比数据
[0086][0087]
由表7可以看出,adam自适应优化器和rmsprop优化器比其他优化器的性能更好。在训练的准确度方面,adam和rmsprop表现相当,都有极高的正确率,但是adam的训练速度略快于rmsprop。由于测试优化器性能实验均使用的轴承故障数据是在1hp(1772r/min)下采集得到的,为了进一步对比两种优化器的性能,本文进一步设计了实验,保存应用了adam(自适应动量)优化器和rmsprop(均方根传播)优化器的两种cnn模型。这两种模型除了优化器不同外,其余所有超参数及网络结构均相同,初始训练使用的是1hp下采集的10种滚动轴承状态数据集。然后加载两个模型,分别评估这两种模型对四种不同负载条件下的故障数据的测试情况,观察使用两种优化器得到的cnn模型在缺失数据时的泛化性能。数据集0hp
表示在负载为0hp时采集到的10种滚动轴承的状态数据集,以此类推。
[0088]
表8两种优化器在不同负载的数据集上的测试情况
[0089][0090]
在表8所示的实验中,初始训练两种模型的数据集使用的都是1hp下采集的轴承振动信号数据。每种数据集均随机选取了5000条数据,每条数据长度均为2048,总计20000条数据并同时输入到两种模型中用于测试。从该表8中可以明显看到,使用adam优化器的模型在各数据集上的测试效果均优于使用rmsprop优化器的模型,同时也可以发现,adam的自适应能力更强,对缺失故障数据的诊断能力明显强于rmsprop,而且使用adam优化器的模型进行测试诊断时运行时间更快。综上,优化器选择adam是相对最优的。自适应矩估计(adaptive moment estimation,adam)优化算法是一种主要基于梯度下降的优化方式,其同时更为充分地利用梯度一阶矩和二阶矩估计不断调整学习率从而进行网络参数的更新。adam算法在每次参数迭代更新时,其学习步长都有一个确定的范围,因此可以保证模型优化过程中的鲁棒性。
[0091]
根据以上实验,最终确立的最优的改进型cnn滚动轴承故障智能诊断模型,其结构如下:卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(32,4,2,same,l2正则化)+relu激活+池化(2,2)+全局均值池化+dropout(0.4)。通过使用多分类混淆矩阵可以量化和可视化每种故障类型的类别和数量(或比例)。为了对改进cnn的准确性进行更有效的评估,下面引入多分类混淆矩阵对模型进行更精确地评估。图14是改进的1dcnn模型在测试集上测试输出的混淆矩阵。图14中的多类混淆矩阵的横坐标轴表示轴承状况的预测类别标签,而纵坐标轴表示轴承状况的实际类别标签,矩阵中的数值代表比例。轴承的故障状态类型总共有10种。从图14中可以看出仅有2%的第0类故障和2%的第1类故障被预测成第2类故障。而另外八种故障的识别率都在100%,总预测正确率(识别精度)高达99.6%。实验结果表明本实施例所提出的改进cnn模型具有很好的识别能力,具有较高的诊断精度,也说明该模型能够准确监测诊断轴承的健康状况。
[0092]
现在继续加深对泛化性以及学习新数据能力的研究。故障特征提取的实验方法为:首先,选用四种负载(0hp、1hp、2hp和3hp)下的其中一种负载的数据集用于训练从而得到一个训练好的改进cnn模型。然后,用该训练好的模型测试其他负载条件下的数据集的振动信号数据,考察其测试缺失数据的性能表现。最后,加载该cnn模型,使用少量缺失数据进行再训练,再考察其对四种负载条件下的振动信号数据的测试表现。
[0093]
再训练时,每种负载条件下2000条数据,每种轴承状态类别为200条数据,其中70%为训练集,20%为验证集。而在绘制混淆矩阵式时,加载再训练后的模型,每种负载条件下选取5000条测试数据,进行精度测试,实验结果如表9所示。表9是测试各负载条件下的振动数据准确率情况表。从表9中可以看到,改进后的cnn,在测试原负载条件下的数据集时,正确率极高,几乎达到了100%的正确率,而在缺失数据时的表现也很好,总测试的平均精确率也达到了88.69%。而对模型进行再训练后,在四种负载条件下的平均准确率达到了96.59%,对负载2hp和3hp下的数据集测试的准确率都有明显的提升。
[0094]
表9再训练前后不同负载准确率性能表
[0095][0096]
故障特征提取的实验主要测试的是改进后的cnn的学习能力,因为一个诊断系统不仅应该具有实时判断滚动轴承健康状况的能力,还应该有能不断学习新数据的特征而不用重新建立模型从头训练的可持续使用性。从本部分安排的实验来看,通过初始模型训练得到一个改进的cnn模型之后,再选取少量数据进行再训练,可以极大提升模型对各负载条件下的振动信号特征的提取能力。这虽然也是因为扩大了训练集,但是也证明了改进的模型具有很强的学习能力。
[0097]
基于改进的一维卷积神经网络的滚动轴承的故障诊断算法是一种针对滚动轴承的细微故障的智能监控而提出的方法。一维卷积神经网络是一种“端到端”的诊断方法,它能够直接处理原始的振动信号数据并提取相邻时间点之间的信息特征,无需对原始数据进行任何手动提取特征和信号处理的操作,大大节省了手工提取特征的时间开销。它可以摆脱传统方法对手工提取特征的依赖,并且可以极大克服依靠专家经验的传统方法之局限性。通过进行多组对比实验,详细分析了不同卷积神经网络层数对模型性能影响,从而确定相对最佳的cnn层数,同时对比了引入全局均值池化前后对网络结构的影响,证明了引入全局均值池化可以减少网络训练的参数从而大大加快模型的训练速度。另外合理设置对照实验,分析不同激活函数对模型训练的影响,确定了最佳的激活函数组合。以及通过使用交叉熵损失函数,并测试五种优化器对模型的精度以及泛化性能,从而确定了最佳的优化器。最后通过将该算法应用于滚动轴承数据集进行故障诊断可以验证该方法的准确性与高效性,同时该改进的卷积神经网络模型具有很强的学习能力,在实际工业生产中具有较强的实用性。
[0098]
图15示意性示出了根据本发明的实施例的适于实现上文描述的方法的电子设备的方框图。图15示出的电子设备仅仅是一个示例,不应对本发明的实施例的功能和使用范围带来任何限制。
[0099]
如图15所示,本实施例中所描述的电子设备1000,包括:处理器1001,其可以根据存储在只读存储器(rom)1002中的程序或者从存储部分1008加载到随机访问存储器(ram)
1003中的程序而执行各种适当的动作和处理。处理器1001例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器1001还可以包括用于缓存用途的板载存储器。处理器1001可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0100]
在ram 1003中,存储有系统1000操作所需的各种程序和数据。处理器1001、rom 1002以及ram 1003通过总线1004彼此相连。处理器1001通过执行rom 1002和/或ram 1003中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 1002和ram 1003以外的一个或多个存储器中。处理器1001也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0101]
根据本公开的实施例,电子设备1000还可以包括输入/输出(i/o)接口1005,输入/输出(i/o)接口1005也连接至总线1004。系统1000还可以包括连接至i/o接口1005的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至i/o接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
[0102]
根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被处理器1001执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0103]
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0104]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 1002和/或ram 1003以外的一个或多个存储器。
[0105]
需要说明的是,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术
做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来。
[0106]
附图中的流程图或框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。还要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0107]
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别的,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本公开的范围。
[0108]
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

技术特征:
1.一种滚动轴承故障诊断方法,其特征在于,包括:获取滚动轴承数据集;利用所述滚动轴承数据集对改进型一维卷积神经网络进行训练,以获取训练好的改进型一维卷积神经网络;将待检测的滚动轴承数据集输入至训练好的改进型一维卷积神经网络,输出滚动轴承故障诊断结果;其中,所述改进型一维卷积神经网络包括三层或四层卷积神经网络,其在常规型一维卷积神经网络的基础上取消了全连接层,并引入了全局均值池化层。2.如权利要求1所述的滚动轴承故障诊断方法,其特征在于,包括:在所述改进型一维卷积神经网络的每一层卷积神经网络前向传播时,使用批量归一化优化网络结构。3.如权利要求2所述的滚动轴承故障诊断方法,其特征在于,包括:在所述改进型一维卷积神经网络的代价函数后面添加一个正则化项,以进行l2正则化。4.如权利要求3所述的滚动轴承故障诊断方法,其特征在于,包括:在对改进型一维卷积神经网络进行训练时,引入dropout技术。5.如权利要求4所述的滚动轴承故障诊断方法,其特征在于,所述改进型一维卷积神经网络的激活函数为relu函数和/或tanh函数。6.如权利要求5所述的滚动轴承故障诊断方法,其特征在于,包括:在对改进型一维卷积神经网络进行训练时,采用交叉熵损失函数和adam优化器。7.如权利要求6所述的滚动轴承故障诊断方法,其特征在于,所述改进型一维卷积神经网络为包括三层卷积神经网络的网络结构,其具体结构为:卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(64,8,4,same,l2正则化)+relu激活+池化(2,2,valid)+卷积(32,4,2,same,l2正则化)+relu激活+池化(2,2)+全局均值池化+dropout(0.4)。8.一种滚动轴承故障特征提取方法,其特征在于,包括:择取预设数量的负载中的任一种负载的滚动轴承数据集训练权利要求1至7任一项所述的改进型一维卷积神经网络,以获取训练好的改进型一维卷积神经网络;利用该训练好的改进型一维卷积神经网络测试预设数量的负载中的其他负载的滚动轴承数据集,以获取其测试缺失数据的性能结果;加载该训练好的改进型一维卷积神经网络,使用缺失数据进行再训练,以获取其对预设数量的负载的滚动轴承数据集的测试结果。9.一种电子设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述计算机程序被所述处理单元执行时,使得所述处理单元能够执行权利要求1至7任一项所述方法的步骤。10.一种存储介质,其特征在于,其存储有可由访问认证设备执行的计算机程序,当所述计算机程序在访问认证设备上运行时,使得所述访问认证设备能够执行权利要求1至7任一项所述方法的步骤。

技术总结
本发明公开了一种滚动轴承故障诊断方法,包括:获取滚动轴承数据集;利用滚动轴承数据集对改进型一维卷积神经网络进行训练,以获取训练好的改进型一维卷积神经网络;将待检测的滚动轴承数据集输入至训练好的改进型一维卷积神经网络,输出滚动轴承故障诊断结果;其中,改进型一维卷积神经网络包括三或四层卷积神经网络,其在常规型一维卷积神经网络的基础上取消了全连接层,并引入了全局均值池化层。本发明将常规型一维卷积神经网络进行了改进,去除了全连接层并引入了全局均值池化层,且通过大量对照实验确定了三至四层的卷积神经网络层数。通过将如此改进的一维卷积神经网络进行训练和使用,可显著提升滚动轴承故障的诊断准确率和诊断效率。确率和诊断效率。确率和诊断效率。


技术研发人员:程家乐 黄晓艳 江露
受保护的技术使用者:武汉虹信技术服务有限责任公司
技术研发日:2023.03.15
技术公布日:2023/7/7
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐