动设备故障诊断方法、装置、客户端及服务器与流程

未命名 10-18 阅读：140 评论：0

1.本技术涉及故障诊断技术领域，特别涉及一种动设备故障诊断方法、装置、客户端及服务器。

背景技术：

2.工业智能是人工智能与工业场景、机理、知识深度融合发展而成，实现模仿或超越人类感知、分析、决策等能力的技术，其中工业生产关键设备作为生产的驱动力，其智能化水平日益提高。而随着在线监测设备的普及，工业领域已经积累了大量的在线监测数据，但对这些数据的使用只停留于阈值报警层面。目前基于所采集的振动数据，已经提出了许多基于深度学习、知识图谱与自动化机器学习算法的旋转机械故障诊断方法，如卷积神经网络、长短时记忆网络等，利用这些监测数据进行实时智能的故障诊断。
3.而旋转机械设备故障诊断的目的在于故障劣化前对其及时进行检测、识别和定位，对于确保旋转机械设备的安全可靠运行至关重要，但是大多数基于人工智能的旋转机械故障诊断方法需要为每台机器训练一个独立的模型，并且泛化能力较差，无法处理设备间因结构和工作条件的不同引起的数据分布不同。
4.相关技术中，将迁移学习和领域自适应引入故障诊断领域，但现有迁移学习方法只能处理转速和负载等工况的变化；当应用于多台机器的故障诊断时，迁移学习和领域自适应等方法需要大量故障数据和完整的故障类型来支持训练过程，实际在工业应用中无法满足其条件。

技术实现要素：

5.本技术提供一种动设备故障诊断方法、装置、客户端及服务器，以解决相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。
6.本技术第一方面实施例提供一种动设备故障诊断方法，所述方法应用于客户端，所述客户端包括第一模型，其中，所述方法包括以下步骤：获取第一数据集和第一公开验证集；利用所述第一数据集和所述第一公开验证集对所述第一模型进行训练，挖掘所述第一公开验证集的第一难样本，上传所述第一难样本和第一预测值至服务端，并接收所述服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。
7.可选地，所述挖掘所述第一公开验证集的第一难样本，包括：获取所述第一在公开验证集上的第一预测值和第一真实标签；遍历所述第一在公开验证集的所有样本，若所述第一预测值和第一真实标签的差值大于第一阈值，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到所述第一难样本。
8.可选地，所述第一难样本包括多个特征图，所述上传所述第一难样本和所述第一预测值至服务端，包括：从所述第一难样本中选择满足第一预设条件的特征图；量化压缩满
足第一预设条件的特征图，得到第一压缩特征图，上传所述第一压缩特征图和所述第一预测值至服务端。
9.本技术第二方面实施例提供一种动设备故障诊断方法，所述方法应用于服务端，所述服务端包括第二模型，其中，所述方法包括以下步骤：获取第二数据集和第二公开验证集；利用所述第二数据集和所述第二公开验证集对所述第二模型进行训练，挖掘所述第二公开验证集的第二难样本，下发所述第二难样本和第二预测值至任意客户端，并接收所述任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本；基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。。
10.可选地，所述挖掘所述第二公开验证集的第二难样本，包括：获取所述第二在公开验证集上的第二预测值和第二真实标签；遍历所述第二在公开验证集的所有样本，若所述第二预测值和第二真实标签的差值大于第二阈值，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到所述第二难样本。
11.可选地，所述第二难样本包括多个特征图，所述下发所述第二难样本和第二预测值至任意客户端，包括：从所述第二难样本中选择满足第二预设条件的特征图；量化压缩满足第二预设条件的特征图，得到第二压缩特征图，下发所述第二压缩特征图和所述第二预测值至任意客户端。
12.本技术第三方面实施例提供一种动设备故障诊断装置，所述装置应用于客户端，所述客户端包括第一模型，其中，所述装置包括：第一获取模块，用于获取第一数据集和第一公开验证集；第一训练模块，用于利用所述第一数据集和所述第一公开验证集对所述第一模型进行训练，挖掘所述第一公开验证集的第一难样本，上传所述第一难样本和第一预测值至服务端，并接收所述服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；第一蒸馏模块，用于基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。
13.本技术第四方面实施例提供一种动设备故障诊断装置，所述装置应用于服务端，所述服务端包括第二模型，其中，所述装置包括：第二获取模块，用于获取第二数据集和第二公开验证集；第二训练模块，用于利用所述第二数据集和所述第二公开验证集对所述第二模型进行训练，挖掘所述第二公开验证集的第二难样本，下发所述第二难样本和第二预测值至任意客户端，并接收所述任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本；第二蒸馏模块，用于基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。
14.本技术第五方面实施例提供一种客户端，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如上述实施例所述的动设备故障诊断方法。
15.本技术第六方面实施例提供一种服务端，存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如上述实施例所述的动设备故障诊断方法。
16.由此，本技术至少具有如下有益效果：
17.本技术实施例可以将联合学习与知识蒸馏相结合，基于联合知识蒸馏的动设备故障诊断难样本双向挖掘方法，在动设备故障诊断联合双向知识蒸馏过程中，通过先选择服务端/客户端难样本，确定难样本索引，再压缩上传相应的特征图的方式，能够极大地节省通信开销，提升通信效率，避免“坏知识”传播，提升模型整体性能，既保护了数据隐私，节省了成本，同时也支持模型异构。
18.本技术附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到。
附图说明
19.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
20.图1为根据本技术一个实施例提供的动设备故障诊断方法的流程图；
21.图2为根据本技术另一个实施例提供的动设备故障诊断方法的流程图；
22.图3为根据本技术实施例提供的基于联合知识蒸馏的动设备故障诊断难样本双向挖掘方法的流程图；
23.图4为根据本技术实施例提供的动设备故障诊断联合知识蒸馏框架图；
24.图5为根据本技术一个实施例提供的动设备故障诊断装置的示例图；
25.图6为根据本技术另一个实施例提供的动设备故障诊断装置的示例图；
26.图7为根据本技术实施例的客户端的结构示意图；
27.图8为根据本技术实施例的服务端的结构示意图。
具体实施方式
28.下面详细描述本技术的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本技术，而不能理解为对本技术的限制。
29.由于恶劣的工作环境和长时间运行，工业生产关键设备故障导致的重大事故愈发受到社会的深切关注，特别是在石化、能源等领域，因设备故障造成的安全事故频繁发生。而旋转机械设备，如汽轮机、风机、泵机等是工业生产中的关键设备，如果发生设备故障将可能导致机组意外停机，从而导致较高的运行和维护成本，甚至可能造成巨大的经济损失和人员安全事故。旋转机械设备故障诊断的目的在于故障劣化前对其及时进行检测、识别和定位，对于确保旋转机械设备的安全可靠运行至关重要。
30.但大多数基于人工智能的旋转机械故障诊断方法需要为每台机器训练一个独立的模型，并且泛化能力较差，无法处理设备间因结构和工作条件的不同引起的数据分布不同。针对这一问题，将迁移学习和领域自适应引入故障诊断领域。然而，现有的大多数迁移学习方法只能处理转速和负载等工况的变化；当应用于多台机器的故障诊断时，这些方法仍然需要大量的故障数据和完整的故障类型来支持训练过程，这在实际的工业应用中是无法满足的。
31.为解决单一设备故障样本较少，本地模型性能较差，无法实现多设备多故障诊断
的问题，因而考虑联合学习的方式，联合学习能够从分散的数据中学习故障诊断模型，同时保证隐私数据不出本地。但在旋转机械设备故障诊断的场景下，传统的联合学习无法满足设备、数据异构、模型异构场景，为所有参与方训练相同的模型无法起到理想的效果。与此同时，由于参与方算力有限，各个参与方训练一个大模型也是不切实际的，而且频繁的上传下载模型参数，通信开销大也影响普通联合学习的效率。如何协调计算资源，更好地利用服务端的算力与知识，减少通信开销是旋转机械设备故障诊断亟待解决的问题。
32.而联合知识蒸馏能够很好地解决以上问题，将联合学习与知识蒸馏相结合，保护了数据隐私，节省了通信成本，同时支持模型异构。但是，如果直接采用传统知识蒸馏的方式，容易出现“坏知识”传播的现象。如何精确地选择知识，进行难样本挖掘，是亟待解决的问题。
33.下面参考附图描述本技术实施例的动设备故障诊断方法、装置、客户端及服务器。具体而言，图1为本技术实施例所提供的一种动设备故障诊断方法的流程示意图。
34.如图1所示，该动设备故障诊断方法，方法应用于设置于任意参与方的客户端，客户端包括第一模型，其中，该方法包括以下步骤：
35.在步骤s101中，获取第一数据集和第一公开验证集。
36.其中，第一数据集可以是每个客户端内部的本地私有数据集，第一公开验证集是从每个参与方客户端收集一部分数据，共同组成的数据集，在此不做具体限定。
37.可以理解的是，本技术实施例从客户端内部获取第一数据集和第一公开验证集，以便于后续对第一模型进行训练。
38.在步骤s102中，利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，上传第一难样本和第一预测值至服务端，并接收服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本。
39.其中，第一模型可以是每个客户端内部的小模型，在此不做具体限定。
40.其中，第二模型可以是服务端的大模型，在此不做具体限定。
41.其中，第一难样本包括多个特征图，是指从客户端传输至服务端的特征图，在此不做具体限定。
42.其中，第二难样本包括多个特征图，是指从服务端传输至客户端的特征图，在此不做具体限定。
43.其中，第一预测值可以是客户端在公开验证集上的预测值，可根据实际情况进行预测，在此不做具体限定。
44.其中，第二预测值可以是/服务端在公开验证集上的预测值，可根据实际情况进行预测，在此不做具体限定。
45.可以理解的是，本技术实施例利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，并上传第一难样本和第一预测值至服务端，客户端也接收来自服务端在训练第二模型中的第二预测值和挖掘的第二难样本，使得客户端与服务端之间传输预测值与特征图，以便于后续对其采用联合双向知识蒸馏进行训练。
46.在本技术实施例中，挖掘第一公开验证集的第一难样本，包括：获取第一在公开验证集上的第一预测值和第一真实标签；遍历第一在公开验证集的所有样本，若第一预测值和第一真实标签的差值大于第一阈值，则对应样本的索引添加到难样本索引集合中，直到
遍历完成，得到第一难样本。
47.其中，第一真实标签可以是客户端在公开验证集上的真实标签，在此不做具体限定。
48.其中，第一阈值可以是用户事先设定的阈值，例如：阈值δ，可根据实际情况进行修改或调整，在此不做具体限定。
49.可以理解的是，本技术实施例通过获取第一在公开验证集上的第一预测值和第一真实标签，遍历所有公开验证集的样本，如果第一预测值和第一真实标签的差距大于设定阈值，则将该样本的索引添加到难样本索引集合中，直至遍历完成，得到第一难样本，基于预测值与标签的差距大于设定阈值的情况下，进行难样本挖掘，以便于后续进行联合双向知识蒸馏。
50.在本技术实施例中，上传第一难样本和第一预测值至服务端，包括：从第一难样本中选择满足第一预设条件的特征图；量化压缩满足第一预设条件的特征图，得到第一压缩特征图，上传第一压缩特征图和第一预测值至服务端。
51.其中，第一预设条件可以是客户端满足索引在难样本索引中的样本对应的特征图，在此不做具体限定。
52.其中，第一压缩特征图可以是将客户端满足条件的特征图进行量化压缩得到的，在此不做具体限定。
53.可以理解的是，本技术实施例从第一难样本中选择满足第一预设条件的特征图，量化压缩满足条件的特征图，得到第一压缩特征图，保证性能的同时，将通讯成本降低，并上传第一压缩特征图和第一预测值至服务端，以便于后续对其进行联合双向知识蒸馏训练。
54.在步骤s103中，基于预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，利用联合学习模型诊断任意参与方的动设备故障。
55.其中，本技术实施例的参与方均以工厂为例，在此不做具体限定。
56.可以理解的是，本技术实施例基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。
57.具体而言，基于预测值与难样本进行联合双向知识蒸馏的具体过程如下：对于工厂(即客户端)：首先，使用本地私有数据集对本地模型进行训练。然后，使用服务端传输过来的预测值和选择后特征图对在公开验证集上对本地模型进行知识蒸馏训练；进一步地，使用本地模型在公开验证集上预测获得预测值与特征图，根据服务端所需的难样本索引，对得到的特征图进行选择，并进行量化压缩减少选择后特征图的大小；然后根据本地模型在公开验证集上的预测值，获取该工厂所需的难样本索引；最后，将压缩的选择后特征图、预测值以及该工厂所需的难样本索引统一传输到服务端。
58.根据本技术实施例提出的动设备故障诊断方法，获取第一数据集和第一公开验证集，并利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，并上传第一难样本和第一预测值至服务端，客户端也接收来自服务端在训练第
二模型中的第二预测值和挖掘的第二难样本，使得客户端与服务端之间传输预测值与特征图，基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。由此，解决了相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。
59.其次参照附图描述根据本技术实施例提出的动设备故障诊断方法。
60.图2是本技术实施例的动设备故障诊断方法的流程图。
61.如图2所示，该动设备故障诊断方法，方法应用于服务端，服务端包括第二模型，其中，该方法包括以下步骤：
62.在步骤s201中，获取第二数据集和第二公开验证集。
63.其中，第二数据集包括多类故障(轴系、轴承、齿轮箱等故障)、大量的公开数据组成的公开数据集，如：从网上公开获取的大学及科研机构的故障模拟实验数据，在此不做具体限定。
64.其中，第二公开验证集包括与客户端工厂共同构建的公开验证集，从每个参与方工厂收集一部分数据，共同组成的数据集，在此不做具体限定。
65.可以理解的是，本技术实施例从服务端获取第二数据集和第二公开验证集，以便于后续对第二模型进行训练。
66.在步骤s202中，利用第二数据集和第二公开验证集对第二模型进行训练，挖掘第二公开验证集的第二难样本，下发第二难样本和第二预测值至任意客户端，并接收任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本。
67.可以理解的是，本技术实施例利用第二数据集和第二公开验证集对第二模型进行训练，并挖掘第二公开验证集的第二难样本，下发第二难样本和第二预测值至任意客户端，并接收来自任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本，使得客户端与服务端之间传输预测值与特征图，以便于后续对其采用联合双向知识蒸馏进行训练。
68.在本技术实施例中，挖掘第二公开验证集的第二难样本，包括：获取第二在公开验证集上的第二预测值和第二真实标签；遍历第二在公开验证集的所有样本，若第二预测值和第二真实标签的差值大于第二阈值，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到第二难样本。
69.其中，第二真实标签可以是服务端在公开验证集上的真实标签，在此不做具体限定。
70.其中，第二阈值可以是用户事先设定的阈值，例如：阈值δ，可根据实际情况进行修改或调整，在此不做具体限定。
71.可以理解的是，本技术实施例通过获取第二在公开验证集上的第二预测值和第二真实标签，遍历第二在公开验证集的所有样本，第二预测值和第二真实标签的差值大于设定阈值时，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到第二难样本，基于预测值与标签的差距大于设定阈值的情况下，进行难样本挖掘，以便于后续进行联合双向知识蒸馏。
72.在本技术实施例中，第二难样本包括多个特征图，下发第二难样本和第二预测值
至任意客户端，包括：从第二难样本中选择满足第二预设条件的特征图；量化压缩满足第二预设条件的特征图，得到第二压缩特征图，下发第二压缩特征图和第二预测值至任意客户端。
73.其中，第二预设条件可以是服务端满足索引在难样本索引中的样本对应的特征图，在此不做具体限定。
74.其中，第二压缩特征图可以是将服务端满足条件的特征图进行量化压缩得到的，在此不做具体限定。
75.可以理解的是，本技术实施例从第二难样本中选择满足第二预设条件的特征图，量化压缩满足条件的特征图，得到第二压缩特征图，保证性能的同时，将通讯成本降低，并下发第二压缩特征图和第二预测值至服务端，以便于后续对其进行联合双向知识蒸馏训练。
76.在步骤s203中，基于预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，利用联合学习模型诊断任意参与方的动设备故障。
77.可以理解的是，本技术实施例基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。
78.具体而言，基于预测值与难样本进行联合双向知识蒸馏的具体过程如下：
79.对于服务端：首先，获取所有工厂客户端传输的预测值和选择后特征图，并对预测值和选择后特征图进行平均聚合；然后，预测值和选择后特征图对在公开验证集上对服务端模型进行知识蒸馏训练；进一步地，使用服务端模型在公开验证集上预测获得预测值与特征图，根据各个工厂所需的难样本索引，对得到的特征图进行选择，并进行量化压缩减少选择后特征图的大小；再次，根据服务端模型在公开验证集上的预测值，获取服务端所需的难样本索引。最后，将压缩的选择后特征图、预测值以及服务端所需的难样本索引分别传输到各个工厂客户端。
80.根据本技术实施例提出的动设备故障诊断方法，获取第二数据集和第二公开验证集，并利用第二数据集和第二公开验证集对第一模型进行训练，挖掘第二公开验证集的第一难样本，并下发第二难样本和第二预测值至客户端，服务端也接收来自客户端在训练第一模型中的第一预测值和挖掘的第一难样本，使得客户端与服务端之间传输预测值与特征图，基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。由此，解决了相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。
81.下面将结合图3和图4对动设备故障诊断方法进行详细阐述，具体如下：
82.(1)以工厂为参与方，一个平台运营方作为联合学习服务端，构建设备故障诊断大模型联合学习框架。
83.1)服务端拥有大模型，数据集包括多类故障、大量的公开数据组成的公开数据集，以及所有客户端工厂共同构建的公开验证集。服务端使用公开数据集预训练服务端大模
型。多类故障包括轴系、轴承、齿轮箱等故障。
84.其中，公开数据集是指从网上公开获取的大学及科研机构的故障模拟实验数据；公开验证集是从每个参与方工厂收集一部分数据，共同组成的数据集。
85.2)在每个工厂内部，拥有自己的小模型，数据集包括本地私有数据集和公开验证集，工厂之间支持模型异构，可以诊断1到2类设备的故障。工厂在本地私有数据集上进行模型训练。
86.3)服务端与各工厂之间传输预测值与特征图，采用双向联合知识蒸馏的方式进行训练，直至联合学习模型收敛，具体地：
87.对于工厂(即客户端)：首先，使用本地私有数据集对本地模型进行训练。然后，使用服务端传输过来的预测值和选择后特征图对在公开验证集上对本地模型进行知识蒸馏训练；进一步地，使用本地模型在公开验证集上预测获得预测值与特征图，根据服务端所需的难样本索引，对得到的特征图进行选择，并进行量化压缩减少选择后特征图的大小；然后根据本地模型在公开验证集上的预测值，获取该工厂所需的难样本索引；最后，将压缩的选择后特征图、预测值以及该工厂所需的难样本索引统一传输到服务端。
88.对于服务端：首先，获取所有工厂客户端传输的预测值和选择后特征图，并对预测值和选择后特征图进行平均聚合；然后，预测值和选择后特征图对在公开验证集上对服务端模型进行知识蒸馏训练；进一步地，使用服务端模型在公开验证集上预测获得预测值与特征图，根据各个工厂所需的难样本索引，对得到的特征图进行选择，并进行量化压缩减少选择后特征图的大小；再次，根据服务端模型在公开验证集上的预测值，获取服务端所需的难样本索引。最后，将压缩的选择后特征图、预测值以及服务端所需的难样本索引分别传输到各个工厂客户端。
89.(2)在通讯方面，由于传输特征图需要极大的通信开销，根据难样本选择特征图进行上传，并进一步对选择后的特征图进行量化压缩，保证性能的同时，将通讯成本降低7～10倍。
90.而工厂/服务端所需的难样本索引获取过程如下：
91.1)获取工厂/服务端在公开验证集上的预测值和真实标签；
92.2)遍历所有公开验证集的样本，如果预测值和真实标签的差距大于阈值δ，则将该样本的索引添加到难样本索引集合中；
93.其中，服务端与各工厂之间传输预测值与特征图是指：通过难样本索引的样本对应的特征图进行传输，而预测值则是直接上传。
94.3)完成样本遍历，得到的难样本索引集合即为工厂/服务端所需的难样本索引。
95.其中，对特征图的选择是指：保留索引在难样本索引中的样本对应的特征图，将不在难样本索引中的样本对应的特征图丢弃。
96.总体而言，通过本技术提供的一种基于联合知识蒸馏的动设备故障诊断难样本双向挖掘方法，在动设备故障诊断联合双向知识蒸馏过程中，通过先选择服务端/客户端难样本，确定难样本索引，再压缩上传相应的特征图的方式，能够极大地节省通信开销，避免“坏知识”传播，提升模型整体性能。
97.其次参照附图描述根据本技术实施例提出的动设备故障诊断装置。
98.图5是本技术实施例的动设备故障诊断装置的方框示意图。
99.如图5所示，该动设备故障诊断装置10，装置应用于设置于任意参与方的客户端，客户端包括第一模型，其中，该装置包括：第一获取模块110、第一训练模块120和第一蒸馏模块130。
100.其中，第一获取模块110用于获取第一数据集和第一公开验证集；第一训练模块120用于利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，上传第一难样本和第一预测值至服务端，并接收服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；第一蒸馏模块130用于基于预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，利用联合学习模型诊断任意参与方的动设备故障。
101.需要说明的是，前述对动设备故障诊断方法实施例的解释说明也适用于该实施例的动设备故障诊断装置，此处不再赘述。
102.根据本技术实施例提出的动设备故障诊断装置，获取第一数据集和第一公开验证集，并利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，并上传第一难样本和第一预测值至服务端，客户端也接收来自服务端在训练第二模型中的第二预测值和挖掘的第二难样本，使得客户端与服务端之间传输预测值与特征图，基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。由此，解决了相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。
103.其次参照附图描述根据本技术实施例提出的动设备故障诊断装置。
104.图6是本技术实施例的动设备故障诊断装置的方框示意图。
105.如图6所示，该动设备故障诊断装置20，装置应用于服务端，服务端包括第二模型，其中，该装置包括：第二获取模块210、第二训练模块220和第二蒸馏模块230。
106.其中，第二获取模块210用于获取第二数据集和第二公开验证集；第二训练模块220用于利用第二数据集和第二公开验证集对第二模型进行训练，挖掘第二公开验证集的第二难样本，下发第二难样本和第二预测值至任意客户端，并接收任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本；第二蒸馏模块230用于基于预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，利用联合学习模型诊断任意参与方的动设备故障。
107.需要说明的是，前述对动设备故障诊断方法实施例的解释说明也适用于该实施例的动设备故障诊断装置，此处不再赘述。
108.根据本技术实施例提出的动设备故障诊断装置，获取第二数据集和第二公开验证集，并利用第二数据集和第二公开验证集对第一模型进行训练，挖掘第二公开验证集的第一难样本，并下发第二难样本和第二预测值至客户端，服务端也接收来自客户端在训练第一模型中的第一预测值和挖掘的第一难样本，使得客户端与服务端之间传输预测值与特征图，基于所有预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，并利用其诊断任意参与方的动设备故障，既能够实现故障的精确定位，节省了通信成本，同时也支持模型异构，提升模型性能。由此，解决了相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。
109.图7为本技术实施例提供的客户端的结构示意图。该客户端可以包括：
110.存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。
111.处理器702执行程序时实现上述实施例中提供的动设备故障诊断方法。
112.进一步地，客户端还包括：
113.通信接口703，用于存储器701和处理器702之间的通信。
114.存储器701，用于存放可在处理器702上运行的计算机程序。
115.存储器701可能包含高速ram(random access memory，随机存取存储器)存储器，也可能还包括非易失性存储器，例如至少一个磁盘存储器。
116.如果存储器701、处理器702和通信接口703独立实现，则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是isa(industry standard architecture，工业标准体系结构)总线、pci(peripheral component，外部设备互连)总线或eisa(extended industry standard architecture，扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
117.可选的，在具体实现上，如果存储器701、处理器702及通信接口703，集成在一块芯片上实现，则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
118.处理器702可能是一个cpu(central processing unit，中央处理器)，或者是asic(application specific integrated circuit，特定集成电路)，或者是被配置成实施本技术实施例的一个或多个集成电路。
119.图8为本技术实施例提供的服务端的结构示意图。该服务端可以包括：
120.存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序。
121.处理器802执行程序时实现上述实施例中提供的动设备故障诊断方法。
122.进一步地，服务端还包括：
123.通信接口803，用于存储器801和处理器802之间的通信。
124.存储器801，用于存放可在处理器802上运行的计算机程序。
125.存储器801可能包含高速ram(random access memory，随机存取存储器)存储器，也可能还包括非易失性存储器，例如至少一个磁盘存储器。
126.如果存储器801、处理器802和通信接口803独立实现，则通信接口803、存储器801和处理器802可以通过总线相互连接并完成相互间的通信。总线可以是isa(industry standard architecture，工业标准体系结构)总线、pci(peripheral component，外部设备互连)总线或eisa(extended industry standard architecture，扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
127.可选的，在具体实现上，如果存储器801、处理器802及通信接口803，集成在一块芯片上实现，则存储器801、处理器802及通信接口803可以通过内部接口完成相互间的通信。
128.处理器802可能是一个cpu(central processing unit，中央处理器)，或者是asic(application specific integrated circuit，特定集成电路)，或者是被配置成实施本申
请实施例的一个或多个集成电路。
129.在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
130.此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中，“n个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
131.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本技术的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本技术的实施例所属技术领域的技术人员所理解。
132.应当理解，本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列，现场可编程门阵列等。
133.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
134.尽管上面已经示出和描述了本技术的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本技术的限制，本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征：
1.一种动设备故障诊断方法，其特征在于，所述方法应用于客户端，所述客户端包括第一模型，其中，所述方法包括以下步骤：获取第一数据集和第一公开验证集；利用所述第一数据集和所述第一公开验证集对所述第一模型进行训练，挖掘所述第一公开验证集的第一难样本，上传所述第一难样本和第一预测值至服务端，并接收所述服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断任意参与方的动设备故障。2.根据权利要求1所述的方法，其特征在于，所述挖掘所述第一公开验证集的第一难样本，包括：获取第一在公开验证集上的第一预测值和第一真实标签；遍历所述第一在公开验证集的所有样本，若所述第一预测值和第一真实标签的差值大于第一阈值，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到所述第一难样本。3.根据权利要求1或2所述的方法，其特征在于，所述第一难样本包括多个特征图，所述上传所述第一难样本和所述第一预测值至服务端，包括：从所述第一难样本中选择满足第一预设条件的特征图；量化压缩满足第一预设条件的特征图，得到第一压缩特征图，上传所述第一压缩特征图和所述第一预测值至服务端。4.一种动设备故障诊断方法，其特征在于，所述方法应用于服务端，所述服务端包括第二模型，其中，所述方法包括以下步骤：获取第二数据集和第二公开验证集；利用所述第二数据集和所述第二公开验证集对所述第二模型进行训练，挖掘所述第二公开验证集的第二难样本，下发所述第二难样本和第二预测值至任意客户端，并接收所述任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本；基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。5.根据权利要求4所述的方法，其特征在于，所述挖掘所述第二公开验证集的第二难样本，包括：获取第二在公开验证集上的第二预测值和第二真实标签；遍历所述第二在公开验证集的所有样本，若所述第二预测值和第二真实标签的差值大于第二阈值，则对应样本的索引添加到难样本索引集合中，直到遍历完成，得到所述第二难样本。6.根据权利要求4或5所述的方法，其特征在于，所述第二难样本包括多个特征图，所述下发所述第二难样本和第二预测值至任意客户端，包括：从所述第二难样本中选择满足第二预设条件的特征图；量化压缩满足第二预设条件的特征图，得到第二压缩特征图，下发所述第二压缩特征图和所述第二预测值至任意客户端。
7.一种动设备故障诊断装置，其特征在于，所述装置应用于客户端，所述客户端包括第一模型，其中，所述装置包括：第一获取模块，用于获取第一数据集和第一公开验证集；第一训练模块，用于利用所述第一数据集和所述第一公开验证集对所述第一模型进行训练，挖掘所述第一公开验证集的第一难样本，上传所述第一难样本和第一预测值至服务端，并接收所述服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；第一蒸馏模块，用于基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断任意参与方的动设备故障。8.一种动设备故障诊断装置，其特征在于，所述装置应用于服务端，所述服务端包括第二模型，其中，所述装置包括：第二获取模块，用于获取第二数据集和第二公开验证集；第二训练模块，用于利用所述第二数据集和所述第二公开验证集对所述第二模型进行训练，挖掘所述第二公开验证集的第二难样本，下发所述第二难样本和第二预测值至任意客户端，并接收所述任意客户端在训练第一模型过程中的第一预测值和挖掘的第一难样本；第二蒸馏模块，用于基于预测值与难样本进行联合双向知识蒸馏直到所述第一模型和所述第二模型均收敛，得到训练完成的联合学习模型，利用所述联合学习模型诊断所述任意参与方的动设备故障。9.一种客户端，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求1-3任一项所述的动设备故障诊断方法。10.一种服务端，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求4-6任一项所述的动设备故障诊断方法。

技术总结
本申请涉及故障诊断技术领域，特别涉及一种动设备故障诊断方法、装置、客户端及服务器，其中，包括：获取第一数据集和第一公开验证集；利用第一数据集和第一公开验证集对第一模型进行训练，挖掘第一公开验证集的第一难样本，上传第一难样本和第一预测值至服务端，并接收服务端在训练第二模型过程中的第二预测值和挖掘的第二难样本；基于预测值与难样本进行联合双向知识蒸馏直到第一模型和第二模型均收敛，得到训练完成的联合学习模型，利用联合学习模型诊断任意参与方的动设备故障。由此，解决了相关技术中解决单一设备的故障样本较少，本地模型性能较差，无法实现多设备故障诊断等问题。问题。问题。

技术研发人员：郭盛陈辉
受保护的技术使用者：新奥新智科技有限公司
技术研发日：2023.05.29
技术公布日：2023/10/11

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种一进多出智能灌溉电动阀 下一篇：基于紫外线的纺织物关键点高精度检测方法及应用

动设备故障诊断方法、装置、客户端及服务器与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

动设备故障诊断方法、装置、客户端及服务器与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表