基于机器学习与置信率的密封继电器重叠信号识别方法
未命名
09-17
阅读:126
评论:0
1.本发明属于,涉及一种密封继电器重叠信号识别方法,具体涉及一种基于机器学习与置信率的密封继电器重叠信号识别方法。
背景技术:
2.密封继电器作为一种常见的电子元器件,是组成航天设备的重要基础。密封继电器的生产工艺复杂,在某些环节可能将铝屑、焊锡粒、热熔胶粒等微粒遗留在密封继电器内部。这些独立于物体内部组件且破坏稳定物理状态的微粒称为多余物。通常情况下,密封继电器工作于超失重状态,残留的多余物由此处于随机运动状态。它会碰撞密封继电器的内部组件使其损坏,或附着在电路板表面引起短路和断路,甚至会滑动产生静电和电磁干扰。这些都会导致密封继电器失效,进而影响航天设备的正常运行。因此,在出厂前对密封继电器进行多余物检测显得尤为重要。
3.微粒碰撞噪声检测(pind)法是目前广泛采用的多余物检测方法。具体的,通过给待测密封继电器施加足够的力学激励,使其内部可能存在的多余物处于随机运动状态,由此产生碰撞信号或滑动信号。声发射传感器被放置在待测密封继电器表面来捕获信号,通过判断是否捕获到信号来判断待测密封继电器内部是否存在多余物。在多余物检测中,多余物碰撞或滑动产生的信号称为多余物信号。早期,检测人员发现声发射传感器捕获到信号就判断待测密封继电器内部存在多余物,这种检测结果并不可靠。这是因为在力学激励下,待测密封继电器内部松动组件同样会产生振动信号,称为组件信号。组件信号的存在会严重干扰多余物检测的准确性。因此,准确识别多余物信号与组件信号是准确进行多余物检测的关键。
4.早期,很多学者采用信号处理技术开展多余物信号与组件信号的识别研究。如,高宏亮等人分别构建了多余物信号与组件信号的声学模型,利用小波消噪算法和门限法来识别两种信号。陈金豹等人研究了组件信号的周期明显特性,提出了一种组件信号检测算法,但并未对多余物信号进行更多处理。刘海江等人分析了多余物信号与组件信号中脉冲发生序列的周期性差异,并由此提出一种有效识别两种信号的算法。随着机器学习的发展与应用,从两种信号中提取声音特征来量化它们之间声学特性的差异,进而构建数据集和训练分类器来有效识别两种信号,这为研究带来了新思路。如,李响等人提取时域和频域中的经典声音特征来构建数据集,训练了基于多层感知机的分类器,能够有效识别来源多余物信号与组件信号的两种标签的数据。李超然等人引入了集成学习思想,训练了基于参数优化xgboost的分类器,进一步提升了分类器在两种标签的数据上取得的分类精度。此外,梁晓雯、马园园等人也分别使用决策树、随机森林和支持向量机对来源两种信号的两种标签的数据进行分类,并取得较好的分类精度。
5.综上所述,现有多余物检测研究或多余物信号与组件信号识别研究存在以下问题:首先,不管是采用信号处理技术或者机器学习方法,现有研究均是基于纯净的多余物信号或组件信号,在此基础上训练合适的声学模型、检测算法或分类器。事实上,这些声学模
型、检测算法或分类器的实用性和泛化性均很差。因为在真实应用场景下,多余物与内部松动组件同时产生信号,多余物的信号是突发的、随机的,而组件信号是周期性的、稳定的。在很多情况下,随机发生的多余物信号是跟稳定发生的组件信号混合在一起的。这样,很少有单独的、纯净的多余物信号产生。因此,上述这些声学模型、检测算法或分类器并不能起作用。其次,现有研究均忽略了重叠信号。如前所述,多余物信号与组件信号混合在一起才是常态。因此,对重叠信号进行深入分析,并尝试挖掘出多余物信号的信息,才是真正实现多余物检测的关键,而不是在理想状态下对两种单音信号进行分析。最后,现有基于机器学习方法的研究均止步于训练一个性能良好的分类器,实现对来源多余物信号与组件信号的两种标签的数据的有效分类,并未进一步给出多余物信号与组件信号的识别结果。或者说,并未给出使用这些方法进行多余物检测的一般程序步骤。即,这些研究并未在真实应用场景下得到应用,具有一定的学术参考价值,但实用性较低。
技术实现要素:
6.针对现有多余物检测研究中忽略重叠信号的不足,本发明以真实应用场景下大量存在的重叠信号为研究对象,提供了一种基于机器学习与置信率的密封继电器重叠信号识别方法,来提高现有多余物检测的准确性。
7.本发明的目的是通过以下技术方案实现的:
8.一种基于机器学习与置信率的密封继电器重叠信号识别方法,包括如下步骤:
9.步骤一:根据真实应用场景下从密封继电器中检测出的多余物的属性,制作密封继电器样本集一,并对样本分别进行编号,其中:不包含多余物但包含松动组件的样本的编号为0,不包含松动组件但包含第一种材质的多余物的样本的编号为1,不包含松动组件但包含第二种材质的多余物的样本的编号为2,
……
,不包含松动组件但包含第n种材质的多余物的样本的编号为n;
10.步骤二:根据步骤一中的编号依次对密封继电器样本集一中的样本开展pind检测,分别获取并保存一段单音信号,在最后一个样本完成pind检测后,完整的一轮试验结束,得到多段单音信号;通过重复多轮试验,得到对应各样本的多段单音信号;
11.步骤三:从多域提取适用的声音特征,建立声音特征库;对单音信号进行分帧处理与脉冲提取,从每个帧信号上计算特征数值,并添加标签,得到多条数据,其中:归属组件信号的数据的标签被设置为“0”,归属多余物信号的数据的标签被设置为“1”,由这两类标签的数据构建识别数据集;
12.步骤四:分别在识别数据集上训练多个分类器,比较得出表现最好的分类器;借助网格搜索法,对该分类器的内部参数进行优化,使其分类性能达到最优,由此得到最优分类器,称为最优识别模型;
13.步骤五:参考步骤一,制作密封继电器样本集二,并对样本分别进行编号,其中:同时包含第一种材质的多余物与松动组件的样本的编号为1,同时包含第二种材质的多余物与松动组件的样本的编号为2,
……
,同时包含第n种材质的多余物与松动组件的样本的编号为n;
14.步骤六:根据步骤五中的编号依次对密封继电器样本集二中的样本开展pind检测,分别获取并保存一段重叠信号,在最后一个样本完成pind检测后,完整的一轮试验结
束,得到多段重叠信号;通过重复多轮试验,得到对应各样本的多段重叠信号;
15.步骤七:对重叠信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个重叠集合,由此构建多个重叠集合,分别命名为重叠集合1,重叠集合2,
……
,重叠集合n;
16.步骤八:使用步骤四得到的最优识别模型分别对重叠集合进行预测,计算每个重叠集合中标签被预测为“0”的数据个数占总数据个数的比值,称为置信率,由此得到多个置信率;取所有置信率的下限,得到标准置信率;
17.步骤九:对待测密封继电器开展pind检测,获取并保存一段待测信号;
18.步骤十:对待测信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个待测集合,由此构建多个待测集合,分别命名为待测集合1,待测集合2,
……
,待测集合n;
19.步骤十一:使用步骤四得到的最优识别模型依次对待测集合进行预测,计算每个待测集合的置信率,由此得到多个置信率;依次比较当前计算的置信率与标准置信率,如果所有当前计算的置信率均大于标准置信率,则表明当前待测信号中不存在重叠信号,如果有大于一个的当前计算的置信率小于标准置信率,则表明当前待测信号中存在重叠信号。
20.相比于现有技术,本发明具有如下优点:
21.(1)本发明首次将提高多余物检测可靠性的研究重心转移到重叠信号上,为多余物检测研究提供新思路。真实应用场景下重叠信号中蕴藏着大量多余物信号,以重叠信号为研究对象并尝试从中挖掘多余物信号的信息能够提高多余物检测的准确性和可靠性。
22.(2)本发明首次将机器学习中分类器的分类机制应用到重叠信号的识别上。分类器以数据分布为依据进行数据分类,重叠信号中同样保留多余物信号与组件信号的声学特性的差异,这种差异可以量化为特征向量,进而实现数据分类与信号识别。
23.(3)本发明提出适用于多余物检测的置信率与检测精度的定义。置信率是实现从特征向量的分类结果到重叠信号的识别结果转换的关键,检测精度是实现从重叠信号的识别结果到工程应用需求的多余物检测结果转换的关键。
24.(4)本发明所提方法在真实应用场景下取得显著且稳定的识别和检测效果。本发明所提方法在真实应用场景下进行了多次重叠信号识别测试和密封继电器多余物检测测试,验证了其可行性与实用性。本发明所提方法取得的检测精度为100%,取得的重叠信号识别结果稳定可靠。相较于现有研究,本发明对多余物信号的检测敏锐性大幅度提升,有效提升了密封继电器多余物检测的可靠性。
附图说明
25.图1为密封继电器重叠信号识别方法的实现流程;
26.图2为密封继电器样本;
27.图3为真实应用场景下采集的单音信号波形图,a-多余物信号,b-组件信号;
28.图4为六个部分中50个重叠集合的置信率;
29.图5为不同重量的密封继电器样本集中六种材质的平均置信率。
具体实施方式
30.下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
31.本发明以真实应用场景下大量出现的重叠信号为研究对象,提供了一种基于机器学习与置信率的密封继电器重叠信号识别方法,来提高现有多余物检测的准确性。重叠信号与单音信号之间的最大区别在于,单音信号只存在一种声学特性,而重叠信号中同时包含多余物信号与组件信号的声学特性。在本发明中,通过提取多域中的声音特征来量化两种信号的声学特性的差异,并借助机器学习中分类器的分类机制来直观展示声学特性的差异引起的变化,即分类结果的变化。因此,参考真实应用场景下多余物检测信息,制作了真实的密封继电器样本,训练了性能良好的分类器,对来源多余物信号与组件信号的两种标签的数据进行有效分类。应用分类器在来源重叠信号的数据上进行预测,分析两种标签数据的分布特性,使用置信率来量化分布特性,即两种信号的声学特性的差异,确定标准置信率。在此基础上,以分类器与标准置信率为参考,给出待测密封继电器重叠信号的识别结果,进而给出多余物检测结果。
32.上述方法的核心思想在于研究对象的三次转移。由于保密管理等因素的限制,无法获得授权直接拆解密封继电器来开展研究。因此,本发明根据真实应用场景下密封继电器的使用型号和封装工艺,制作两批样本。第一批样本包括只包含一种材质的多余物但不包含松动组件的样本,以及不包含多余物但包含松动组件的样本,称为密封继电器样本集一。第二批样本包括同时包含一种材质的多余物与松动组件的样本,称为密封继电器样本集二。首先,以密封继电器样本集一为研究对象,通过数据获取、信号预处理、特征提取、数据集构建、模型训练、参数优化等步骤,训练一个分类性能最优的分类器,称为最优识别模型。其次,以密封继电器样本集二为研究对象,通过数据获取、信号预处理、特征提取、重叠集合构建、置信率计算等步骤,得到一个标准置信率。最后,以待测密封继电器为研究对象,通过数据获取、信号预处理、特征提取等步骤,构建多个待测集合,利用最优识别模型分别进行预测。根据预测结果,计算多个待测集合的置信率,与标准置信率进行对比,综合分析后得到重叠信号识别结果。如图1所示,具体实施步骤如下:
33.步骤一:根据真实应用场景下从密封继电器中检测出的多余物的属性,制作密封继电器样本集一,并对样本分别进行编号,其中:不包含多余物但包含松动组件的样本的编号为0,不包含松动组件但包含第一种材质的多余物的样本的编号为1,不包含松动组件但包含第二种材质的多余物的样本的编号为2,
……
,不包含松动组件但包含第n种材质的多余物的样本的编号为n。
34.步骤二:根据步骤一中的编号依次将样本放置到dzjc-iii型微粒碰撞噪声多余物自动检测系统上开展pind检测,分别获取并保存一段单音信号(采集时长为10秒钟),在最后一个样本完成pind检测后,完整的一轮试验结束,得到多段单音信号;通过重复多轮试验,得到对应各样本的多段单音信号。
35.步骤三:从多域提取适用的声音特征,建立声音特征库;对单音信号进行分帧处理与脉冲提取,从每个帧信号上计算特征数值,并添加标签,得到多条数据,其中:归属组件信号的数据的标签被设置为“0”,归属多余物信号的数据的标签被设置为“1”,由这两类标签
的数据构建识别数据集;所述多域包括时域、频域、时频域、梅尔频率倒谱系数域、小包变换域、希尔伯特-黄变换、分形理论、混沌系统等。
36.步骤四:分别在识别数据集上训练多个分类器,比较得出表现最好的分类器;借助网格搜索法,对该分类器的内部参数进行优化,使其分类性能达到最优,由此得到最优分类器,称为最优识别模型,其中:所述分类器包括k近邻、常规支持向量机、基于核函数的支持向量机、决策树、随机森林、xgboost、bp神经网络、循环神经网络、卷积神经网络等。
37.至此,本发明所提方法在训练阶段的识别模型训练部分的任务结束,得到的最优识别模型可以用于重叠信号识别。
38.步骤五:参考步骤一,制作密封继电器样本集二,并对样本分别进行编号,其中:同时包含第一种材质的多余物与松动组件的样本的编号为1,同时包含第二种材质的多余物与松动组件的样本的编号为2,
……
,同时包含第n种材质的多余物与松动组件的样本的编号为n。
39.步骤六:根据步骤五中的编号依次将样本放置到dzjc-iii型微粒碰撞噪声多余物自动检测系统上开展pind检测,分别获取并保存一段重叠信号(采集时长为10秒钟),在最后一个样本完成pind检测后,完整的一轮试验结束,得到多段重叠信号;通过重复多轮试验,得到对应各样本的多段重叠信号。
40.步骤七:对重叠信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个重叠集合,由此构建多个重叠集合,分别命名为重叠集合1,重叠集合2,
……
,重叠集合n。
41.步骤八:使用步骤四得到的最优识别模型分别对重叠集合进行预测,计算每个重叠集合中标签被预测为“0”的数据个数占总数据个数的比值,称为置信率,由此得到多个置信率;取所有置信率的下限,得到标准置信率。
42.至此,本发明所提方法在训练阶段的重叠信号识别部分的任务结束,得到的标准置信率可以用于重叠信号识别。
43.步骤九:将待测密封继电器放置到dzjc-iii型微粒碰撞噪声多余物自动检测系统上开展pind检测,获取并保存一段待测信号(采集时长为10秒钟)。
44.步骤十:对待测信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个待测集合,由此构建多个待测集合,分别命名为待测集合1,待测集合2,
……
,待测集合n。
45.步骤十一:使用步骤四得到的最优识别模型依次对待测集合进行预测,计算每个待测集合的置信率,由此得到多个置信率;依次比较当前计算的置信率与标准置信率,如果所有当前计算的置信率均大于标准置信率,则表明当前待测信号中不存在重叠信号,如果有大于一个的当前计算的置信率小于标准置信率,则表明当前待测信号中存在重叠信号。
46.至此,本发明所提方法在测试阶段的任务结束。
47.实施例:
48.1、样本制作与信号采集
49.在当前制造水平下,密封继电器内部残留多余物的数量很少超过1个,具体材质包
括铜丝、焊锡粒、铝粒、热熔胶粒、pvc粒和硅胶粒。它们的重量分布在0.2mg至2mg的范围。本实施例制作了上述六种材质的多余物样本,重量均选择最小的0.02mg。在制作密封继电器样本的过程中,本实施例在每个样本内部放置不多于1个的多余物样本。图2给出了制作的密封继电器样本(部分)。其中,上面一行是密封继电器样本集一(部分),它们都不包含松动组件但包含一种材质的多余物样本。下面一行是密封继电器样本集二,它们都同时包含松动组件和一种材质的多余物样本。此外,本实施例制作了一个包含松动组件但不包含多余物样本的密封继电器样本,加入到第一行样本中组成完整的密封继电器样本集一。这样,密封继电器样本集一中样本的编号依次为1,2,
……
,7,密封继电器样本集二中样本的编号依次为1,2,
……
,6。
50.参考上述步骤二与步骤五,本实施例根据编号依次将密封继电器样本集一与密封继电器样本集二中的样本放置到dzjc-iii型微粒碰撞噪声多余物自动检测系统上开展pind检测。通过重复100轮试验,分别得到700段单音信号与600段重叠信号。
51.2、特征提取
52.机器学习不能直接对信号进行处理,需要将信号转化成数据。特征提取是信号检测领域常用的转化手段。它从时域、频域和高阶域中选择那些能够描述信号声学特性的声音特征,通过特征计算将信号转化为多个特征数值,由此构建多个特征向量。不同类别的特征向量构建数据集,可以训练分类器,完成信号分类或识别任务。
53.多余物信号是多余物与密封继电器内侧壁或内部组件碰撞或滑动产生的,它的频率集中在130khz至180khz。组件信号是密封继电器内部松动组件振动产生的,它的频率集中在15khz至100khz。图3给出了真实应用场景下利用专用设备采集的多余物信号与组件信号的波形。
54.从图3中可以看出,多余物信号中的脉冲是随机的尖峰脉冲序列,在时间上是随机变化的,彼此之间的时间间隔较大。相比之下,组件信号的脉冲在时间上是近似周期变化的,每个周期内脉冲序列的幅度和持续时间是近似相等的。因此,时域和频域中的声音特征就可以清晰的描述两种信号之间声学特性的差异。借助基于多指标组合排序的特征选择方法,本实施例选择12个声音特征构建声音特征库,如表1所示。
55.表1声音特征库
56.57.3、识别数据集与重叠集合
58.对采集的单音信号及重叠信号进行分帧处理。这样,这些信号被处理成了多个帧信号,包含有用帧信号和零帧信号。有用帧信号是在脉冲的基础上形成的,零帧信号是在用于连接脉冲的零信号的基础上形成的。端点检测是指从一段信号中准确找出脉冲的起始点和结束点,它的目的是为了让有效的脉冲与无用的零信号分离。在本实施例中,端点检测可以从多个连续帧信号中准确找出由脉冲形成的多个连续有用帧信号的起始点和结束点,即起始帧信号与结束帧信号。每个脉冲形成的多个连续有用帧信号被视为一个帧信号组合。
59.本实施例共采集700段单音信号和600段重叠信号,其中,700段单音信号由100段组件信号与六种材质的100段多余物信号组成。对这些信号分别进行分帧处理与端点检测,得到多个有用帧信号。在每个有用帧信号上计算声音特征库中12个声音特征的数值,构建多个特征向量。对于那些由组件信号处理得到的有用帧信号,它们构建的特征向量被设置“0”的标签。而对于那些由多余物信号处理得到的有用帧信号,它们构建的特征向量被设置“1”的标签。这些带标签的特征向量构建了识别数据集,其具体描述如表2所示。此外,对于那些由重叠信号处理得到的有用帧信号,根据它们所属的帧信号组合,它们构建的特征向量被组合在一起构建多个重叠集合,用于重叠信号识别的研究。
60.表2识别数据集
[0061][0062]
4、最优识别模型
[0063]
机器学习中常用的性能良好的分类器包括k近邻、径向基核函数的支持向量机(rbf-svm)、决策树、随机森林、xgboost等。本实施例在识别数据集上进行十折交叉验证,分别训练上述五个分类器,计算它们取得的平均分类精度,如表3所示。此外,本实施例还训练了bp神经网络与循环神经网络,与上述五个分类器进行对比。
[0064]
表3不同分类器在识别数据集上取得的平均分类精度
[0065][0066][0067]
从表3中可以看出,xgboost取得了最高的平均分类精度,且优势明显。随机森林、rbf-svm同样取得较高的平均分类精度。xgboost与随机森林均是基于集成学习思想的分类器,是由多个基分类器组成的强分类器,它们的分类性能更为突出。svm常用来解决低维度的二分类问题。在使用径向基函数作为核函数后,rb-svm可以将高维度的多分类问题映射到高维空间中,再使用超平面进行切分。因此,rbf-svm同样取得了令人满意的平均分类精度。决策树是xgboost与随机森林的基分类器,取得的平均分类精度要低于两者,表现一般。
影响knn分类性能的三个要素包括k值选择、距离度量和投票权重。在识别数据集中,不同声音特征对应列特征向量的数据分布差异很大,如,脉冲左右对称度的数据分布在0至1的区间内,倒谱系数的数据分布在5000至10000的区间内,两者之间相差10000倍以上。因此,knn的距离度量不再敏感,其分类性能有所下降。相比之下,bp神经网络和循环神经网络的表现一般,尤其是bp神经网络,取得了最低的平均分类精度。bp神经网络容易陷入局部最小值的陷阱,分类结果过度依赖初始化时随机设置的权值。较bp神经网络,循环神经网络取得的平均分类精度有了明显的提升,但相比较其他更优的分类器,还存在较大的差距。
[0068]
综上所述,本实施例采用xgboost作为分类器。借助网格搜索法,对xgboost的内部参数进行优化,包括总迭代次数、决策树的深度和学习率。具体的,总迭代次数的寻找范围被设置为0至1000,步长被设置为1。决策树深度的寻找范围被设置为0至20,步长被设置为1。学习率的寻找范围被设置为0至1,步长被设置为0.01。最终,得到总迭代次数的最佳值为158,决策树深度的最佳值为9,学习率的最佳值为0.13。在此基础上,参数优化xgboost取得的平均分类精度为94.68%,较参数优化之前提升了1.56%。至此,得到最优识别模型。
[0069]
5、重叠信号识别
[0070]
本实施例构建了多个重叠集合,它们来源于600段重叠信号。考虑到密封继电器样本集二包含六种材质的样本,每个样本产生了100段重叠信号。因此,本实施例将重叠集合分为六个部分,分别对应六个样本。本实施例从每个部分随机挑选50个重叠集合,共300个重叠集合,并利用最优识别模型在每个重叠集合上进行预测。这样,每个重叠集合内多个不带标签的特征向量的标签被预测,作者据此计算每个重叠集合的置信率。
[0071]
在统计中,置信率又称置信水平,是针对于某一置信区间而言的,指某件事在这一置信区间发生的可信程度。在本实施例中,定义的置信率是指,重叠集合内多个不带标签的特征向量的标签被预测为“0”,即组件信号,的可信程度。在此基础上,分别计算六个部分中50个重叠集合的置信率,并绘制如图4所示的散点图。
[0072]
从图4中可以看出,300个置信率全部分布在60%到75%的区间内。并且,图中显示的六种颜色的散点呈现出较为明显的分层现象。即,对应样本四的50个散点,即对应热熔胶粒的多余物样本,分布在最底层。再往上,依次分布着分别对应样本六、样本五和样本三的50个散点,即分别对应硅胶粒、pvc粒和铝粒的多余物样本。在最上层,交替分布着对应样本一和样本二的50个散点,即对应铜丝和焊锡粒的多余物样本。图4中可以看出,最底层对应的置信率最小,最上层对应的置信率最大。从置信率的定义来看,位于底层的置信率代表,在对应的重叠集合或帧信号组合中,多余物信号对应的不带标签的特征向量或有用帧信号的数量占比较大。换句话说,在每个重叠集合或帧信号组合对应的脉冲中,多余物信号的占比相对较大。本实施例对此进行分析。表4列出了图2所示六种材质的莫氏硬度和密度。
[0073]
表4六种材质的莫氏硬度和密度
[0074][0075]
从莫氏硬度来看,热熔胶粒、硅胶粒、pvc粒、铜丝、铝粒和焊锡粒的莫氏硬度依次递减,与上述分析的变化趋势基本一致。其中,热熔胶粒与硅胶粒、硅胶粒与pvc粒的莫氏硬度的分布区间有部分重叠,但大体上区分较为明显。通常来说,在其他条件相同时,莫氏硬度越大的物体,其碰撞产生的多余物信号的能量越大,导致其与组件信号组成的重叠信号中多余物信号的占比越大。这也解释了表4所示六种材质的莫氏硬度的变化趋势与置信率的变化趋势基本一致的原因。值得注意的是,铜丝和铝粒的莫氏硬度的变化趋势恰好与置信率的变化趋势相反。因此,本实施例继续从密度角度进行分析。如前所述,本实施例选择的六种材质的多余物样本的重量均为0.02mg。我们知道,在重量相同的情况下,密度越大的物体,体积越小。这样来看,热熔胶粒、pvc粒和硅胶粒等三种非金属物质的密度明显小于铜丝、焊锡粒和铝粒等三种金属物质。这样,三种非金属物质的体积一定大于三种金属物体。考虑到三种非金属材质的硬度也明显高于三种金属材质,因此,三种非金属材质的置信率一定是低于三种金属材质的置信率的。此外,硅胶粒的密度与pvc粒相差不大,但其置信率仍然高于pvc粒,说明本实施例中使用的硅胶粒的莫氏硬度应该是接近70的。在三种金属材质中,铝粒的莫氏硬度稍低于铜丝,但它的密度远小于铜丝,说明它的体积较大。这也解释了为什么铝粒的置信率高于铜丝。焊锡粒的莫氏硬度只有铜丝的一半,但是它的密度也小于铜丝,说明它的体积稍大。这也解释了为什么焊锡粒与铜丝的置信率交替。总体上来看,铜丝的置信率更小,说明莫氏硬度起主导作用。
[0076]
通过计算,得出六种材质的平均置信率分别如下:铜丝是62.26%,焊锡粒是63.92%,铝粒是65.66%,热熔胶粒是67.90%,pvc粒是70.02%,硅胶粒是70.28%。它们中最大的就是热熔胶粒70.28%。最优识别模型在识别数据集上取得的平均分类精度为93.12%。对于一个由单音信号构建的待测数据集来说,它内部特征向量的标签应该是相等且唯一的,要么全是“0”,要么全是“1”。然而,最优识别模型只能将待测数据集中93%左右的特征向量的标签预测正确,其余7%左右的特征向量的标签预测错误。换个角度来说,在单音信号中,通过分帧处理和端点检测得到多个帧信号组合,进而构建多个重叠集合。如果这个单音信号是组件信号,则最优识别模型预测重叠集合中标签为“0”的特征向量的占比为93%左右,进而计算每个重叠集合的置信率应该在93%左右。以此类推,如果这个单音信号是多余物信号,则计算每个重叠集合的置信率应该在7%左右。这样,如果这个信号是重叠信号,则最优识别模型对某个标签的偏好程度会下降,即预测为某个标签的特征向量的占比要稍低于93%,预测为另一个标签的特征向量的占比要稍高于7%。这本质上就是置信率。这就解释了图4所示不同材质对应的置信率徘徊在60%至75%的原因。这也是本发明提出的重叠信号识别的核心。综合看来,在单音信号中,即组件信号中,取得的置信率约为93%。在重叠信号中,取得的置信率的上限为70.28%,约为71%。本实施例取两者的中位数
82%作为标准置信率。即:如果取得的置信率低于标准置信率,说明这是重叠信号或多余物信号,反之则是组件信号。可以看出,这样的划分既使得重叠信号的置信率与单音信号(组件信号)的置信率明显区分,还保留了一定的弹性空间确保在某些极端情况下重叠信号的置信率不会超过标准置信率,保证重叠信号识别的可靠性。至此,得到标准置信率。
[0077]
6、一般程序步骤
[0078]
下面给出应用本发明所提方法进行真实应用场景下密封继电器多余物检测的一般程序步骤,也是对测试阶段的步骤九至步骤十一的详细描述。
[0079]
步骤一:将待测密封继电器放置到专用设备上开展pind检测,获取并保存一段待测信号。
[0080]
步骤二:对待测信号进行分帧处理与脉冲提取,从每个帧信号上计算声音特征库的特征数值,得到多个不带标签的特征向量。属于同一个帧信号组合的多个特征向量构建一个待测集合,由此构建多个待测集合,分别命名为待测集合1,待测集合2,
……
,待测集合n。
[0081]
步骤三:使用最优识别模型依次对待测集合进行预测,计算每个待测集合的置信率,得到多个置信率。依次比较计算的多个置信率与标准置信率82%。如果所有计算的置信率均大于82%,表明当前待测信号为组件信号,待测密封继电器内部不存在多余物。如果有大于一个的计算的置信率小于82%,表明当前待测信号为重叠信号或多余物信号,待测密封继电器内部存在多余物。
[0082]
7、性能评估指标
[0083]
为了评估分类器的分类性能,本实施例选择分类精度作为评估指标。假设数据集或集合为d={(x1,y1),(x2,y2),
…
,(xm,ym)},其中,yi是特征向量xi的真实标签,ti是分类器给出的预测标签。则分类器在d上取得的分类精度表示为:标签预测正确的特征向量的数量占特征向量总数量的比例,即:
[0084][0085]
式中,i是指示函数,当ti=yi时,i(ti=yi)=1。
[0086]
此外,本实施例提出适用于多余物检测的检测精度的定义。假设多余物检测事件e中包含n个检测任务,即n个待测密封继电器,表示为e={t1,t2,...,tn}。在检测任务tj中,对最优识别模型给出的待测集合的识别结果进行顺序判断,统计出现多余物信号或重叠信号的数量,进而得出多余物检测结果为p(tj)。同时,通过物理方式打开待测密封继电器,确定真实的识别结果为rj。如果p(tj)与rj一致,则认定此次检测任务成功。检测精度表示为,在多余物检测事件e中,检测任务成功的数量占总检测任务数量的比例,其计算公式为:
[0087][0088]
式中,i是指示函数,当p(tj)=rj时,i(p(tj)=rj)=1。
[0089]
实施例2:标准置信率稳健性验证
[0090]
参考实施例1中密封继电器样本集二的制作过程,本实施例重新制作了七个用于生成重叠信号的密封继电器样本集。需要说明的是,每个新的密封继电器样本集使用的多余物样本的重量不一样,分别为0.4mg,0.8mg,0.16mg,0.32mg,0.64mg,1.28mg和2mg,其余设置均一样。分别将这些样本放置到dzjc-iii型微粒碰撞噪声多余物自动检测系统上开展
iii型微粒碰撞噪声多余物自动检测系统上开展pind检测。通过数据获取、信号预处理和特征提取等步骤,分别构建多个待测集合。利用最优识别模型分别进行预测,计算各个待测集合的置信率,并统计10个待测密封继电器的重叠信号识别结果,如表6所示。
[0099]
表610个待测密封继电器的重叠信号识别结果
[0100][0101]
从表6中可以看出,10个待测密封继电器的多余物检测结果均正确。如果将10个待测密封继电器视为一个多余物检测事件,则本发明所提方法取得的检测精度为100%。这有效说明本发明所提方法的可行性与实用性。具体的,编号为3、5、9、10的待测密封继电器内部存在多余物,并且这些待测密封继电器对应的待测集合中均被识别出存在重叠信号。尤其在编号为3和9的待测密封继电器上,它们对应的待测集合中并没有被识别出存在多余物信号。因此,现有多余物信号与组件信号识别方法并不能判断出多余物信号的存在,因而给出的多余物检测结果是不存在多余物。显然,这是不正确的。这样看来,这些方法取得的检测精度仅为80%,并且它们对多余物信号的检测灵敏度较低。此外,编号为3、5、9、10的待测密封继电器对应的待测集合中均被识别出存在多个重叠信号。这也说明了开展重叠信号研究的重要性。因此,在真实应用场景下,依靠本发明提出的重叠信号识别方法进行多余物检测要比依靠只能识别单音信号的多余物检测方法更加准确和可靠,这充分凸显了开展本发明的必要性。
技术特征:
1.一种基于机器学习与置信率的密封继电器重叠信号识别方法,其特征在于所述方法包括如下步骤:步骤一:根据真实应用场景下从密封继电器中检测出的多余物的属性,制作密封继电器样本集一,并对样本分别进行编号,其中:不包含多余物但包含松动组件的样本的编号为0,不包含松动组件但包含第一种材质的多余物的样本的编号为1,不包含松动组件但包含第二种材质的多余物的样本的编号为2,
……
,不包含松动组件但包含第n种材质的多余物的样本的编号为n;步骤二:根据步骤一中的编号依次对密封继电器样本集一中的样本开展pind检测,分别获取并保存一段单音信号,在最后一个样本完成pind检测后,完整的一轮试验结束,得到多段单音信号;通过重复多轮试验,得到对应各样本的多段单音信号;步骤三:从多域提取适用的声音特征,建立声音特征库;对单音信号进行分帧处理与脉冲提取,从每个帧信号上计算特征数值,并添加标签,得到多条数据,其中:归属组件信号的数据的标签被设置为“0”,归属多余物信号的数据的标签被设置为“1”,由这两类标签的数据构建识别数据集;步骤四:分别在识别数据集上训练多个分类器,比较得出表现最好的分类器;借助网格搜索法,对该分类器的内部参数进行优化,使其分类性能达到最优,由此得到最优分类器,称为最优识别模型;步骤五:参考步骤一,制作密封继电器样本集二,并对样本分别进行编号,其中:同时包含第一种材质的多余物与松动组件的样本的编号为1,同时包含第二种材质的多余物与松动组件的样本的编号为2,
……
,同时包含第n种材质的多余物与松动组件的样本的编号为n;步骤六:根据步骤五中的编号依次对密封继电器样本集二中的样本开展pind检测,分别获取并保存一段重叠信号,在最后一个样本完成pind检测后,完整的一轮试验结束,得到多段重叠信号;通过重复多轮试验,得到对应各样本的多段重叠信号;步骤七:对重叠信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个重叠集合,由此构建多个重叠集合,分别命名为重叠集合1,重叠集合2,
……
,重叠集合n;步骤八:使用步骤四得到的最优识别模型分别对重叠集合进行预测,计算每个重叠集合中标签被预测为“0”的数据个数占总数据个数的比值,称为置信率,由此得到多个置信率;取所有置信率的下限,得到标准置信率;步骤九:对待测密封继电器开展pind检测,获取并保存一段待测信号;步骤十:对待测信号进行分帧处理与脉冲提取,从每个帧信号上计算步骤三中声音特征库的特征数值,得到多条不带标签的数据;属于同一个帧信号组合的多条不带标签的数据构建一个待测集合,由此构建多个待测集合,分别命名为待测集合1,待测集合2,
……
,待测集合n;步骤十一:使用步骤四得到的最优识别模型依次对待测集合进行预测,计算每个待测集合的置信率,由此得到多个置信率;依次比较当前计算的置信率与标准置信率,如果所有当前计算的置信率均大于标准置信率,则表明当前待测信号中不存在重叠信号,如果有大
于一个的当前计算的置信率小于标准置信率,则表明当前待测信号中存在重叠信号。2.根据权利要求1所述的基于机器学习与置信率的密封继电器重叠信号识别方法,其特征在于所述多域包括时域、频域、时频域、梅尔频率倒谱系数域、小包变换域、希尔伯特-黄变换、分形理论、混沌系统。3.根据权利要求1所述的基于机器学习与置信率的密封继电器重叠信号识别方法,其特征在于所述分类器包括k近邻、常规支持向量机、基于核函数的支持向量机、决策树、随机森林、xgboost、bp神经网络、循环神经网络、卷积神经网络。
技术总结
本发明公开了一种基于机器学习与置信率的密封继电器重叠信号识别方法,首先,以密封继电器样本集一为研究对象,通过数据获取、信号预处理、特征提取、数据集构建、模型训练、参数优化等步骤,训练一个最优识别模型。其次,以密封继电器样本集二为研究对象,通过数据获取、信号预处理、特征提取、重叠集合构建、置信率计算等步骤,得到一个标准置信率。最后,以待测密封继电器为研究对象,通过数据获取、信号预处理、特征提取等步骤,构建多个待测集合,利用最优识别模型分别进行预测。根据预测结果,计算多个待测集合的置信率,与标准置信率进行对比,综合分析后得到重叠信号识别结果。本发明有效提升了密封继电器多余物检测的可靠性。明有效提升了密封继电器多余物检测的可靠性。明有效提升了密封继电器多余物检测的可靠性。
技术研发人员:孙志刚 翟国富 王国涛 李鹏飞 梁琪 吕美萱
受保护的技术使用者:哈尔滨工业大学
技术研发日:2023.04.19
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
