一种基于神经网络的数据异常诊断方法和电子设备

未命名 09-18 阅读:140 评论:0


1.本发明涉及电子技术领域,具体涉及一种基于神经网络的数据异常诊断方法和电子设备。


背景技术:

2.监测数据不仅反映结构的真实状态,同时也是数值模拟、计算和有限元分析的输入值或参考值,数据质量直接影响结构变形估计和预测的准确性和精度。但监测系统常处于复杂环境中,传感器和采集设备容易受到恶劣环境、电磁干扰、人为破坏等因素影响,监测数据中不可避免出现大量异常数据。常见的数据异常包括离群值、缺失、漂移、超量程等。根据工程经验,数据异常产生的主要原因包括:无线传输系统数据丢包、工程机械运行时的电磁干扰、环境和电路噪声、传感器故障等。
3.实际监测中不同类型的数据异常有着迥然相异的特征,从某一种异常中提取的特征并不适用于其他异常类型。然而,基于实际工程监测数据的多类型异常检测的研究仍较少,基于深度学习神经网络的方法在处理海量监测数据时存在计算量大、耗时长的问题。并且,监测数据异常诊断效率低、不准确。


技术实现要素:

4.本技术实施例提供一种基于神经网络的数据异常诊断方法和电子设备,可:(1)通过特征提取将冗长原始样本转化为简短特征向量,显著提高了数据处理和网络训练的效率;(2)引入极坐标化aucs指标对多分类识别性能进行精确描述,提高了识别结果的可解释性,实现了高效率高精度的多类型数据异常检测。
5.第一方面,本技术实施例提供了一种基于神经网络的数据异常诊断方法,包括:
6.步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取所述9项特征组成特征向量,将所述时间序列样本转换为所述特征向量的样本;
7.步骤2:利用模式识别神经网络prnn,将所述特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型;
8.步骤3:使用训练集中带标签的所述特征向量样本训练所述prnn模型,得到最优网络,并利用测试集中去除标签的未知的所述特征向量样本进行数据异常诊断,得到所述未知的所述特征向量的异常分类结果;
9.步骤4:根据所述测试集中所述未知的所述特征向量的异常分类结果,计算表示所述prnn模型的数据异常诊断准确性的误差指标,对所述prnn模型的异常诊断性能进行评估。
10.第二方面,本技术实施例提供了一种电子设备,包括处理器、存储器和通信模块,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码来执行如下操作:
11.步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列
样本中提取所述9项特征组成特征向量,将所述时间序列样本转换为所述特征向量的样本;
12.步骤2:利用模式识别神经网络prnn,将所述特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型;
13.步骤3:使用训练集中带标签的所述特征向量样本训练所述prnn模型,得到最优网络,并利用测试集中去除标签的未知的所述特征向量样本进行数据异常诊断,得到所述未知的所述特征向量的异常分类结果;
14.步骤4:根据所述测试集中所述未知的所述特征向量的异常分类结果,计算表示所述prnn模型的数据异常诊断准确性的误差指标,并绘制极坐标化aucs曲线,对所述prnn模型的异常诊断性能进行评估。
15.第三方面,本技术实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面及其任一种可选方式的方法。
16.可以看出,本技术实施例提供的基于神经网络的数据异常诊断方法和电子设备,可实现:(1)通过特征提取将冗长原始样本转化为简短特征向量,显著提高了数据处理和网络训练的效率;(2)引入极坐标化aucs指标对多分类识别性能进行精确描述,提高了识别结果的可解释性,实现了高效率高精度的多类型数据异常检测。
附图说明
17.图1是本技术实施例提供的一种prnn结构示意图;
18.图2是本技术实施例提供的一种基于特征提取和模式识别神经网络的数据异常诊断方法的流程示意图;
19.图3是本技术实施例提供的一种基于特征提取和模式识别神经网络的数据异常诊断方法的示意框图;
20.图4是本技术实施例提供的一种prnn训练框架的结构示意图;
21.图5是本技术实施例提供的不同类型的加速度数据时间序列样本的示意图;
22.图6是本技术实施例提供的以混淆矩阵的形式展示网络训练阶段训练集样本的识别结果;
23.图7是本技术实施例提供的测试集样本的识别结果的混淆矩阵;
24.图8是本技术实施例提供的测试集样本识别结果的aucs曲线;
25.图9是本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
26.下面将结合附图,对本公开一些实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开的一部分实施例,而不是全部的实施例。基于本公开所提供的实施例,本领域普通技术人员所获得的所有其它实施例,都属于本公开保护的范围。
27.除非上下文另有要求,否则,在整个说明书和权利要求书中,术语“包括”被解释为开放、包含的意思,即为“包含,但不限于”。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单
元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在说明书的描述中,术语“一个实施例”、“一些实施例”、“示例性实施例”、“示例性地”或“一些示例”等旨在表明与该实施例或示例相关的特定特征、结构、材料或特性包括在本公开的至少一个实施例或示例中。上述术语的示意性表示不一定是指同一实施例或示例。此外,所述的特定特征、结构、材料或特点可以以任何适当方式包括在任何一个或多个实施例或示例中。
28.在描述一些实施例时,可能使用了“耦接”和“连接”及其衍伸的表达。倒如,描述一些实施例时可能使用了术语“连接”以表明两个或两个以上部件彼此间有直接物理接触或电接触。又如,描述一些实施例时可能使用了术语“耦接”以表明两个或两个以上部件有直接物理接触或电接触。然而,术语“耦接”也可能指两个或两个以上部件彼此间并无直接接触,但仍彼此协作或相互作用。这里所公开的实施例并不必然限制于本文内容。
29.为了更好地理解本发明实施例提供的一种基于神经网络的数据异常诊断方法和电子设备,下面先对本发明实施例使用的模式识别神经网络(pattern recognition neural networks,prnn)架构进行描述。
30.请参阅图1,图1是本技术实施例提供的一种prnn结构示意图,该prnn可由1个输入层101、1个隐藏层102和1个输出层103组成。
31.在一种可能的实施例中,输入层101可包含9个节点,对应9个特征指标;隐藏层102可包含150个节点;输出层103可包含6个节点,对应6类数据类型。
32.其中,神经网络可以是由神经单元组成的,神经单元可以是指以xs和截距1为输入的运算单元,该运算单元的输出可以为:
[0033][0034]
其中,s=1、2、
……
n,n为大于1的自然数,ws为xs的权重,b为神经单元的偏置。f为神经单元的激活函数(activation functions),用于将非线性特性引入神经网络中,来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入。激活函数可以是sigmoid函数。神经网络是将许多个上述单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。
[0035]
对于深度神经网络dnn来说,一般来说第一层是输入层,最后一层是输出层,中间的层数都是隐藏层。层与层之间是全连接的,也就是说,第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。
[0036]
输入层101:在深度神经网络中,更多的隐藏层102让深度神经网络更能够刻画现实世界中的复杂情形。参数越多的模型复杂度越高,模型能完成越复杂的任务。
[0037]
输入层101的输入向量可表征信度参数,例如本技术中的特征向量。
[0038]
隐藏层102:隐藏层102进行运算的过程,用于建立输入层101和输出层103之间的隐式映射关系。
[0039]
输出层103:输出层103可通过数据异常类型的标签实现。输出层103可输出出来输出结果。
[0040]
基于图1所示出的prnn结构示意图,本技术实施例提供一种基于特征提取和模式识别神经网络的数据异常诊断方法,可提高数据处理和网络训练的效率,并提高识别结果
的可解释性,实现高效率高精度的多类型数据异常检测。
[0041]
具体的,请参阅图2,图2是本技术实施例提供的一种基于特征提取和模式识别神经网络的数据异常诊断方法的流程示意图。如图2所示,该基于神经网络的数据异常诊断方法可包括:
[0042]
步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取9项特征组成特征向量,将时间序列样本转换为特征向量的样本。
[0043]
步骤2:利用模式识别神经网络prnn,将特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型。
[0044]
步骤3:使用训练集中带标签的特征向量样本训练prnn模型,得到最优网络,并利用测试集中去除标签的未知的特征向量样本进行数据异常诊断,得到未知的特征向量的异常分类结果。
[0045]
步骤4:根据测试集中未知的特征向量的异常分类结果,计算表示prnn模型的数据异常诊断准确性的误差指标,并绘制表示各数据类型之间分类精度的极坐标化aucs曲线,对prnn模型的异常诊断性能进行评估。
[0046]
下面结合图2和图3介绍本技术实施例提供的基于神经网络的数据异常诊断方法。图3是本技术实施例提供的一种基于神经网络的数据异常诊断方法的示意框图。
[0047]
针对不同数据异常的特点建立了特征指标集合,将冗长的时间序列样本转换为简短的特征向量样本;
[0048]
如图3所示,设计了模式识别神经网络(prnn)205,将特征向量作为网络输入层,输出层为数据异常类型的标签,隐藏层负责建立输入和输出之间的隐式映射关系;
[0049]
使用少量带标签的特征向量样本组成的训练集204训练prnn,然后对测试集210中的大量未知样本进行数据异常诊断。
[0050]
本方法可用于多种常见的结构监测数据,例如动态位移、加速度、动态应变等,显著提高了数据处理和网络训练的效率。本发明引入极坐标化aucs指标对多分类识别性能进行精确描述,提高识别结果的可解释性,以实现高效率高精度的多类型数据异常检测。
[0051]
根据以上条件,结合图3给出以下实现方式:
[0052]
所述步骤1进一步包括以下子步骤:
[0053]
步骤1.1:采用一时间尺度窗口对原始监测信号进行划分,得到一系列所述时间序列样本;
[0054]
步骤1.2:针对不同类型数据异常的结构和统计学特征,提出包含以下特征指标的所述特征指标集合对原始的所述时间序列样本进行描述,并得到所述特征向量的样本:空值率、峰值强度、波形因子、线性度、一阶斜率、等值率、过均值率、标准差和绝对中位差。
[0055]
根据该9项特征指标,得到特征向量样本集203。
[0056]
其中,(1.2.1):空值率指标用于识别数据缺失类异常,计算公式为:
[0057][0058]
式中,n
empty
表示一个样本中缺失数据点的数量,n
total
表示样本中数据点总数。
[0059]
(1.2.2):峰值强度表示离群值与正常值之间的分离程度,计算公式为:
[0060][0061]
式中,d
0.9
表示样本中90%的数据点所在的数据值上下界之间的距离,d
max
表示样本中所有数据点上下界距离。
[0062]
(1.2.3):波形因子是有效值与整流平均值的比值,用于描述峰值在数据样本波形中的极端程度,计算公式为:
[0063][0064]
式中,rms(x)为样本数据的均方根值,mean(|x|)表示样本数据绝对值的平均值。
[0065]
(1.2.4):线性拟合斜率gradient是指对所述样本中所有数据点进行线性拟合后所得拟合直线的斜率,该斜率表示基线漂移的程度;所述线性拟合采用最小二乘法;如果所述样本数据没有出现所述基线漂移,所述线性拟合斜率约等于0;当存在所述基线漂移时,所述线性拟合斜率在(-∞,+∞)范围内变化。
[0066]
(1.2.5)线性度指传感器校准曲线与拟合直线间的偏差绝对值的最大值与满量程输出范围之间的比值,计算公式为:
[0067][0068]
式中,max(|δxi|)为样本中所有数据点校准曲线与拟合直线之间偏差绝对值的最大值,x
max
和x
min
分别表示样本中的最大值和最小值。
[0069]
(1.2.6):过均值率是指相邻两数据点分布在样本均值线两侧的概率。当出现漂移时,漂移程度越严重,过均值率越低。计算公式为
[0070][0071]
式中,n
over
是样本中相邻数据点之间连线穿过样本均值线的次数。
[0072]
(1.2.7):重复率是指样本中出现次数最多的数据值的个数与样本数据点总数的比值。计算公式为
[0073][0074]
式中,n
equal
是样本中出现次数最多的数据值的个数。
[0075]
(1.2.8):标准差是样本数据点方差的算数平方根,计算公式为
[0076][0077]
式中sd表示标准差(standard deviation),xi是每个数据点的值,xa为样本均值,n是样本中数据点总数。
[0078]
(1.2.9):绝对中位差是指原数据减去中位数后得到的新数据的绝对值的中位数,不易受离群值影响,计算公式为
[0079]
mad=median(|x
i-median(x)|)
[0080]
式中,mad为绝对中位差,median(x)表示对样本x中的数据取中值。
[0081]
表1列出了9项特征指标及其主要作用。从时间序列样本中提取所述9项特征值,组成特征向量,从而用特征向量样本代替时间序列类样本。
[0082]
表1特征指标及其主要作用
[0083][0084][0085]
在本技术的一些实施例中,所述步骤2进一步包括以下子步骤:
[0086]
步骤2.1:在输入层中,9个特征指标作为输入,并在隐藏层中根据所构造的激励函数进行训练,得到各个特征的最优权重。在输出层中,由特征指标和最优权重得到的判断结果对数据样本进行分类;
[0087]
9个特征指标作为特征向量,并作为网络输入层。并在隐藏层中根据所构造的激励函数利用训练集204对模式识别神经网络prnn 205进行训练,得到各个特征的最优权重。
[0088]
步骤2.2:基于该隐藏层的前一个输入层的输入数据构造输入融合函数,第j个神经元的输入融合函数为
[0089][0090]
式中zj(x)是隐藏层第j个神经元的输入融合函数,x表示输入向量,xi是第i个特征指标的值,w
ji
是第i个特征指标对于第j个神经元的权重,bj是第j个神经元的偏差。n表示该隐藏层的上一个输入层的神经元个数,上角标m表示隐藏层的层数;其中,i、j为正整数;
[0091]
步骤2.3:基于输入融合函数zj(x),建立第j个神经元表示输入-输出间映射关系的激励函数。激励函数引入了非线性因子,因此网络能够对任何非线性函数进行近似,从而能够应用到非线性模型中。本文采用sigmoid激励函数,如下所示:
[0092]hj
=f(zj(x))
[0093]
步骤2.4:将隐藏层的输出结果作为输出层的输入,则输出层结果可以表示为:
[0094][0095]
式中,yi是输出层第i个神经元的融合输出结果,z
ji
是第i个特征指标的值,v
ji
是该
神经元中第i个特征指标的权重,r
ji
是输出偏差。
[0096]
步骤2.5:通过建立损失函数来评价所述输出层的预测结果和真实结果之间的差异,并由此得到同一层所述神经元之间的权重因子和偏差(wji,bj,vji,rji);对于prnn输出层的n个输出节点,以交叉熵作为损失函数,其表达式为:
[0097][0098]
式中,ti是分类结果的真实值,而yi是分类结果的预测值;
[0099]
步骤2.6:通过优化算法对损失函数进行最小化求解,可以确定每个神经元的权重系数和偏差,其表达式如下:
[0100][0101]
得到最优权重因子和偏差的参数后,并得到完整的所述prnn模型205。
[0102]
请参阅图4,图4是本技术实施例提供的一种prnn训练框架的结构示意图。图4的训练框架描述了步骤2.5和步骤2.6得到完整的所述prnn模型的过程。
[0103]
具体的,通过建立损失函数来评价所述输出层的预测结果和真实结果之间的差异,并由此得到同一层所述神经元之间的权重因子和偏差(wji,bj,vji,rji);
[0104]
通过优化算法对损失函数进行最小化求解,可以确定每个神经元的权重系数和偏差,得到最优权重因子和偏差的参数后,并得到完整的所述prnn模型。
[0105]
其中,图4所示出的输入层301、隐藏层302和输出层303可分别对应图1所示出的输入层101、隐藏层102和输出层103。
[0106]
在本技术的一些实施例中,所述步骤3进一步包括以下子步骤:
[0107]
步骤3.1:利用所述训练集中带有异常类型标签的特征向量样本进行prnn的训练,得到训练好的所述最优网络;
[0108]
步骤3.2:利用prnn对所述测试集中不带标签的未知的所述特征向量样本进行数据异常诊断,得到未知样本的异常诊断分类标签;
[0109]
步骤3.3:将未知的所述特征向量样本的诊断标签与其真实标签进行对比,并计算表示诊断准确性的误差指标,包括查全率(recall)、查准率(precision)、受试者工作特征(receiver operating characteristic简称roc)曲线,和roc曲线下面积(auc),各所述误差指标表达式分别为:
[0110][0111]
式中,tp为被正确识别的真样本数量,fn为被错误识别的真样本数量,fp为其他类型的样本被错误识别为该类型的样本数量;
[0112]
roc曲线表示每两种数据类型之间的分类性能,曲线的纵轴为查全率recall,横轴为(1-precision);roc曲线与横坐标轴之间的面积为auc值(0《auc《1);
[0113]
步骤3.4:测试集中包含n种数据类型m={m1,m2,
……mn
},每两种类型之间属于二分类(mi,mj,i≠j),则n种数据类型的多分类问题则包含种二分类情况;
[0114]
步骤3.5:计算每种二分类情况下的recall和precision,然后得到该情况下的roc
曲线和auc值,计算每种二分类情况的auc值,记为auc(i,j),其中i≠j。极坐标角度设置为2π=360
°
,将其等角度划分为q份,每个等角线表示一种二分类情况。将每种情况对应的auc(i,j)值绘制在极坐标中,并按顺时针方向将各点相连,得到极坐标化aucs曲线。
[0115]
步骤3.6:通过aucs曲线对数据异常的诊断效果进行评估,以优化所述prnn的网络参数得到所述最优网络。
[0116]
通过aucs曲线,利用测试集210,测试模式识别神经网络,即初步训练完成的prnn,以进行数据异常检测207。
[0117]
通过数据异常检测207检测出的异常,对prnn进行性能评估208。通过该性能评估208,返回优化prnn 205的网络参数。优化prnn 205的网络参数可包括隐藏层层数和隐藏层节点数。
[0118]
通过训练和测试的回路,得到最优的prnn 209。
[0119]
本技术实施例提供的基于特征提取和模式识别神经网络的数据异常诊断方法有益效果是:(1)通过特征提取将冗长原始样本转化为简短特征向量,显著提高了数据处理和网络训练的效率;(2)引入极坐标化aucs指标对多分类识别性能进行精确描述,提高了识别结果的可解释性,实现了高效率高精度的多类型数据异常检测。
[0120]
下面对上述基于特征提取和模式识别神经网络的数据异常诊断方法进行举例说明。
[0121]
数据来源于某结构健康监测系统,数据集由结构振动加速度数据样本构成。数据采样频率为50hz,单个样本的时长为5分钟,单个样本包含50
×
60
×
5=15000个数据点。按照6种数据类型为每个样本进行分类并打上标签,并将该标签作为样本所属类型的基准值。数据集总样本个数为9698,其中正常样本个数为5786,数据异常样本个数为3912。
[0122]
请参阅图5,图5是本技术实施例提供的不同类型加速度数据时间序列的典型样本的示意图。如图5所示,图5中展示了数据集中6种不同类型的时间序列数据样本。数据缺失是指样本中的部分数据在传输过程中由于信号中断或丢包等原因未能被采集设备接收。离群值是指样本中存在一个或多个远离正常信号范围的数据点,其产生原因一般为信号受到瞬时干扰或传感器故障。数据漂移异常表现为在正常信号中包含了缓慢无规律的低频变化,且该变化的量级大于正常信号变化范围,漂移主要是受传感器自身结构参数影响和周围环境变化(如温度漂移)而产生。次小值是指传感器对外界变化无反应,信号只在一个微小范围内波动,其可能原因是传感器故障或对应的采集通道故障。信号发生持续超量程现象属于传感器损坏故障造成的异常。表2中显示了数据集中不同类型样本的个数以及占总样本数的百分比,异常样本中“漂移”样本最多,占样本总量的18.0%;“离群值”样本最少,占总量的2.2%。由表可知,测试集中不同类型的样本数量相差较大,存在类间不平衡问题。
[0123]
计算每个时间序列样本的9项特征指标,得到该样本的特征向量,用特征向量样本替代时间序列样本进行prnn训练和未知数据样本的异常诊断。
[0124]
表2各类样本数量和所占比例
[0125][0126]
在本技术的一些实施例中,从总样本中随机选取2400个(24.7%)带标签样本作为训练集,另7298个(75.3%)样本不带标签作为测试集。先利用训练集对设计的prnn进行训练,然后用训练后的prnn对测试集中的样本进行识别和分类,并将识别结果与样本原始标签进行比较,以得到最优网络。
[0127]
图6是本技术实施例提供的以混淆矩阵的形式展示网络训练阶段训练集样本的识别结果。混淆矩阵的每一列表示某类数据样本被正确识别的情况,这一列底部的百分数为该类型所有样本被正确识别的比例,称为查全率。例如,第1列第1行显示965个真实“正常”样本被正确识别,第1列第4行显示有7个“正常”样本被错误识别为“离群值”类型,第1列底部显示“正常”样本的查全率为99.0%。混淆矩阵的每一行则表示某一数据类型识别结果的准确概率,称为查准率。例如,第4行显示共有62个样本被识别为“离群值”类型,其中53个样本为真“离群值”样本,占比85.5%,说明未知样本被识别为“离群值”类型时正确的概率为85.5%。混淆矩阵右下角显示训练集的总体识别精度为98.7%。
[0128]
图7是本技术实施例提供的测试集样本的识别结果的混淆矩阵。每种数据类型的查全率均在92%以上,其中“正常”、“缺失”、“超量程”和“漂移”四种异常的查全率几乎为100%;每种类型的查准率基本大于98%。矩阵最右下角显示综合了查全率和查准率的总体识别精度为99.7%。
[0129]
图8是本技术实施例提供的测试集样本识别结果的aucs曲线,该曲线显示每两种类型之间的auc值几乎都为1,说明训练得到的prnn网络对不同数据类型的分类性能都接近最理想状态,且不受样本比例的影响,具有较好的无偏性。
[0130]
在计算效率方面,实际测试过程中本方法将所有9698个原始数据样本转换为特征向量样本并进行训练和异常识别总用时仅330s,而对于类似容量的异常数据样本,其他方法的计算用时在数小时左右。
[0131]
因此,上述健康监测系统示例中,(1)通过特征提取将冗长原始样本转化为简短特征向量,显著提高了数据处理和网络训练的效率;(2)引入极坐标化aucs指标对多分类识别性能进行精确描述,提高了识别结果的可解释性,实现了高效率高精度的多类型数据异常检测。
[0132]
请参阅图9,图9是本技术实施例提供的一种电子设备的结构示意图。如图9所示,电子设备200至少可以包括:
[0133]
至少一个处理器501,至少一个网络接口504,用户接口503,存储器505,至少一个通信总线502。
[0134]
其中,通信总线502用于实现这些组件之间的连接通信。
[0135]
其中,用户接口503可以包括显示屏(display)、摄像头(camera)中一者或多者,可选的,用户接口503还可以包括标准的有线接口、无线接口。
[0136]
其中,网络接口504可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
[0137]
其中,处理器501可以包括一个或者多个处理核心。处理器501利用各种接口和线路连接整个电子设备200内的各个部分,通过运行或执行存储在存储器505内的指令、程序、代码集或指令集,以及调用存储在存储器505内的数据,执行电子设备200的各种功能和处理数据。
[0138]
可选的,处理器501可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器501可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器501中,单独通过一块芯片进行实现。
[0139]
其中,存储器505可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。可选的,该存储器505包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器505可用于存储指令、程序、代码、代码集或指令集。存储器505可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器505可选的还可以是至少一个位于远离前述处理器501的存储装置。如图9所示,作为一种计算机存储介质的存储器505中可以包括操作系统、网络通信模块、用户接口模块。
[0140]
在图9所示的电子设备200中,用户接口503主要用于为用户提供输入的接口,获取用户输入的数据;而处理器501可以用于调用存储器505中存储的应用程序,并具体执行程序操作。
[0141]
在本技术的一些实施例中,当所述一个或多个处理器执行所述计算机指令时,使得所述电子设备执行如下操作:
[0142]
步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取所述9项特征组成特征向量,将所述时间序列样本转换为所述特征向量的样本;
[0143]
步骤2:利用模式识别神经网络prnn,将所述特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型;
[0144]
步骤3:使用训练集中带标签的所述特征向量样本训练所述prnn模型,得到最优网络,并利用测试集中去除标签的未知的所述特征向量样本进行数据异常诊断,得到所述未知的所述特征向量的异常分类结果;
[0145]
步骤4:根据所述测试集中所述未知的所述特征向量的异常分类结果,计算表示所
述prnn模型的数据异常诊断准确性的误差指标,对所述prnn模型的异常诊断性能进行评估。
[0146]
可以理解的,上述对基于神经网络的数据异常诊断方法和电子设备的具体的实现的举例仅用于解释本技术实施例,不应构成限定。还可以采用其他的实现方式。
[0147]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述图2所示实施例中的一个或多个步骤。上述电子设备的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中。
[0148]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(digital versatile disc,dvd))、或者半导体介质(例如,固态硬盘(solid state disk,ssd))等。
[0149]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:制度存储器(read only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可存储程序代码的介质。在不冲突的情况下,本实施例和实施方案中的技术特征可以任意组合。
[0150]
以上所述的实施例仅仅是本技术的优选实施例方式进行描述,并非对本技术的范围进行限定,在不脱离本技术的设计精神的前提下,本领域普通技术人员对本技术的技术方案作出的各种变形及改进,均应落入本技术的权利要求书确定的保护范围内。
[0151]
以上对本发明实施例公开的基于神经网络的数据异常诊断方法和电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种基于神经网络的数据异常诊断方法,其特征在于,包括:步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取所述9项特征组成特征向量,将所述时间序列样本转换为所述特征向量的样本;步骤2:利用模式识别神经网络prnn,将所述特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型;步骤3:使用训练集中带标签的所述特征向量样本训练所述prnn模型,得到最优网络,并利用测试集中去除标签的未知的所述特征向量样本进行数据异常诊断,得到所述未知的所述特征向量样本的异常分类结果;步骤4:根据所述测试集中所述未知的所述特征向量样本的异常分类结果,计算表示所述prnn模型的数据异常诊断准确性的误差指标,并绘制表示各数据类型之间分类精度的极坐标化aucs曲线,对所述prnn模型的异常诊断性能进行评估。2.如权利要求1所述的方法,其特征在于,所述步骤1进一步包括:步骤1.1:采用一时间尺度窗口对原始监测信号进行划分,得到一系列所述时间序列样本;步骤1.2:针对不同类型数据异常的结构和统计学特征,提出包含以下特征指标的所述特征指标集合对原始的所述时间序列样本进行描述,并得到所述特征向量的样本:空值率、峰值强度、波形因子、线性度、一阶斜率、等值率、过均值率、标准差和绝对中位差。3.根据权利要求2所述的方法,其特征在于,所述空值率指标用于识别数据缺失类异常,计算公式为:式中,n
empty
为一个时间序列样本中缺失数据点的数量,n
total
为所述样本中数据点总数;所述峰值强度表示离群值与正常值之间的分离程度,计算公式为:式中,d
0.9
为所述样本中90%的数据点所在的数据值上下界之间的距离,d
max
为所述样本中所有数据点上下界距离;所述波形因子是有效值与整流平均值的比值,用于描述峰值在样本波形中的极端程度,计算公式为:式中rms(x)为所述样本的均方根值,mean(|x|)为所述时间序列样本数据绝对值的平均值;线性拟合斜率gradient是指对所述样本中所有数据点进行线性拟合后所得拟合直线的斜率,该斜率表示基线漂移的程度;所述线性拟合采用最小二乘法;如果所述样本数据没有出现所述基线漂移,所述线性拟合斜率约等于0;当存在所述基线漂移时,所述线性拟合斜率在(-∞,+∞)范围内变化;
所述线性度指传感器校准曲线与所述拟合直线间的偏差绝对值的最大值与满量程输出范围之间的比值,计算公式为:式中,max(|δx
i
|)为所述样本中所有数据点校准曲线与所述拟合直线之间偏差绝对值的最大值,x
max
和x
min
分别为所述样本中的最大值和最小值;所述过均值率是指时间序列样本中相邻两数据点分布在样本均值线两侧的概率;当出现漂移时,漂移程度越严重,过均值率越低;所述过均值率的计算公式为:式中,n
over
为所述样本中相邻数据点之间连线穿过所述样本均值线的次数;重复率是指所述样本中出现次数最多的数据值的个数与样本数据点总数的比值,计算公式为:式中,n
equal
为样本中出现次数最多的数据值的个数;所述标准差是所述样本数据点方差的算数平方根,计算公式为:式中,sd为标准差,x
i
为每个所述数据点的值,x
a
为样本均值,n为所述样本中数据点总数;所述绝对中位差是指时间序列样本中的数据全部减去该样本中位数后得到的新数据的绝对值的中位数,计算公式为mad=median(|x
i-median(x)|)式中,mad为所述绝对中位差,median(x)为对所述样本x中的数据取中值。4.根据权利要求3所述的方法,其特征在于,所述步骤2进一步包括:步骤2.1:在所述输入层中,多个所述特征指标作为输入,并在所述隐藏层中根据所构造的激励函数进行训练,得到各个所述特征指标的最优权重;在所述输出层中,由所述特征指标和所述最优权重得到的判断结果对所述特征向量样本进行分类;步骤2.2:基于所述隐藏层的前一个所述输入层的输入数据构造输入融合函数,第j个神经元的所述输入融合函数为式中,z
j
(x)为隐藏层第j个神经元的输入融合函数,x为输入向量,x
i
为第i个所述特征指标的值,w
ji
为第i个所述特征指标对于所述第j个神经元的权重,b
j
为所述第j个神经元的偏差;n为所述隐藏层的上一个所述输入层的神经元个数,上角标m表示所述隐藏层的层数;其中,i、j为正整数;步骤2.3:基于所述输入融合函数z
j
(x),建立所述第j个神经元表示输入-输出间映射关
系的所述激励函数,所述激励函数引入非线性因子,因此网络能够对任何非线性函数进行近似,从而能够应用到非线性模型中;采用sigmoid激励函数,如下所示:步骤2.4:将所述隐藏层的输出结果作为所述输出层的输入,所述输出层结果表示为:式中,y
i
为所述输出层第i个神经元的融合输出结果,z
ji
为第i个所述特征指标的值,v
ji
为所述第j个神经元中第i个特征指标的权重,r
ji
为输出偏差;步骤2.5:通过建立损失函数来评价所述输出层的预测结果和真实结果之间的差异,并由此得到同一层所述神经元之间的权重因子和偏差(w
ji
,b
j
,v
ji
,r
ji
);对于所述prnn的所述输出层的n个输出节点,以交叉熵作为损失函数,表达式为:式中,t
i
为分类结果的真实值,y
i
为分类结果的预测值;步骤2.6:通过优化算法对所述损失函数进行最小化求解,以确定每个所述神经元的权重系数和偏差,表达式如下:得到最优权重因子和偏差的参数,并得到完整的所述prnn模型。5.根据权利要求4所述的方法,其特征在于,所述步骤3进一步包括:步骤3.1:利用所述训练集中带有异常类型标签的特征向量样本进行prnn的训练,得到训练好的所述最优网络;步骤3.2:利用prnn对所述测试集中不带标签的未知的所述特征向量样本进行数据异常诊断,得到未知样本的异常诊断分类标签;步骤3.3:将未知的所述特征向量样本的诊断标签与其真实标签进行对比,并计算表示诊断准确性的误差指标,包括查全率recall、查准率precision、受试者工作特征roc曲线,和roc曲线下面积auc,各所述误差指标表达式分别为:式中,tp为被正确识别的真样本数量,fn为被错误识别的真样本数量,fp为其他类型的样本被错误识别为该类型的样本数量;所述roc曲线表示每两种数据类型之间的分类性能,所述roc曲线的纵轴为所述查全率recall,横轴为1-precision;所述roc曲线与所述横轴之间的面积为所述auc值(0<auc<1);步骤3.4:所述测试集中包含n种数据类型m={m1,m2,
……
m
n
},每两种类型之间属于二分类(m
i
,m
j
,i≠j),则n种数据类型的多分类问题则包含q=c
n2
种二分类情况;步骤3.5:计算每种所述二分类情况下的所述查全率recall和所述查准率precision,然后得到该情况下的所述roc曲线和所述auc值,计算每种所述二分类情况的所述auc值,记
为auc(i,j),其中i≠j,极坐标角度设置为2π=360
°
,将其等角度划分为q份,每个等角线表示一种二分类情况,将每种情况对应的所述auc(i,j)值绘制在所述极坐标中,并按顺时针方向将各点相连,得到极坐标化aucs曲线;步骤3.6:通过所述aucs曲线对数据异常的诊断效果进行评估,以优化所述prnn的网络参数得到所述最优网络。6.一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器、存储器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;所述处理器用于调用所述程序代码来执行如下操作:步骤1:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取所述9项特征组成特征向量,将所述时间序列样本转换为所述特征向量的样本;步骤2:利用模式识别神经网络prnn,将所述特征向量作为网络的输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立prnn模型;步骤3:使用训练集中带标签的所述特征向量样本训练所述prnn模型,得到最优网络,并利用测试集中去除标签的未知的所述特征向量样本进行数据异常诊断,得到所述未知的所述特征向量的异常分类结果;步骤4:根据所述测试集中所述未知的所述特征向量的异常分类结果,计算表示所述prnn模型的数据异常诊断准确性的误差指标,并绘制极坐标化aucs曲线,对所述prnn模型的异常诊断性能进行评估。7.根据权利要求6所述的电子设备,其特征在于,所述处理器,具体用于调用所述程序代码来执行如下操作:步骤1.1:采用一时间尺度窗口对原始监测信号进行划分,得到一系列所述时间序列样本;步骤1.2:针对不同类型数据异常的结构和统计学特征,提出包含以下特征指标的所述特征指标集合对原始的所述时间序列样本进行描述,并得到所述特征向量的样本:空值率、峰值强度、波形因子、线性度、一阶斜率、等值率、过均值率、标准差和绝对中位差。8.根据权利要求7所述的电子设备,其特征在于,所述空值率指标用于识别数据缺失类异常,计算公式为:式中,n
empty
为一个时间序列样本中缺失数据点的数量,n
total
为所述样本中数据点总数;所述峰值强度表示离群值与正常值之间的分离程度,计算公式为:式中,d
0.9
为所述样本中90%的数据点所在的数据值上下界之间的距离,d
max
为所述样本中所有数据点上下界距离;所述波形因子是有效值与整流平均值的比值,用于描述峰值在样本波形中的极端程度,计算公式为:
式中rms(x)为所述样本的均方根值,mean(|x|)为所述时间序列样本数据绝对值的平均值;线性拟合斜率gradient是指对所述样本中所有数据点进行线性拟合后所得拟合直线的斜率,该斜率表示基线漂移的程度;所述线性拟合采用最小二乘法;如果所述样本数据没有出现所述基线漂移,所述线性拟合斜率约等于0;当存在所述基线漂移时,所述线性拟合斜率在(-∞,+∞)范围内变化;所述线性度指传感器校准曲线与所述拟合直线间的偏差绝对值的最大值与满量程输出范围之间的比值,计算公式为:式中,max(|δx
i
|)为所述样本中所有数据点校准曲线与所述拟合直线之间偏差绝对值的最大值,x
max
和x
min
分别为所述样本中的最大值和最小值;所述过均值率是指时间序列样本中相邻两数据点分布在样本均值线两侧的概率;当出现漂移时,漂移程度越严重,过均值率越低;所述过均值率的计算公式为:式中,n
over
为所述样本中相邻数据点之间连线穿过所述样本均值线的次数;重复率是指所述样本中出现次数最多的数据值的个数与样本数据点总数的比值,计算公式为:式中,n
equal
为样本中出现次数最多的数据值的个数;所述标准差是所述样本数据点方差的算数平方根,计算公式为:式中,sd为标准差,x
i
为每个所述数据点的值,x
a
为样本均值,n为所述样本中数据点总数;所述绝对中位差是指时间序列样本中的数据全部减去该样本中位数后得到的新数据的绝对值的中位数,计算公式为mad=median(|x
i-median(x)|)式中,mad为所述绝对中位差,median(x)为对所述样本x中的数据取中值。9.根据权利要求8所述的电子设备,其特征在于,所述处理器,具体用于调用所述程序代码来执行如下操作:步骤2.1:在所述输入层中,多个所述特征指标作为输入,并在所述隐藏层中根据所构造的激励函数进行训练,得到各个所述特征指标的最优权重;在所述输出层中,由所述特征
指标和所述最优权重得到的判断结果对所述特征向量样本进行分类;步骤2.2:基于所述隐藏层的前一个所述输入层的输入数据构造输入融合函数,第j个神经元的所述输入融合函数为式中,z
j
(x)为隐藏层第j个神经元的输入融合函数,x为输入向量,x
i
为第i个所述特征指标的值,w
ji
为第i个所述特征指标对于所述第j个神经元的权重,b
j
为所述第j个神经元的偏差;n为所述隐藏层的上一个所述输入层的神经元个数,上角标m表示所述隐藏层的层数;其中,i、j为正整数;步骤2.3:基于所述输入融合函数z
j
(x),建立所述第j个神经元表示输入-输出间映射关系的所述激励函数,所述激励函数引入非线性因子,因此网络能够对任何非线性函数进行近似,从而能够应用到非线性模型中;采用sigmoid激励函数,如下所示:步骤2.4:将所述隐藏层的输出结果作为所述输出层的输入,所述输出层结果表示为:式中,y
i
为所述输出层第i个神经元的融合输出结果,z
ji
为第i个所述特征指标的值,v
ji
为所述第j个神经元中第i个特征指标的权重,r
ji
为输出偏差;步骤2.5:通过建立损失函数来评价所述输出层的预测结果和真实结果之间的差异,并由此得到同一层所述神经元之间的权重因子和偏差(w
ji
,b
j
,v
ji
,r
ji
);对于所述prnn的所述输出层的n个输出节点,以交叉熵作为损失函数,表达式为:式中,t
i
为分类结果的真实值,y
i
为分类结果的预测值;步骤2.6:通过优化算法对所述损失函数进行最小化求解,以确定每个所述神经元的权重系数和偏差,表达式如下:得到最优权重因子和偏差的参数,并得到完整的所述prnn模型。10.根据权利要求9所述的电子设备,其特征在于,所述处理器,具体用于调用所述程序代码来执行如下操作:步骤3.1:利用所述训练集中带有异常类型标签的特征向量样本进行prnn的训练,得到训练好的所述最优网络;步骤3.2:利用prnn对所述测试集中不带标签的未知的所述特征向量样本进行数据异常诊断,得到未知样本的异常诊断分类标签;步骤3.3:将未知的所述特征向量样本的诊断标签与其真实标签进行对比,并计算表示诊断准确性的误差指标,包括查全率recall、查准率precision、受试者工作特征roc曲线,
和roc曲线下面积auc,各所述误差指标表达式分别为:式中,tp为被正确识别的真样本数量,fn为被错误识别的真样本数量,fp为其他类型的样本被错误识别为该类型的样本数量;所述roc曲线表示每两种数据类型之间的分类性能,所述roc曲线的纵轴为所述查全率recall,横轴为1-precision;所述roc曲线与所述横轴之间的面积为所述auc值(0<auc<1);步骤3.4:所述测试集中包含n种数据类型m={m1,m2,
……
m
n
},每两种类型之间属于二分类(m
i
,m
j
,i≠j),则n种数据类型的多分类问题则包含q=c
n2
种二分类情况;步骤3.5:计算每种所述二分类情况下的所述查全率recall和所述查准率precision,然后得到该情况下的所述roc曲线和所述auc值,计算每种所述二分类情况的所述auc值,记为auc(i,j),其中i≠j,极坐标角度设置为2π=360
°
,将其等角度划分为q份,每个等角线表示一种二分类情况,将每种情况对应的所述auc(i,j)值绘制在所述极坐标中,并按顺时针方向将各点相连,得到极坐标化aucs曲线;步骤3.6:通过所述aucs曲线对数据异常的诊断效果进行评估,以优化所述prnn的网络参数得到所述最优网络。

技术总结
本申请公开了一种基于神经网络的数据异常诊断方法和电子设备。其中,该方法包括:针对不同数据异常的特点建立包含9项特征的特征指标集合,从时间序列样本中提取9项特征组成特征向量,将时间序列样本转换为特征向量的样本;将特征向量作为网络输入层,将数据异常类型的标签作为输出层,并利用隐藏层建立输入和输出之间的隐式映射关系,建立PRNN模型;使用带标签的特征向量样本训练PRNN模型,并利用去除标签的未知的所述特征向量样本进行数据异常诊断,得到异常分类结果;根据测试集中未知的特征向量的异常分类结果,计算误差指标,绘制极坐标化AUCs曲线,对异常诊断性能进行评估。实施本申请实施例,可提高网络训练的效率和异常检测的精度、效率。效率。效率。


技术研发人员:高珂 翁顺 陈志丹 朱宏平 夏勇 高飞 张俊树 罗浩 李佐强 吴俐滢 张之越 彭艇钧
受保护的技术使用者:华中科技大学
技术研发日:2023.06.15
技术公布日:2023/9/7
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐