一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法

未命名 08-27 阅读:117 评论:0

一种基于朴素贝叶斯算法的sofc系统故障几率预测方法
技术领域
1.本发明属于sofc系统故障预测领域,具体涉及一种基于朴素贝叶斯算法的sofc系统故障几率预测方法。


背景技术:

2.sofc系统运行过程中时常发生故障,使得其性能产生退化,严重的话,甚至会导致燃料电池的失效,这成为了限制sofc系统发展的一个主要原因。而发电过程中许多参数都会对故障发生产生影响,比如电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度等。通过及时掌握sofc系统运行时的这些数据变化情况,采取合理的故障预测方法判断出故障发生的概率,则可及时安排对sofc系统设备进行维护,有利于延长其使用寿命。
3.朴素贝叶斯方法发源于古典理论,该方法对数据的处理学习效率高,且对数据缺失不敏感,通过该方法对sofc系统数据处理从而进行故障预测具有良好的应用前景。


技术实现要素:

4.为了克服现有故障预测方法的不足与局限性,造成相关技术人员无法对相应的故障参数进行控制,使得故障难以控制、反复发生的问题,本发明提出了一种基于朴素贝叶斯算法的sofc系统故障几率预测方法。该方法通过获取实时系统参数值作为特征输入,以建立的朴素贝叶斯模型分类计算出的sofc系统故障概率作为特征输出进行判断,在进行补救决策时具有较好的现实指导意义。
5.为了实现上述目的,一种基于朴素贝叶斯算法的sofc系统故障几率预测方法,具体实施步骤如下:
6.1)收集训练集数据,从某sofc系统的历史数据库中提取历史开发数据并进行预处理,即数据的elt清洗,数据平滑去噪,数据的归一化处理,将预处理后的各参数数据进行多段随机抽样,按照预设比例8:2形成训练集与测试集;
7.2)从训练集数据中确定特征属性与输出类别空间:
8.2-1)确定的特征属性为sofc系统故障参数数据,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度;
9.2-2)根据确定的特征属性,依次将以上特征属性的取值记为αi,电堆电压记为α1,电堆电流密度为α2,空气流量为α3,氢气流量为α4,旁路流量为α5,热交换器入口空气温度记为α6,混合器入口空气温度记为α7,电堆入口空气温度记为α8,燃烧室入口空气温度记为α9,热交换器入口燃料温度记为α
10
,电堆入口燃料温度记为α
11
,燃烧室入口燃料温度记为α
12

燃烧室出口烟气温度记为α
13
,热交换器出口烟气温度记为α
14
,热交换器最高温度记为α
15
,燃烧室最高温度记为α
16
,确定特征属性的取值为朴素贝叶斯模型的特征输入,以上确定的特征属性取值记为向量x=(α1,α2,α3,α4lα
15

16
);
10.2-3)确定以特征属性取值相应计算得到的sofc系统故障概率为朴素贝叶斯模型的特征输出,用y表征输出类别训练元组,记y=(g1,g2),其中g1表示未发生故障,g2表示发生故障,用|g
k,y
|表示y中类gk的训练个数。
11.3)利用训练集进行半监督学习训练,建立朴素贝叶斯模型:
12.3-1)由训练集样本统计各特征属性取值先验概率p(x=αi)(i=1,2l 16)和分类类别的先验概率p(y=gk)(k=1,2),类的先验概率可以采用下式求得:
[0013][0014]
其中|g
k,y
|是y中类gk的训练元组数,|y|为输出类别总的训练元组数;
[0015]
3-2)学习计算条件概率p(x=α|y=gk);
[0016]
3-3)计算每个特征属性的联合概率p(y=gk|x=αi):
[0017][0018]
其中,p(y|x)为故障几率类别的后验概率,p(y=gk)为类gk的先验概率,p(x)为特征概率,p(x|y=gk)表示gk类别中x的条件概率;
[0019]
4)采用测试集对训练结果进行验证;
[0020]
5)朴素贝叶斯模型的实际运用获取sofc系统实际参数数据输入该朴素贝叶斯模型,获取相应的sofc系统故障发生几率;
[0021]
由朴素贝叶斯算法模型,可以计算以故障发生与否的概率作为特征输出的后验概率,将后续sofc系统的实时参数数据输入该模型进行预测分析:
[0022]
5-1)获取实时sofc系统参数数据输入模型,计算各类的p(x|gk)p(gk),则基于特征故障参数αi分类到gk的条件如下:
[0023]
p(x|gk)p(gk)>p(x|gm)p(gm)(k≠m)
[0024]
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
[0025][0026]
即基于特征故障参数x被划分到p(x|gk)p(gk)几率较大的类gk。
[0027]
进一步的,所述步骤3)中计算条件概率p(x|y)时,当特征属性值αi为连续型特征值,在实例中通常取αi的先验概率为正态分布,此时的条件分布为:
[0028][0029]
其中μk和是特征属性取值满足正态分布的期望和方差,μk为训练集类别gk中,所有αi的平均值,为训练集类别gk中,所有αi的方差,为训练集中特征输入取值;
[0030]
当特征属性取值αi为离散值,如特征属性为空气流量时,则条件概率p(αi|gk):
[0031][0032]
其中是训练集中y元组属性αi的gk类的训练个数,为y中gk类训练个数;
[0033]
除了区分特征属性属于离散值还是连续值外,由于sofc系统参数之间相互产生影响,在本发明实施方案中,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的故障机理分类器的泛化性能;
[0034]
由此当特征属性为离散值时的组合特征联合条件概率为:
[0035][0036]
其中,为故障类别gk中第i号和第j号特征取值的个数,为y中gk类的训练个数;
[0037]
当特征属性取值为连续值时:
[0038][0039]
其中α为满足特征属性i号和j号的取值区间,μk和是特征属性取值α满足正态分布的期望和方差,μk为训练集类别gk中,所有α的平均值,为训练集类别gk中,所有α的方差;
[0040]
进一步的,所述步骤3)中在一个可选的实例中,由朴素贝叶斯模型得到的各特征属性的联合概率因为分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是相对独立的,所以其联合概率可简化为计算:
[0041][0042]
当上述两两特征组合的方法求取条件概率,则相应的后验概率为简化计算:
[0043][0044]
由该朴素贝叶斯算法模型,可以计算以sofc系统故障概率作为特征输出的后验概率,将后续sofc系统的实时参数数据输入该朴素贝叶斯模型进行预测分析,得到新sofc系统基于确定的故障参数的实时故障发生几率,根据相应的故障几率实时调整sofc系统参数取值,采取合理的补救决策从而指导系统的继续运行。
[0045]
本发明的有益效果是:本发明针对目前sofc系统故障预测几率研究不足的情况,开展了sofc系统故障几率研究,提出了结合历史数据进行故障几率预测的方法。对于历史的经验数据,主要是采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值
时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用验证集进行验证,将实时sofc系统参数数据输入模型获取相应的故障几率大小。
附图说明
[0046]
为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
[0047]
图1是sofc系统历史数据预处理框图;
[0048]
图2是基于朴素贝叶斯算法的故障概率预测流程图。
具体实施方式
[0049]
为了使本技术领域的人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
[0050]
1)图1为本发明技术方案中的sofc系统历史数据预处理框图,如图1所示,在本发明的实施方案中,可用于进行故障预测的sofc系统历史数据都储存在软件数据库中。在用朴素贝叶斯算法建立分类模型从而对测量数据进行挖掘与学习之前,需要对测量数据进行数据预处理;
[0051]
在本发明的实施方案中,上述的数据预处理包括:
[0052]
1-1)对历史测量数据进行elt清洗(即数据的抽取,加载,转换),将其处理为可供机器学习模型(即朴素贝叶斯算法)处理的结构化数据;
[0053]
1-2)采用噪声数据平滑技术对数据进行去噪处理,数据平滑去噪采用按平均值平滑的方法,即对同一类值中的数据求平均值,用平均值替代该类中的所有数据,减少噪声数据对数据的干扰影响;
[0054]
1-3)数据预处理的归一化处理,本发明方案采用l2范数归一化,l2范数归一化方法使得数据标准统一化,提高数据的可比性,削弱数据的解释性,在后续应用中可以提高模型的收敛速度与精度。l2范数归一化通过将多组数据转化为无单位的分值,适用于对离散数据的处理,即将属性的原始数据通过l2范数归一化标准化为α’;
[0055]
1-4)在本发明实施方案中,基于sofc系统故障发生参数采用朴素贝叶斯算法的sofc系统故障几率预测模型是一个半监督学习的过程。为避免数据划分带来的额外误差而对最终的分类结果准确性产生影响,划分数据应注意保持数据分布的一致性,同时为了保证数据的代表性,划分数据采用多段随机抽样的方式划分为训练集和测试集,将上述预处理后的sofc系统故障参数数据进行多段随机抽样,并按照预设比例8:2划分成训练集和测试集;
[0056]
2)图2是基于朴素贝叶斯算法的sofc系统故障几率预测流程图,如图2所示,在本
发明方案的具体实施案例中,数据收集与预处理后的sofc系统数据参数包含16个可用特征属性,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度,输出类别空间y包含两个输出类别,即未发生故障和发生故障;
[0057]
2-1)将特征属性的取值记为αi,依次将电堆电压记为α1,电堆电流密度为α2,空气流量为α3,氢气流量为α4,旁路流量为α5,热交换器入口空气温度为α6,混合器入口空气温度为α7,电堆入口空气温度为α8,燃烧室入口空气温度为α9,热交换器入口燃料温度为α
10
,电堆入口燃料温度为α
11
,燃烧室入口燃料温度为α
12
,燃烧室出口烟气温度为α
13
,热交换器出口烟气温度为α
14
,热交换器最高温度为α
15
,燃烧室最高温度记为α
16
,将确定的特征属性取值依次记为向量x=(α1,α2,α3,α4,α5,α6,α7,α8,α9,α
10

11

12

13

14

15

16
);
[0058]
2)利用训练集进行半监督学习训练,建立朴素贝叶斯模型;
[0059]
3-1)根据训练集sofc系统故障参数数据统计各特征属性取值先验概率p(αi);
[0060]
3-2)用gk表征输出类别,记为y=(g1,g2),其中g1表示未发生故障,g2表示发生故障,类的先验概率可以采用
[0061][0062]
求得,其中|g
k,y
|是y中类gk的训练个数,|y|为总的输出类别训练个数;
[0063]
3-3)计算条件概率,当特征属性值αi为连续型特征值,在实例中通常取αi的先验概率为正态分布,此时的条件分布为:
[0064][0065]
其中μk和是特征属性取值满足正态分布的期望和方差,μk为训练集类别gk中,所有αi的平均值,为训练集类别gk中,所有αi的方差,为训练集中特征输入取值;
[0066]
当特征属性取值αi为离散值,如特征属性为空气流量时,则条件概率
[0067][0068]
其中是训练集中y元组属性αi的gk类的元组数,为y中gk类元组数;
[0069]
由于sofc系统各参数之间会产生相互作用共同对故障发生与否产生影响,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的故障机理分类器的泛化性能;
[0070]
由此当特征属性为离散值时的组合特征联合条件概率为:
[0071][0072]
其中,为故障类别gk中第i号和第j号特征取值的个数,为y中gk类的训练个数;
[0073]
当特征属性取值为连续值时:
[0074][0075]
其中α为满足特征属性i号和j号的取值区间,μk和是特征属性取值α满足正态分布的期望和方差,μk为训练集类别gk中,所有α的平均值,为训练集类别gk中,所有α的方差;
[0076]
3-5)根据处理好的训练集建立朴素贝叶斯模型,采用训练集数据进行学习训练。采用计算好的先验概率计算特征属性的联合概率p(y=gk|x):
[0077][0078]
因为上式分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是假设相对独立的,所以可以简化为计算:
[0079][0080]
若采用基于上述两两特征组合的方式计算相应的联合条件概率则为:
[0081][0082]
3-6)在本发明实施方案中,基于先验概率和条件概率构建目标函数(即后验概率),并基于朴素贝叶斯算法对所述目标函数进行求解的过程即为训练过程,从而生成了基于朴素贝叶斯算法的sofc系统故障几率预测分类器。
[0083]
4)采用测试集测试该sofc系统故障几率预测分类器;
[0084]
5)利用该sofc系统故障几率预测分类器对sofc系统新参数进行故障概率预测识别。
[0085]
5-1)获取实时sofc系统参数数据输入模型,计算各类的p(x|gk)p(gk),则基于特征故障参数αi分类到gk的条件如下:
[0086]
p(x|gk)p(gk)>p(x|gm)p(gm)(k≠m)
[0087]
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
[0088]
[0089]
在本发明的实施方案中,将待预测的实时sofc系统数据输入sofc系统故障几率预测分类器中,通过比较故障发生与否的概率大小,即可获得相应的故障发生预测结果以及故障概率大小,从而指导发电过程的补救决策。
[0090]
以上所述具体技术方案仅用以说明本发明,并不用于限制本发明;尽管参照上述具体技术方案对本发明进行了详细的说明,本领域的普通技术人员应当理解。凡是基于本发明的精神和原则之内,所做的任何修改和等同替换均应包含在本发明的保护范围之内。

技术特征:
1.一种基于朴素贝叶斯算法的sofc系统故障几率预测方法,其特征在于,包括如下步骤:s1、收集训练集数据,从某sofc系统的历史数据库中提取历史开发数据并进行预处理,将预处理后的sofc系统参数数据进行多段随机抽样,按照预设比例8:2形成训练集与测试集;从训练集数据中确定特征属性,将其取值为朴素贝叶斯模型的特征输入,确定输出类别,建立向量组;利用训练集进行半监督学习训练,建立朴素贝叶斯模型;s2、利用测试集对训练结果进行验证;s3、朴素贝叶斯模型的实际运用,获取sofc系统实际参数数据输入该朴素贝叶斯模型,获取相应的sofc系统故障几率。2.根据权利要求1所述的基于朴素贝叶斯算法的sofc系统故障几率预测方法,其特征在于,所述s1具体为:确定sofc系统故障参数数据为特征属性,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度;确定以特征属性的取值为特征输入,确定以相应特征属性取值计算的sofc系统故障概率为特征输出,根据确定的特征属性,依次将上述16个特征取值分别记为α
i
,以上确定的特征属性取值记为向量x=(α1,α2,α3,α4lα
15

16
);用y表征输出类别训练元组,记y=(g1,g2),其中g1表示sofc系统未发生故障,g2表示sofc系统发生故障,用|g
k,y
|表示y中类g
k
的训练个数;由训练集样本统计sofc系统各特征属性取值的先验概率p(x=α
i
)(i=1,2l 16)并计算分类类别的先验概率p(y=g
k
)(k=1,2):式中|g
k,y
|是y中类g
k
的训练个数,|y|为总的输出类别训练个数;将上述先验概率联合学习计算条件概率p(x=α|y=g
k
);若sofc系统特征属性值为连续型特征值,所述的条件概率根据以下公式计算:其中μ
k
和是sofc系统特征属性取值满足正态分布的期望和方差,μ
k
为训练集类别g
k
中,所有α
i
的平均值,为训练集类别g
k
中,所有α
i
的方差,为训练集中特征输入取值;若sofc系统特征属性取值为离散值,所述的条件概率根据以下公式计算:其中是训练集中y元组属性α
i
的g
k
类的元组数,为y中g
k
类元组数;sofc系统特征属性为离散值时的组合特征联合条件概率根据以下公式计算:
为sofc系统故障类别g
k
中第i号和第j号特征取值的个数,为y中g
k
类的训练个数;sofc系统特征属性取值为连续值时的组合特征联合条件概率根据以下公式计算:其中α为满足sofc系统特征属性i号和j号的取值区间,μ
k
和是sofc系统特征属性取值α满足正态分布的期望和方差,μ
k
为训练集类别g
k
中,所有α的平均值,为训练集类别g
k
中,所有α的方差;采用计算好的sofc系统先验概率和条件概率计算联合后验概率p(y=g
k
|α),即计算p(x|y=g
k
)p(y=g
k
):3.根据权利要求2所述的基于朴素贝叶斯算法的sofc系统故障几率预测方法,其特征在于,所述s3具体为:获取实时sofc系统参数数据输入模型,计算各类的p(x|y=g
k
)p(y=g
k
),通过弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合的方式计算sofc系统每个类的后验概率,通过比较两个类别的后验概率,判断出基于sofc系统特征故障参数x被划分到p(x|y=g
k
)p(y=g
k
)较大的类g
k
,并求出了sofc系统相应的类g
k
的发生概率。

技术总结
本发明属于SOFC系统故障预测领域,具体涉及一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法。所述方法为:从某SOFC系统的历史数据库中提取历史开发数据并进行预处理,创建训练集与测试集,从训练集数据中确定特征属性与输出类别空间,根据训练集发生故障的参数数据统计各特征属性取值先验概率,采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用测试集进行验证,将实时SOFC系统参数数据输入模型获取相应的故障几率大小。的故障几率大小。的故障几率大小。


技术研发人员:胡建功 张代辉 黎骏杰 赖美霖 何凰 朱益楠 吴肖龙
受保护的技术使用者:南昌大学
技术研发日:2023.05.06
技术公布日:2023/8/24
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐