一种基于马尔科夫链的设备故障溯源方法与流程

未命名 07-27 阅读:170 评论:0


1.本发明属于工业计量设备故障原因溯源技术领域,尤其涉及一种基于马尔科夫链的设备故障溯源方法。


背景技术:

2.电力设备是电网的关键组成部分,且设备种类多、数量庞大,我国配电网电力计量设备数量大、分布广,运行环境复杂,在实际电力计量工作中存在大量的表记故障。目前电网朝向智能化、自动化发展的趋势不断增强,使用大量的传感器设备进行设备状态监测,因此,采集的数据包含大量非结构化数据,如大量设备状态、电网运行和环境气象等电力设备状态相关数据。从积累的大量数据中挖掘与设备状态相关的信息,判断是否有故障存在、追溯故障原因、进行故障预测并对辅助决策得出故障解决方案,对于保障电网安全稳定运行有重要意义。
3.有人提出基于机器学习与自然语言处理的变压器故障诊断与状态评价研究,该现有技术提出一种基于数据预处理和梯度提升树的变压器故障诊断方法,主要包括数据预处理、模型构建与训练、超参数优化等步骤。数据预处理、在故障诊断流程中,由传感器采集的设备状态数据可能产生噪声,与实际设备状态存在偏差。采用基于统计分布分析的异常点判别方法可对噪声数据进行合理筛选。假设正常数据在特征维度上满足正态分布,当正态分布的平均值为、方差为时,特征值为的数据出现概率为:通过正态分布的假设,可确定99.7%的正常数据都应集中于区间中,因此,可将区间外的数据作为异常噪声数据进行处理。模型构建与训练多分类梯度提升树模型由多个二分类梯度提升树模型构成,以决策树为基分类器,并通过梯度提升方式进行集成。二分类梯度提升树模型需对分类器进行初始化,通过计算损失函数并拟合数据,根据叶子节点参数与学习率不断对分类器进行迭代更新,在最终迭代时即可生成最终的模型。
4.cn115508672a5在超参数优化步骤中,采用网格搜索算法对模型超参数进行穷举搜索,为需要调优的所有参数设定其上下限和搜索步长,在参数搜索的区间内逐步长地变化各参数,遍历所有的参数组合,保留最优目标结果所对应的参数,以实现基于超参数选择的整体效果优化。
5.现有技术主要有:专家系统、机器学习、和模糊集合三种方法。各有各自的应用限制;专家系统需要需要专家深度参与;机器学需要标注数据,元器件损坏数据的缺失限制了机器学习方法的实施。模糊集合的隶属度函数难以选择。
6.由以上现有技术分析可以知道存在的问题主要有:1由于故障信息化管理平台只记录存储设备故障现象,无元器件故障信息,因此为获取元器件故障信息需要依赖人工拆解设备然后进行复杂的检测,需要耗费大量的人力和物力;2、现有故障溯源问题常常依赖专家系统分类预测等手段判断故障原因,需要专家深度参与,人力成本较高。


技术实现要素:

7.本发明的目的在于针对现有技术中存在的问题提供一种基于马尔科夫链的设备故障溯源方法,该方法通过因果分析模型分析故障与故障之间因果关系图,结合专家的诊断经验获取故障与元器件之间的对应关系,利用设备批次故障数据使用马尔可夫链量化元器件损坏程度。
8.本发明的技术方案是:
9.一种基于马尔科夫链的设备故障溯源方法,包括如下步骤:
10.s1、搜集故障数据,进行数据清洗和聚合,根据电力公司侧拆回分拣数据,生产企业侧元器件、研方法案数据,以及电能表运行质量风险预警服务的预警批次数据,展开故障电能表的影响因素分析;
11.s2、使用垂直分数匹配算法构建故障与故障之间因果关系图,边上权重为原因故障对结果故障的提升度uplift,uplift计算公式如下:
[0012][0013]
其中x和y分别为两个故障,uplift
x,y∈group(a),z∈ot hers(o)
(x

y)为“y故障—》x故障的提升度”计算方法是x发生时y的概率减去x不发生时y的概率,x,y∈group(a)表示x和y均在按照某种算法获得的故障分组中,z∈others(o)表示其它不在某分组内的故障,当uplift大于0.75时,表示存在x

y因果关系;垂直分数匹配是指将数据按照故障x发生的概率也叫倾向性分组,倾向性由垂直分数表示,倾向性相近的数据会被分到同一组中进行uplift因果关系权重计算;
[0014]
s3、获取故障与元器件之间对应关系图,边权重为按照指向同一元器件的均匀分布值,或者是专家评估的概率;
[0015]
s4、融合故障因果图和故障与元器件对应关系图获得故障元器件关系分析图,关系分析图中假设节点之间有马尔可夫性,任意节点的发生概率仅依赖上一节点的概率,因此某故障现象到某元器件路径发生的概率为路径上每一条边概率乘积;
[0016]
s5、线上应用过程中,对于某设备故障数据,计算每种元器件损坏程度,按照如下公式:
[0017]
ps(a,c)=πp
a...c
ꢀꢀ
(1)
[0018][0019]
公式(1):a表示某故障,c表示某元器件,ps(a,c)表示故障a到元器件c的path score路径得分,p
a...c
表示分析图上a到c路径上所有边上的权重,
[0020]
公式(2):s(ci)表示元器件ci的损坏程度,n表示到ci的所有路径,路径起始节点为aj,fg表示fault group某故障设备x的故障组合记录,l
aj∈fg
如果aj在fg中,取1,代表故障aj在设备x上发生了,如果aj不在fg中,代表故障aj没有在设备x上发生;
[0021]
s6、根据某批次所有设备故障数据,计算每个设备对应的元器件损坏程度,对所有元器件损坏程度取均值,得到批次元器件的故障程度,选择批次为单位,通过批次元器件故
障程度可以反应批次设备总体质量。
[0022]
具体的,所述的步骤s1中故障现象包括如下:
[0023]
外观损坏:根据新表的灰度图像矩阵的变换向量和拆回表的灰度图像矩阵的变换向量计算余弦相似度cos《0.7则认为外观损坏;
[0024]
电量数据突变:读取近10次冻结电量数据,若r_b《r_f或者r_b-r_f》u_max i_max
×
24,则认为存在电量突变,其中r_b代表后一表底度,r_f代表后一表底度,u_max、i_max代表电压电流最大值;
[0025]
电费扣减故障:通电后当电能理论增量大于0.05kwh后,若|δ_c-δ_q*η|》0.02则认为存在电费扣减故障,其中δ_c为电费增量,δ_q为电量增量,η为费率。
[0026]
具体的,所述的步骤s2中采用垂直随机森林算法计算故障现象之间的因果关系权重,对于因果关系x

y(x导致y),训练随机森林模型预测f(z)=x,即:直接估计某组合条件下,x发生的概率,因此f(z)是垂直分数的拟合函数。
[0027]
电力设备是电网的关键组成部分,且设备种类多、数量庞大。目前电网朝向智能化、自动化发展的趋势不断增强,使用大量的传感器设备进行设备状态监测,因此,采集的数据包含大量非结构化数据,如大量设备状态、电网运行和环境气象等电力设备状态相关数据。从积累的大量数据中挖掘与设备状态相关的信息,判断是否有故障存在、追溯故障原因、进行故障预测并对辅助决策得出故障解决方案,对于保障电网安全稳定运行有重要意义。
[0028]
近年来,电网规模迅速增长,安全可靠供电的要求也越来越高,设备状态准确评估和状态检修面临更大的挑战。传统的设备故障溯源主要采用基于数据分析的方法,即从全量数据中提取客观规律,从数据内在规律分析的角度发掘出对电力设备诊断和预测有价值的知识,但此方法在数据质量和数据处理方面存在一定的难度,且得到的溯源结果可解释性低。
[0029]
现有技术:浙江大学廖伟涵的硕士论文——基于机器学习与自然语言处理的变压器故障诊断与状态评价研究,该现有技术提出一种基于数据预处理和梯度提升树的变压器故障诊断方法,主要包括数据预处理、模型构建与训练、超参数优化等步骤。
[0030]
数据预处理在故障诊断流程中,由传感器采集的设备状态数据可能产生噪声,与实际设备状态存在偏差。采用基于统计分布分析的异常点判别方法可对噪声数据进行合理筛选。假设正常数据在特征维度上满足正态分布,当正态分布的平均值为、方差为时,特征值为的数据出现概率为:通过正态分布的假设,可确定99.7%的正常数据都应集中于区间中,因此,可将区间外的数据作为异常噪声数据进行处理。模型构建与训练,多分类梯度提升树模型由多个二分类梯度提升树模型构成,以决策树为基分类器,并通过梯度提升方式进行集成。二分类梯度提升树模型需对分类器进行初始化,通过计算损失函数并拟合数据,根据叶子节点参数与学习率不断对分类器进行迭代更新,在最终迭代时即可生成最终的模型。cn 115508672a 5在超参数优化步骤中,采用网格搜索算法对模型超参数进行穷举搜索,为需要调优的所有参数设定其上下限和搜索步长,在参数搜索的区间内逐步长地变化各参数,遍历所有的参数组合,保留最优目标结果所对应的参数,以实现基于超参数选择的整体效果优化。
[0031]
本发明的有益效果是:本发明通过故障拆回分拣等数据训练故障现象因果关系图,然后结合专家经验获取故障现象与元器件对应关系作为因果关系图的延申,通过马尔科夫链方法计算各个故障到各个元器件路径发生概率,计算包括未发生故障的所有相关故障到元器件路径概率对已知故障路径概率进行标准化,获得每个元器件故障程度的量化结果,对批次设备元器件故障程度进行汇总获得批次元器件故障程度的状态总体评价。
[0032]
本发明通过数据挖掘算法量化元器件对各种故障的影响程度,有效规避现有技术需要大量人工干预和人工标注的问题,实现更加自动化智能化的故障溯源流程,提高了业务处理效率;结合故障之间的因果关系图,量化元器件对故障现象的影响程度。增加算法输入信息维度提高量化的可信度。
具体实施方式
[0033]
下面结合具体实施方式对本发明的技术方案进行详细的描述。
[0034]
一种基于马尔科夫链的设备故障溯源方法,包括如下步骤:
[0035]
s1、搜集故障数据,进行数据清洗和聚合,根据电力公司侧拆回分拣数据,生产企业侧元器件、研方法案等数据,以及电能表运行质量风险预警服务的预警批次数据,展开故障电能表的影响因素分析,故障现象示例如下:
[0036]
1、外观损坏:根据新表的灰度图像矩阵的变换向量和拆回表的灰度图像矩阵的变换向量计算余弦相似度
[0037]
cos《0.7则认为外观损坏;
[0038]
2、电量数据突变:读取近10次冻结电量数据,若r_b《r_f或者r_b-r_f》u_max i_max
×
24,则认为存在电量突变,其中r_b代表后一表底度,r_f代表后一表底度,u_max、i_max代表电压电流最大值;
[0039]
3、电费扣减故障:通电后当电能理论增量大于0.05kwh后,若|δ_c-δ_q*η|》0.02则认为存在电费扣减故障,其中δ_c为电费增量,δ_q为电量增量,η为费率。
[0040]
s2、使用垂直分数匹配算法构建故障与故障之间因果关系图。边上权重为原因故障对结果故障的提升度uplift,uplift计算公式如下:
[0041][0042]
其中x和y分别为两个故。uplift
x,y∈group(a),z∈ot hers(o)
(x

y)为“y故障—》x故障的提升度”计算方法是x发生时y的概率减去x不发生时y的概率。x,y∈group(a)表示x和y均在按照某种算法获得的故障分组中,z∈others(o)表示其它不在a组内的故障。当uplift大于0.75时,表示存在x

y因果关系。
[0043]
垂直分数匹配是指将数据按照故障x发生的概率也叫倾向性分组。倾向性由垂直分数表示。倾向性相近的数据会被分到同一组中进行uplift因果关系权重计算。具体地,采用垂直随机森林算法计算故障现象之间的因果关系权重。
[0044]
对于因果关系x

y(x导致y),训练随机森林模型预测f(z)=x(即:直接估计某组
合条件下,x发生的概率)。因此f(z)是垂直分数的拟合函数。决策树是一种树型图结构。数据经过树的某条路径到达某个叶子节点。每个内节点都有一个判断条件,满足条件会指定数据属于哪个下位节点。叶子节点代表模型的输出节点。叶子节点y=true的占比代表模型输出概率。因此,所有到达同一叶节点的数据都会有同样的概率估计也就是同样的垂直分数。垂直森林具有理论简单明了、计算复杂度低等优点。
[0045]
s3、设计调查问卷并发放给专家,搜集整理调查结果。获取故障与元器件之间对应关系图。边权重为按照指向同一元器件的均匀分布值(n为元器件入度,代码中全取1了),也可以是专家评估的概率。
[0046]
s4、融合故障因果图和故障与元器件对应关系图获得故障元器件关系分析图。关系分析图中假设节点之间有马尔可夫性。任意节点的发生概率仅依赖上一节点的概率。因此某故障现象到某元器件路径发生的概率为路径上每一条边概率乘积。
[0047]
s5、线上应用过程中,对于某设备故障数据,计算每种元器件损坏程度。按照如下公式。
[0048]
ps(a,c)=πp
a...c
ꢀꢀ
(1)
[0049][0050]
公式(1):a表示某故障,c表示某元器件,ps(a,c)表示故障a到元器件c的path score路径得分,p
a...c
表示分析图上a到c路径上所有边上的权重,
[0051]
公式(2):s(ci)表示元器件ci的损坏程度,n表示到ci的所有路径,路径起始节点为aj,fg表示fault group某故障设备x的故障组合记录,l
aj∈fg
如果aj在fg中,取1,代表故障aj在设备x上发生了,如果aj不在fg中,代表故障aj没有在设备x上发生。
[0052]
s6、根据某批次所有设备故障数据,计算每个设备对应的元器件损坏程度。对所有元器件损坏程度取均值,得到批次元器件的故障程度。选择批次为单位,因为批次设备元器件规格质量应该都一样。通过批次元器件故障程度可以反应批次设备总体质量。
[0053]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

技术特征:
1.一种基于马尔科夫链的设备故障溯源方法,其特征在于,包括如下步骤:s1、搜集故障数据,进行数据清洗和聚合,根据电力公司侧拆回分拣数据,生产企业侧元器件、研方法案数据,以及电能表运行质量风险预警服务的预警批次数据,展开故障电能表的影响因素分析;s2、使用垂直分数匹配算法构建故障与故障之间因果关系图,边上权重为原因故障对结果故障的提升度uplift,uplift计算公式如下:结果故障的提升度uplift,uplift计算公式如下:其中x和y分别为两个故障,uplift
x,y∈group(a),z∈others(o)
(x

y)为“y故障->x故障的提升度”计算方法是x发生时y的概率减去x不发生时y的概率,x,y∈group(a)表示x和y均在按照某种算法获得的故障分组中,z∈others(o)表示其它不在故障分组中设定的某个组内的故障,当uplift大于0.75时,表示存在x

y因果关系;垂直分数匹配是指将数据按照故障x发生的概率也叫倾向性分组,倾向性由垂直分数表示,倾向性相近的数据会被分到同一组中进行uplift因果关系权重计算;s3、获取故障与元器件之间对应关系图,边权重为按照指向同一元器件的均匀分布值,或者是专家评估的概率;s4、融合故障因果图和故障与元器件对应关系图获得故障元器件关系分析图,关系分析图中假设节点之间有马尔可夫性,任意节点的发生概率仅依赖上一节点的概率,因此某故障现象到某元器件路径发生的概率为路径上每一条边概率乘积;s5、线上应用过程中,对于某设备故障数据,计算每种元器件损坏程度,按照如下公式:ps(a,c)=∏p
a...c
ꢀꢀꢀꢀ
(1)公式(1):a表示某故障,c表示某元器件,ps(a,c)表示故障a到元器件c的path score路径得分,p
a...c
表示分析图上a到c路径上所有边上的权重;公式(2):s(c
i
)表示元器件c
i
的损坏程度,n表示到c
i
的所有路径,路径起始节点为a
j
,fg表示fault group某故障设备x的故障组合记录,l
aj∈fg
如果a
j
在fg中,取1,代表故障a
j
在设备x上发生了,如果a
j
不在fg中,代表故障a
j
没有在设备x上发生;s6、根据某批次所有设备故障数据,计算每个设备对应的元器件损坏程度,对所有元器件损坏程度取均值,得到批次元器件的故障程度,选择批次为单位,通过批次元器件故障程度可以反应批次设备总体质量。2.根据权利要求1所述,其特征在于,所述的步骤s1中故障现象包括如下:外观损坏:根据新表的灰度图像矩阵的变换向量和拆回表的灰度图像矩阵的变换向量计算余弦相似度cos<0.7则认为外观损坏;电量数据突变:读取近10次冻结电量数据,若r_b<r_f或者r_b-r_f>u_max i_max
×
24,则认为存在电量突变,其中r_b代表后一表底度,r_f代表后一表底度,u_max、i_max代表
电压电流最大值;电费扣减故障:通电后当电能理论增量大于0.05kwh后,若|δ_c-δ_q*η|>0.02则认为存在电费扣减故障,其中δ_c为电费增量,δ_q为电量增量,η为费率。3.根据权利要求1所述,其特征在于,所述的步骤s2中采用垂直随机森林算法计算故障现象之间的因果关系权重,对于因果关系x

y,训练随机森林模型预测f(z)=x,即:直接估计某组合条件下,x发生的概率,因此f(z)是垂直分数的拟合函数。

技术总结
本发明属于工业计量设备故障原因溯源技术领域,尤其涉及一种基于马尔科夫链的设备故障溯源方法,包括如下步骤:S1、搜集故障数据;S2、使用垂直分数匹配算法构建故障与故障之间因果关系图;S3、设计调查问卷并发放给专家,获取故障与元器件之间对应关系图;S4、融合故障因果图和故障与元器件对应关系图获得故障元器件关系分析图;S5、对于某设备故障数据,计算每种元器件损坏程度;S6、根据某批次所有设备故障数据,计算每个设备对应的元器件损坏程度,该方法通过因果分析模型分析故障与故障之间因果关系图,结合专家的诊断经验获取故障与元器件之间的对应关系,利用设备批次故障数据使用马尔可夫链量化元器件损坏程度。使用马尔可夫链量化元器件损坏程度。


技术研发人员:井友鼎 王旭峰 崔磊 杜创胜 路利光 王亚勇 黄加军 邓攀 郝增财 陈彦松 董莎莎 王旭东
受保护的技术使用者:河南合众伟奇云智科技有限公司
技术研发日:2023.04.24
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐