基于混合知识图谱推理的故障诊断方法、装置及存储介质
未命名
08-13
阅读:144
评论:0
1.本发明涉及知识发现技术领域,尤其是涉及一种基于混合知识图谱推理的故障诊断方法、装置及存储介质。
背景技术:
2.知识图谱推理的目的是根据知识图谱中已有的事实或关系推断未知的事实或关系。大量的知识图谱推理方法被提出,例如基于嵌入学习的知识图谱推理方法、基于规则的知识图谱推理方法、基于强化学习的知识图谱推理方法。为了使模型获得可解释的推理结果,提出了基于强化学习的多跳推理方法,如deeppath、diva、minerva、m-walk、multihop等经典的知识图谱模型。然而,这些基于强化学习的知识图谱推理模型在处理稀疏知识图谱时面临的重大挑战是,由于稀疏知识图谱中的信息不足,一些实体对之间没有足够的路径作为推理证据,代理无法准确地选择正确的搜索方向并进行推理过程。此外,为了提高知识图谱推理的可解释性,提出了几个基于符号规则的模型,包括ntp、neurallp、rulen、drum和rnnlogic等经典的知识图谱模型。这些基于规则的知识图谱推理模型通过学习逻辑规则提高了可解释性,也使模型具备了对类似任务的泛化能力。然而,基于规则的知识图谱推理方法难以扩展到大型知识图谱,基于规则的知识图谱推理模型只关注规则组成的关系,而没有考虑相关实体的性质。
3.钢铁生产线主要包括炼钢、连铸、热轧等制造工艺,包括大量复杂的机械设备,如步进炉、精轧机、卷取机、电机等。这是一个典型的复杂制造环境,机制复杂,参数繁多,各种因素变化频繁,设备故障维护面临重大挑战。而知识图谱在许多应用中都具有重要意义,亦是故障诊断领域的最新研究方向之一。然而,由于知识过于分散,传统的文本查找方法在故障诊断中效率低下,而要应用基于规则的知识图谱推理方法又存在无法扩展到大型知识图谱、没有考虑相关实体的性质等缺陷。
技术实现要素:
4.本发明的目的就是为了提供一种基于混合知识图谱推理的故障诊断方法、装置及存储介质,考虑相关实体的性质,使得知识图谱推理能够扩展到大型知识图谱中,提高故障诊断准确率。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于混合知识图谱推理的故障诊断方法,包括以下步骤:
7.s1、获取钢铁产线故障和设备相关的数据,并构建故障知识图谱;
8.s2、构建混合知识图谱推理模型,所述混合知识图谱推理模型包括知识图谱嵌入模型和知识图谱推理模型;
9.所述步骤s2包括:
10.s21、基于图注意力机制和transparse构建知识图谱嵌入模型:
11.s211、基于多级图注意力机制模块获得故障知识图谱中的实体嵌入,
12.s212、基于transparse模型编码故障知识图谱中的关系嵌入;
13.s22、结合知识图谱嵌入模型,基于逻辑规则和强化学习构建知识图谱推理模型;
14.s3、训练混合知识图谱推理模型;
15.s4、利用训练完成的混合知识图谱推理模型进行钢铁产线设备故障诊断。
16.所述步骤s211包括以下步骤:
17.s2111、把构建的故障知识图谱表示为g={v,r,f},其中,v表示实体集合,r表示关系集合,f={(e0,r,e
t
)|e0,e
t
∈v,r∈r}表示事实三元组,即知识图谱由大量的三元组组成;
18.s2112、运用关系级别的注意力机制对与当前实体相关的关系进行重要度排序:
19.v
hr
=wr[h||r]
[0020][0021]
其中,头实体向量h和关系向量r合并成一个向量,并评估与头实体h相关的所有邻域关系向量,wr和wr表示可学习参数,nh表示头实体h的邻域关系向量;
[0022]
s2113、在当前实体h和上一步得出的不同重要程度的各种关系下,评估不同关系对应的实体群;
[0023]vhrr
=w
t
[v
hr
||r]
[0024][0025]
其中,n
hr
表示r的子关系与h的相邻子关系的交集;
[0026]
将三元组中的关系提前转化为相应的子关系,并将这两个层次的注意定义为:
[0027]vhr
=w1[h||r]
[0028][0029]
γ
hr
=α
hr
·
β
hrr
[0030]
其中,w1和w1表示可学习参数;
[0031]
s2114、基于实体级别的注意力评估每一个邻域实体对于给定邻域关系的当前实体的重要程度:
[0032]vhrt
=w2[v
hr
||t]
[0033][0034]
其中,w2和w2表示可学习参数,n
hr
表示关系r下头实体h邻域实体;
[0035]
s2115、将头实体h对事实三元组(h,r,t)的注意力程度定义为:
[0036]
att
hrt
=γ
hr
·
η
hrt
[0037]
其中,γ
hr
表示类型级别和关系级别的注意力,η
hrt
表示实体级别的注意力;
[0038]
s2116、定义实体的邻域信息:
[0039][0040]r′
=w3r
[0041]
其中,w3表示可学习参数;
[0042]
s2117、得到知识图谱中的实体编码方式为:
[0043]
h=leakyrelu(w4(h+hn))
[0044]
其中,w4表示可学习参数;
[0045]
被编码后的实体具有丰富的邻域信息,关系类型信息和实体类型信息。
[0046]
所述步骤s212具体为:
[0047]
将transparse模型用于编码知识图谱的关系嵌入,将关系嵌入阶段的目标损失函数定义为:
[0048][0049][0050]
其中,||
·
||2表示l2距离函数,t表示正例对齐的实体对集合,t
′
表示由负采样得到的负例实体对集合,γ2是一个边界超参数;
[0051]
将实体阶段的目标函数定义为:
[0052][0053]
其中,γ1是一个边界超参数;
[0054]
将知识图谱嵌入阶段的目标函数定义为:
[0055]
l
embed
=l
ent
+l
rel
[0056]
在模型训练过程中,通过不断调参优化目标函数l
embed
,得到更好的知识图谱嵌入。
[0057]
所述步骤s22包括以下步骤:
[0058]
s221、结合知识图谱嵌入模型,构建基于强化学习的知识图谱推理模型;
[0059]
s232、基于改进的波束搜索算法保存知识图谱推理模型在每个时间步中排名前k的路径,其中,k为波束大小;
[0060]
s233、采用基于逻辑规则的高层策略网络来选择最可能的路径,并在每一时间步扩展其路径,直到到达目标实体。
[0061]
所述步骤s221具体为:
[0062]
对于知识图谱推理任务,目的是基于问题q=(eq,rq,?)从知识图谱g中推理出正确的a
nsw
,其中,eq表示问询实体,rq表示问询关系;基于强化学习的知识图谱推理模型的核心是强化学习网络训练一个代理学习与知识图谱环境的交互;
[0063]
强化学习本质上是一个马尔科夫决策过程,被定义位一个四元组即状态,动作,过渡和奖励,其中,
[0064]
所述状态为:在时刻的状态被定义为其中和分别表示历史轨迹嵌入、综合实体嵌入和节点级图注意力嵌入,其中,
[0065]
采用长短期记忆网络lstm作为记忆组件,将历史轨迹嵌入定义为:
[0066]
其中,表示上一个实体和当前实体之间的关系;
[0067]
综合实体嵌入由两个部分组成:
[0068][0069]
其中,表示当前实体和目标实体e
targ
的距离;
[0070]
节点级图注意嵌入用于帮助agent关注当前实体的邻居信息:
[0071][0072]
其中,w5表示一个线性变换矩阵,ns表示的知识图谱内部邻域实体,为第个实体与第j个实体之间的注意权重,通过单层自注意神经网络计算得到:
[0073][0074]
其中,表示所有实体共享的可学习权向量;
[0075]
所述动作是由代理选择的向前一步的关系路径:代理从源实体es开始,应用基于逻辑规则的高层策略网络来选择最可能的路径,然后在每一步扩展其路径,直到到达目标实体e
targ
;状态的动作空间是当前实体在知识图谱中扩展的方向边集合:
[0076]
所述过渡表示为一个过渡矩阵作用是确保下一个状态的概率分布,被定义为一个映射函数策略网络对当前状态进行编码,进而输出概率分布其中,过渡策略的目标是在中选择概率最大的动作;
[0077]
所述奖励ra是根据行为是否有效,以及一系列行为是否能够帮助代理达到目标实体,对代理的反馈;给定一对和知识图谱,如果代理到达目标实体,即则代理得到正向奖励;如果代理到达错误的实体,代理将获得负向奖励;如果代理到达实体没有答案,即代理将获得中立奖励;则三元奖励结构如下:
[0078][0079]
所述改进的波束搜索算法具体为:
[0080]
将在时间处获得的路径集定义为:
[0081][0082]
选择候选路径的原则是关系序列从左到右能够匹配相关规则,即只有前一条
路径中的关系序列能够成功匹配该规则,才会被选中生成
[0083]
候选动作的选择分为三个阶段:
[0084]
a)动作随机抽样:为了消除伪路径的可怕影响,知识图谱根据随机从择λ1k
p
个候选路径,而不是选择k
p
个评分最高的候选路径;
[0085]
b)动作匹配规则:根据动作得分选择符合相关规则的λ2k
p
个动作,且λ2+λ1≤1;
[0086]
c)得分较高的动作:从剩余不匹配规则的路径中根据其得分选择λ3k
p
个动作作为补充,其中,当λ2+λ1=1时,不存在c)阶段。
[0087]
所述基于逻辑规则的高层策略网络具体为:
[0088]
知识图谱推理以概率的方式形式化,其中一组逻辑规则z被视为潜在变量,目标分布p(a
nsw
|g,q)由规则生成器和推理预测器共同建模:
[0089][0090]
规则生成器p
θ
旨在生成一组潜在逻辑规则z,用于对知识图谱g进行推理,以回答问询问题q=(eq,rq,?),形式上,给定一个查询q=(eq,rq,?),通过只考虑查询关系rq而不考虑查询实体eq来生成组合逻辑规则,这允许定义的规则跨实体进行泛化;
[0091]
对于简称为rq←
r1∧
…
∧r
l
的每条组合规则,视为关系序列[rq,r1,r2…rl
,r
end
],其中rq为查询关系或规则头,为规则主体,r
end
为表示关系序列结束的特殊关系;
[0092]
引入lstm网络对规则生成器进行参数化:
[0093]
给定一个查询关系rq,lstm
θ
依次生成规则主体中的每个关系,直到到达结束关系r
end
,在此过程中,同时计算生成规则的概率;
[0094]
则,一组规则z上的分布定义为多项分布:
[0095]
p
θ
(z|q)=mu(z|n,lstm
θ
(
·
|rq))
[0096]
其中,mu表示多项式分布,n表示集合z的大小的超参数,lstm
θ
(
·
|rq)定义了一个组合规则的分布,规则头为rq;
[0097]
推理预测器pw的目的是根据给定的查询q和一组规则z,在g上推断候选答案e
cand
,其中,对于每个候选答案e
cand
的标量scorew(e
cand
)计算如下:
[0098][0099][0100]
其中,e
cand
∈a
cand
,a
cand
是可被集合z中的任何逻辑规则识别的候选答案集,p(eq,rule,e
cand
)表示在遵循规则rule的条件下,从eq开始到e
cand
结束的真实路径集,和分别代表每个规则和路径的标量权重;每个候选答案e
cand
的分数是每个规则贡献的分数的总和,scorew(e
cand
|rule)是通过在知识图谱中找到的每条真实路径求和得到的;
[0101]
查询q的答案a
nsw
是实体e
cand
的概率,通过应用softmax函数定义:
[0102][0103]
所述步骤s3包括以下步骤:
[0104]
s31、规则生成器p
θ
首先生成一组规则每条规则的得分h计算如下:
[0105][0106]
其中,a
cand
表示中规则学习到的所有候选答案的集合,scorew(e|rule)表示每个规则对实体e的贡献率,rnn
θ
(rule|r)表示生成器计算出的规则的先验概率;
[0107]
s32、根据规则更新推理预测器pw;
[0108]
s33、通过为查询q绘制样本每个训练实例(g,q,a
nsw
)的目标函数近似如下:
[0109][0110]
对于规则的一个子集,log p
θ,w
(zi|g,q,a
nsw
)近似为:
[0111][0112][0113]
其中,const表示一个独立于zi的常数项,γ(zi)表示集合zi的给定大小,rule表示每个规则在zi中出现的次数,每个规则的抽样概率计算如下:
[0114][0115]
s34、将每条规则的h(rule)作为对规则质量的评价:选取最高h(rule)的k条规则,对每个数据实例(g,q,a
nsw
)形成一组高质量逻辑规则则目标函数表示为:
[0116][0117]
s35、将规则生成器更新为与所选择的高质量规则一致,并应用高质量规则更新规则生成器中的参数θ,将每个数据实例(g,q,a
nsw
)的高质量逻辑规则被认为是训练数据的一部分,通过最大化对数似然来更新和优化规则生成器p
θ
。
[0118]
一种基于混合知识图谱推理的故障诊断装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0119]
一种存储介质,其上存储有程序,所述程序被执行时实现如上述所述的方法。
[0120]
与现有技术相比,本发明具有以下有益效果:
[0121]
(1)本发明提出的基于图注意力机制和transparse构建知识图谱嵌入模型特别适合解决复杂异构知识图谱嵌入问题,能够捕获知识图谱中的实体邻域信息,关系类型信息和实体类型信息,使得模型能够嵌入更丰富的语义信息,离散图搜索转化为向量空间计算,大大减少了搜索空间。
[0122]
(2)本发明提出了基于逻辑规则和强化学习的知识图谱推理模型,大大提高了知识图谱推理的可解释性,并且有效解决了稀疏知识图谱缺乏路径的问题,不仅适合于小型知识图谱,也能扩展到大型知识图谱中。
[0123]
(3)本发明引入优化的波束搜索算法,有助于在标准波束中被抛弃的低分路径有机会被探索,提高了代理选择正确动作的准确率,使得推理结果更加准确。
附图说明
[0124]
图1为本发明的方法流程图;
[0125]
图2为知识图谱构建示意图;
[0126]
图3为混合知识图谱推理模型示意图;
[0127]
图4为基于逻辑规则的高层策略网络示意图。
具体实施方式
[0128]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0129]
本实施例提供一种基于混合知识图谱推理的故障诊断方法,如图1所示,包括以下步骤:
[0130]
s1、获取钢铁产线故障和设备相关的数据,并构建故障知识图谱,如图2所示。
[0131]
具体的,获取的数据分为结构化数据、半结构化数据和非结构化数据。
[0132]
构建故障知识图谱包括以下步骤:
[0133]
s11、关系三元组获取;
[0134]
s12、知识融合;本实施例中,知识融合通过指代消解、实体消歧和实体链接实现。
[0135]
s13、构建得到故障知识图谱。
[0136]
s2、构建混合知识图谱推理模型,如图3所示。
[0137]
s21、基于图注意力机制和transparse构建知识图谱嵌入模型。
[0138]
s211、基于多级图注意力机制模块获得故障知识图谱中的实体嵌入。
[0139]
s2111、把构建的故障知识图谱表示为g={v,r,f},其中,v表示实体集合,r表示关系集合,f={(e0,r,e
t
)|e0,e
t
∈v,r∈r}表示事实三元组,即知识图谱由大量的三元组组成;
[0140]
s2112、运用关系级别的注意力机制对与当前实体相关的关系进行重要度排序:
[0141]vhr
=wr[h||r]
[0142][0143]
其中,头实体向量h和关系向量r合并成一个向量,并评估与头实体h相关的所有邻域关系向量,wr和wr表示可学习参数,nh表示头实体h的邻域关系向量;
[0144]
s2113、在当前实体h和上一步得出的不同重要程度的各种关系下,评估不同关系对应的实体群;
[0145]vhrr
=w
t
[v
hr
||r]
[0146][0147]
其中,n
hr
表示r的子关系与h的相邻子关系的交集;
[0148]
将三元组中的关系提前转化为相应的子关系,并将这两个层次的注意定义为:
[0149]vhr
=w1[h||r]
[0150][0151]
γ
hr
=α
hr
·
β
hrr
[0152]
其中,w1和w1表示可学习参数;
[0153]
s2114、基于实体级别的注意力评估每一个邻域实体对于给定邻域关系的当前实体的重要程度:
[0154]vhrt
=w2[v
hr
||t]
[0155][0156]
其中,w2和w2表示可学习参数,n
hr
表示关系r下头实体h邻域实体;
[0157]
s2115、将头实体h对事实三元组(h,r,t)的注意力程度定义为:
[0158]
att
hrt
=γ
hr
·
η
hrt
[0159]
其中,γ
hr
表示类型级别和关系级别的注意力,η
hrt
表示实体级别的注意力;
[0160]
s2116、定义实体的邻域信息:
[0161][0162]r′
=w3r
[0163]
其中,w3表示可学习参数;
[0164]
s2117、得到知识图谱中的实体编码方式为:
[0165]
h=leakyrelu(w4(h+hn))
[0166]
其中,w4表示可学习参数;
[0167]
被编码后的实体具有丰富的邻域信息,关系类型信息和实体类型信息。
[0168]
s212、基于transparse模型编码故障知识图谱中的关系嵌入。
[0169]
由于构建的钢铁产线设备故障知识图谱,关系复杂,具有严重的异质性和不平衡
性,且上述优化的多级图卷积注意力网络模型不能对关系嵌入进行编码,因此,将transparse模型用于编码知识图谱的关系嵌入,将关系嵌入阶段的目标损失函数定义为:
[0170][0171][0172]
其中,||
·
||2表示l2距离函数,t表示正例对齐的实体对集合,t
′
表示由负采样得到的负例实体对集合,γ2是一个边界超参数。
[0173]
将实体阶段的目标函数定义为:
[0174][0175]
其中,γ1是一个边界超参数。
[0176]
将知识图谱嵌入阶段的目标函数定义为:
[0177]
l
embed
=l
ent
+l
rel
[0178]
在模型训练过程中,通过不断调参优化目标函数l
embed
,得到更好的知识图谱嵌入。
[0179]
s22、结合知识图谱嵌入模型,基于逻辑规则和强化学习构建知识图谱推理模型。
[0180]
s221、结合知识图谱嵌入模型,构建基于强化学习的知识图谱推理模型。
[0181]
对于知识图谱推理任务,目的是基于问题q=(eq,rq,?)从知识图谱g中推理出正确的a
nsw
,其中,eq表示问询实体,rq表示问询关系。
[0182]
基于强化学习的知识图谱推理模型的核心是强化学习网络训练一个代理学习与知识图谱环境的交互;强化学习本质上是一个马尔科夫决策过程,被定义位一个四元组即状态,动作,过渡和奖励,具体的,
[0183]
a)状态
[0184]
在时刻的状态被定义为其中和分别表示历史轨迹嵌入、综合实体嵌入和节点级图注意力嵌入。
[0185]
引入历史轨迹嵌入的原因是代理需要做序列决策,历史轨迹嵌入可以记录历史信息,进而有效地指导代理在知识图谱上有效地游走。
[0186]
为了更好地帮助代理记录和学习历史路径,采用长短期记忆网络lstm作为记忆组件,可以极大地降低知识图谱对于预训练的依赖性。
[0187]
将历史轨迹嵌入定义为:
[0188][0189]
其中,r
t
表示上一个实体e
t-1
和当前实体e
t
之间的关系。
[0190]
其中,表示上一个实体和当前实体之间的关系;
[0191]
综合实体嵌入由两个部分组成:
[0192][0193]
其中,表示当前实体和目标实体e
targ
的距离;
[0194]
节点级图注意嵌入用于帮助agent关注当前实体的邻居信息:
[0195][0196]
其中,w5表示一个线性变换矩阵,ns表示的知识图谱内部邻域实体,为第个实体与第j个实体之间的注意权重,通过单层自注意神经网络计算得到:
[0197]
其中,表示所有实体共享的可学习权向量;
[0198]
b)动作
[0199]
动作是由代理选择的向前一步的关系路径。代理从源实体es开始,应用基于逻辑规则的高层策略网络来选择最可能的路径,然后在每一步扩展其路径,直到到达目标实体e
targ
。
[0200]
状态的动作空间是当前实体在知识图谱中扩展的方向边集合:
[0201][0202]
c)过渡
[0203]
过渡矩阵的作用是确保下一个状态的概率分布,被定义为一个映射函数策略网络对当前状态进行编码,进而输出概率分布其中,过渡策略的目标是在中选择概率最大的动作。
[0204]
d)奖励
[0205]
奖励ra是根据行为是否有效,以及一系列行为是否能够帮助代理达到目标实体,对代理的反馈。
[0206]
为了解决在代理执行的有限步骤内无法到达应答实体的问题,本实施例添加了一个额外的“没有答案”e
noanswer
操作,因此,提出了一个三元奖励结构。给定一对和知识图谱,如果代理到达目标实体,即则代理得到正向奖励;如果代理到达错误的实体,代理将获得负向奖励;如果代理到达实体没有答案,即代理将获得中立奖励;则三元奖励结构如下:
[0207][0208]
s232、基于改进的波束搜索算法保存知识图谱推理模型在每个时间步中排名前k的路径,其中,k为波束大小。
[0209]
将在时间处获得的路径集定义为:
[0210][0211]
选择候选路径的原则是关系序列从左到右能够匹配相关规则。例如,给定规则rq
←
r1∧r2和两条候选路径(es,r1,e1,r2,e2),(es,r2,e3,r3,e4),只有前一条路径中的关系序列能够成功匹配该规则,才会被选中生成
[0212]
候选动作的选择分为三个阶段:
[0213]
a)动作随机抽样:为了消除伪路径的可怕影响,知识图谱根据随机从择λ1k
p
个候选路径,而不是选择k
p
个评分最高的候选路径;
[0214]
b)动作匹配规则:根据动作得分选择符合相关规则的λ2k
p
个动作,且λ2+λ1≤1;
[0215]
c)得分较高的动作:从剩余不匹配规则的路径中根据其得分选择λ3k
p
个动作作为补充,其中,当λ2+λ1=1时,不存在c)阶段。
[0216]
通过上述优化的三阶段波束搜索算法,在标准波束中被抛弃的低分路径也有机会被探索。此外,动作随机采样方案可以避免模型仅仅选择有奖励路径。
[0217]
s233、采用基于逻辑规则的高层策略网络来选择最可能的路径,并在每一时间步扩展其路径,直到到达目标实体。
[0218]
上述马尔可夫决策过程中动作的选择主要面临两个挑战,1)初始参数随机初始化和路径长度的增加导致模型难以选择正确的动作到达目标实体;2)由于知识图谱的复杂性,动作空间可能非常大,基于强化学习的方法往往需要大量从头开始的试验,以找到一个可靠的证据路径,以获得非零奖励。由于规则可以精确地描述从查询关系到语义组合路径的映射,本实施例设计了一个基于逻辑规则的高层策略网络,如图4所示,对顺序空间中的强化学习代理进行建模。将规则作为动作的先验信息,既可以提高路径获得奖励的概率,又有助于促进有效的探索。
[0219]
本实施例使用五种类型的horn规则在知识图谱上进行挖掘:逆规则、对称规则、传递规则、组合规则和封闭路径规则。
[0220]
知识图谱推理以概率的方式形式化,其中一组逻辑规则z被视为潜在变量,目标分布p(a
nsw
|g,q)由规则生成器和推理预测器共同建模:
[0221][0222]
规则生成器p
θ
旨在生成一组潜在逻辑规则z,用于对知识图谱g进行推理,以回答问询问题q=(eq,rq,?),形式上,给定一个查询q=(eq,rq,?),通过只考虑查询关系rq而不考虑查询实体eq来生成组合逻辑规则,这允许定义的规则跨实体进行泛化。
[0223]
对于简称为rq←
r1∧
…
∧r
l
的每条组合规则,视为关系序列[rq,r1,r2…rl
,r
end
],其中rq为查询关系或规则头,为规则主体,r
end
为表示关系序列结束的特殊关系。
[0224]
引入lstm网络对规则生成器进行参数化:
[0225]
给定一个查询关系rq,lstm
θ
依次生成规则主体中的每个关系,直到到达结束关系r
end
,在此过程中,同时计算生成规则的概率。
[0226]
则,一组规则z上的分布定义为多项分布:
[0227]
p
θ
(z|q)=mu(z|n,lstm
θ
(
·
|rq))
[0228]
其中,mu表示多项式分布,n表示集合z的大小的超参数,lstm
θ
(
·
|rq)定义了一个组合规则的分布,规则头为rq。
[0229]
推理预测器pw的目的是根据给定的查询q和一组规则z,在g上推断候选答案e
cand
,其中,对于每个候选答案e
cand
的标量scorew(e
cand
)计算如下:
[0230][0231]
其中,e
cand
∈a
cand
,a
cand
是可被集合z中的任何逻辑规则识别的候选答案集,p(eq,rule,e
cand
)表示在遵循规则rule的条件下,从eq开始到e
cand
结束的真实路径集,和分别代表每个规则和路径的标量权重;每个候选答案e
cand
的分数是每个规则贡献的分数的总和,scorew(e
cand
|rule)是通过在知识图谱中找到的每条真实路径求和得到的。
[0232]
查询q的答案a
nsw
是实体e
cand
的概率,通过应用softmax函数定义:
[0233][0234]
s3、训练混合知识图谱推理模型。
[0235]
s31、规则生成器p
θ
首先生成一组规则每条规则的得分h计算如下:
[0236][0237]
其中,a
cand
表示中规则学习到的所有候选答案的集合,scorew(e|rule)表示每个规则对实体e的贡献率,rnn
θ
(rule|r)表示生成器计算出的规则的先验概率。
[0238]
s32、根据规则更新推理预测器pw。
[0239]
s33、通过为查询q绘制样本每个训练实例(g,q,a
nsw
)的目标函数近似如下:
[0240][0241]
对于规则的一个子集,log p
θ,w
(zi|g,q,a
nsw
)近似为:
[0242][0243][0244]
其中,const表示一个独立于zi的常数项,γ(zi)表示集合zi的给定大小,rule表示每个规则在zi中出现的次数,每个规则的抽样概率计算如下:
[0245][0246]
s34、将每条规则的h(rule)作为对规则质量的评价:选取最高h(rule)的k条规则,对每个数据实例(g,q,a
nsw
)形成一组高质量逻辑规则则目标函数表示为:
[0247][0248]
s35、将规则生成器更新为与所选择的高质量规则一致,并应用高质量规则更新规则生成器中的参数θ,将每个数据实例(g,q,a
nsw
)的高质量逻辑规则被认为是训练数据的一部分,通过最大化对数似然来更新和优化规则生成器p
θ
。
[0249]
因此,规则生成器可以学习生成高质量的规则供推理预测器进行探索,减少了搜索空间,产生了更好的推理结果。
[0250]
s4、利用训练完成的混合知识图谱推理模型进行钢铁产线设备故障诊断。
[0251]
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0252]
本实施例中,数据集来自某钢铁厂,整理统计筛选出19类关系,2136个实体,训练集包含32500个三元组,测试集包含2080个三元组,验证集包含7600个三元组,将我们的模型和其他经典模型进行了链接预测的对比实验,选用mrr和hit@1作为评估指标。实验结果如表1所示。实验结果表明,相比于其他方法,本发明提出的混合知识图谱推理模型具有更高的准确性。
[0253]
表1实验结果
[0254]
模型mrrhits@1transe70.163.1transh73.464.8transd74.267.9pra68.572.3deeppath73.365.8multi-hop74.166.7本发明83.578.1
[0255]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
技术特征:
1.一种基于混合知识图谱推理的故障诊断方法,其特征在于,包括以下步骤:s1、获取钢铁产线故障和设备相关的数据,并构建故障知识图谱;s2、构建混合知识图谱推理模型,所述混合知识图谱推理模型包括知识图谱嵌入模型和知识图谱推理模型;所述步骤s2包括:s21、基于图注意力机制和transparse构建知识图谱嵌入模型:s211、基于多级图注意力机制模块获得故障知识图谱中的实体嵌入,s212、基于transparse模型编码故障知识图谱中的关系嵌入;s22、结合知识图谱嵌入模型,基于逻辑规则和强化学习构建知识图谱推理模型;s3、训练混合知识图谱推理模型;s4、利用训练完成的混合知识图谱推理模型进行钢铁产线设备故障诊断。2.根据权利要求1所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述步骤s211包括以下步骤:s2111、把构建的故障知识图谱表示为g={v,r,f},其中,v表示实体集合,r表示关系集合,f={(e0,r,e
t
)|e0,e
t
∈v,r∈r}表示事实三元组,即知识图谱由大量的三元组组成;s2112、运用关系级别的注意力机制对与当前实体相关的关系进行重要度排序:v
hr
=w
r
[h||r]其中,头实体向量h和关系向量r合并成一个向量,并评估与头实体h相关的所有邻域关系向量,w
r
和w
r
表示可学习参数,n
h
表示头实体h的邻域关系向量;s2113、在当前实体h和上一步得出的不同重要程度的各种关系下,评估不同关系对应的实体群;v
hrr
=w
t
[v
hr
||r]其中,n
hr
表示r的子关系与h的相邻子关系的交集;将三元组中的关系提前转化为相应的子关系,并将这两个层次的注意定义为:v
hr
=w1[h||r]γ
hr
=α
hr
·
β
hrr
其中,w1和w1表示可学习参数;s2114、基于实体级别的注意力评估每一个邻域实体对于给定邻域关系的当前实体的重要程度:v
hrt
=w2[v
hr
||t]
其中,w2和w2表示可学习参数,n
hr
表示关系r下头实体h邻域实体;s2115、将头实体h对事实三元组(h,r,t)的注意力程度定义为:att
hrt
=γ
hr
·
η
hrt
其中,γ
hr
表示类型级别和关系级别的注意力,η
hrt
表示实体级别的注意力;s2116、定义实体的邻域信息:r
′
=w3r其中,w3表示可学习参数;s2117、得到知识图谱中的实体编码方式为:h=leakyrelu(w4(h+h
n
))其中,w4表示可学习参数;被编码后的实体具有丰富的邻域信息,关系类型信息和实体类型信息。3.根据权利要求2所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述步骤s212具体为:将transparse模型用于编码知识图谱的关系嵌入,将关系嵌入阶段的目标损失函数定义为:义为:其中,||
·
||2表示l2距离函数,t表示正例对齐的实体对集合,t
′
表示由负采样得到的负例实体对集合,γ2是一个边界超参数;将实体阶段的目标函数定义为:其中,γ1是一个边界超参数;将知识图谱嵌入阶段的目标函数定义为:l
embed
=l
ent
+l
rel
在模型训练过程中,通过不断调参优化目标函数l
embed
,得到更好的知识图谱嵌入。4.根据权利要求3所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述步骤s22包括以下步骤:s221、结合知识图谱嵌入模型,构建基于强化学习的知识图谱推理模型;s232、基于改进的波束搜索算法保存知识图谱推理模型在每个时间步中排名前k的路径,其中,k为波束大小;s233、采用基于逻辑规则的高层策略网络来选择最可能的路径,并在每一时间步扩展
其路径,直到到达目标实体。5.根据权利要求4所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述步骤s221具体为:对于知识图谱推理任务,目的是基于问题q=(e
q
,r
q
,?)从知识图谱g中推理出正确的a
nsw
,其中,e
q
表示问询实体,r
q
表示问询关系;基于强化学习的知识图谱推理模型的核心是强化学习网络训练一个代理学习与知识图谱环境的交互;强化学习本质上是一个马尔科夫决策过程,被定义位一个四元组即状态,动作,过渡和奖励,其中,所述状态为:在时刻的状态被定义为其中和分别表示历史轨迹嵌入、综合实体嵌入和节点级图注意力嵌入,其中,采用长短期记忆网络lstm作为记忆组件,将历史轨迹嵌入定义为:其中,表示上一个实体和当前实体之间的关系;综合实体嵌入由两个部分组成:其中,表示当前实体和目标实体e
targ
的距离;节点级图注意嵌入用于帮助agent关注当前实体的邻居信息:其中,w5表示一个线性变换矩阵,n
s
表示的知识图谱内部邻域实体,为第个实体与第j个实体之间的注意权重,通过单层自注意神经网络计算得到:其中,表示所有实体共享的可学习权向量;所述动作是由代理选择的向前一步的关系路径:代理从源实体e
s
开始,应用基于逻辑规则的高层策略网络来选择最可能的路径,然后在每一步扩展其路径,直到到达目标实体e
targ
;状态的动作空间是当前实体在知识图谱中扩展的方向边集合:所述过渡表示为一个过渡矩阵作用是确保下一个状态的概率分布,被定义为一个映射函数s
×
a
→
s;策略网络对当前状态进行编码,进而输出概率分布其中,过渡策略的目标是在中选择概率最大的动作;所述奖励r
a
是根据行为是否有效,以及一系列行为是否能够帮助代理达到目标实体,对代理的反馈;给定一对和知识图谱,如果代理到达目标实体,即则代理得到正向奖励;如果代理到达错误的实体,代理将获得负向奖励;如果代理到达实体没有答案,即代理将获得中立奖励;则三元奖励结构如下:
6.根据权利要求5所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述改进的波束搜索算法具体为:将在时间处获得的路径集定义为:选择候选路径的原则是关系序列从左到右能够匹配相关规则,即只有前一条路径中的关系序列能够成功匹配该规则,才会被选中生成候选动作的选择分为三个阶段:a)动作随机抽样:为了消除伪路径的可怕影响,知识图谱根据随机从择λ1k
p
个候选路径,而不是选择k
p
个评分最高的候选路径;b)动作匹配规则:根据动作得分选择符合相关规则的λ2k
p
个动作,且λ2+λ1≤1;c)得分较高的动作:从剩余不匹配规则的路径中根据其得分选择λ3k
p
个动作作为补充,其中,当λ2+λ1=1时,不存在c)阶段。7.根据权利要求6所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述基于逻辑规则的高层策略网络具体为:使用五种类型的horn规则在知识图谱上进行挖掘:逆规则、对称规则、传递规则、组合规则和封闭路径规则;知识图谱推理以概率的方式形式化,其中一组逻辑规则z被视为潜在变量,目标分布p(a
nsw
|g,q)由规则生成器和推理预测器共同建模:规则生成器p
θ
旨在生成一组潜在逻辑规则z,用于对知识图谱g进行推理,以回答问询问题q=(e
q
,r
q
,?),形式上,给定一个查询q=(e
q
,r
q
,?),通过只考虑查询关系r
q
而不考虑查询实体e
q
来生成组合逻辑规则,这允许定义的规则跨实体进行泛化;对于简称为r
q
←
r1∧
…
∧r
l
的每条组合规则,视为关系序列[r
q
,r1,r2…
r
l
,r
end
],其中r
q
为查询关系或规则头,为规则主体,r
end
为表示关系序列结束的特殊关系;引入lstm网络对规则生成器进行参数化:给定一个查询关系r
q
,lstm
θ
依次生成规则主体中的每个关系,直到到达结束关系r
end
,在此过程中,同时计算生成规则的概率;则,一组规则z上的分布定义为多项分布:p
θ
(z|q)=mu(z|n,lstm
θ
(
·
|r
q
))其中,mu表示多项式分布,n表示集合z的大小的超参数,lstm
θ
(
·
|r
q
)定义了一个组合规则的分布,规则头为r
q
;推理预测器p
w
的目的是根据给定的查询q和一组规则z,在g上推断候选答案e
cand
,其中,
对于每个候选答案e
cand
的标量score
w
(e
cand
)计算如下:其中,e
cand
∈a
cand
,a
cand
是可被集合z中的任何逻辑规则识别的候选答案集,p(e
q
,rule,e
cand
)表示在遵循规则rule的条件下,从e
q
开始到e
cand
结束的真实路径集,和分别代表每个规则和路径的标量权重;每个候选答案e
cand
的分数是每个规则贡献的分数的总和,score
w
(e
cand
|rule)是通过在知识图谱中找到的每条真实路径求和得到的;查询q的答案a
nsw
是实体e
cand
的概率,通过应用softmax函数定义:8.根据权利要求7所述的一种基于混合知识图谱推理的故障诊断方法,其特征在于,所述步骤s3包括以下步骤:s31、规则生成器p
θ
首先生成一组规则每条规则的得分h计算如下:其中,a
cand
表示中规则学习到的所有候选答案的集合,score
w
(e|rule)表示每个规则对实体e的贡献率,rnn
θ
(rule|r)表示生成器计算出的规则的先验概率;s32、根据规则更新推理预测器p
w
;s33、通过为查询q绘制样本每个训练实例(g,q,a
nsw
)的目标函数近似如下:对于规则的一个子集,logp
θ,w
(z
i
|g,q,a
nsw
)近似为:)近似为:其中,const表示一个独立于z
i
的常数项,γ(z
i
)表示集合z
i
的给定大小,rule表示每个规则在z
i
中出现的次数,每个规则的抽样概率计算如下:
s34、将每条规则的h(rule)作为对规则质量的评价:选取最高h(rule)的k条规则,对每个数据实例(g,q,a
nsw
)形成一组高质量逻辑规则则目标函数表示为:s35、将规则生成器更新为与所选择的高质量规则一致,并应用高质量规则更新规则生成器中的参数θ,将每个数据实例(g,q,a
nsw
)的高质量逻辑规则被认为是训练数据的一部分,通过最大化对数似然来更新和优化规则生成器p
θ
。9.一种基于混合知识图谱推理的故障诊断装置,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。10.一种存储介质,其上存储有程序,其特征在于,所述程序被执行时实现如权利要求1-8中任一所述的方法。
技术总结
本发明涉及一种基于混合知识图谱推理的故障诊断方法、装置及存储介质,其中方法包括:获取钢铁产线故障和设备相关的数据,并构建故障知识图谱;构建混合知识图谱推理模型,所述混合知识图谱推理模型包括基于图注意力机制和TranSparse构建的知识图谱嵌入模型和基于逻辑规则和强化学习构建的知识图谱推理模型;训练混合知识图谱推理模型;利用训练完成的混合知识图谱推理模型进行钢铁产线设备故障诊断。与现有技术相比,本发明具有准确率高、训练稳定等优点。稳定等优点。稳定等优点。
技术研发人员:韩慧慧 王坚
受保护的技术使用者:同济大学
技术研发日:2023.01.13
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种骨科椎板线锯的制作方法 下一篇:天线设备、RF收发器和RF前端电路的制作方法
