一种面向变压器及断路器设备标准知识图谱构建方法与流程

未命名 07-22 阅读:78 评论:0


1.本发明涉及知识图谱构建技术领域,具体为一种面向变压器及断路器设备标准知识图谱构建方法。


背景技术:

2.变压器作为电力系统中的核心设备,快速准确地掌握变压器信息,提升变压器检修维护效率和水平,是保证用户用电质量的重要基础。
3.然而目前,电力变压器运维主要依赖传统经验,导致运维措施的可解释性较弱,且电力变压器结构复杂,对运维技术人员专业技术水平要求较高,使得运维策略制定难度较大。
4.知识图谱本质上是一个语义网,可以对多源异构数据进行知识提取,且可以推理得到和实体之间更丰富的的语义关联,故将知识图谱与智能运维相结合,使用“知识-数据”联合驱动的方式进行变压器的智能运维具有广阔的应用前景。


技术实现要素:

5.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
6.鉴于上述存在的问题,提出了本发明。
7.本发明实施例的第一方面,提供一种面向变压器及断路器设备标准知识图谱构建方法,包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。
8.作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述数据集的构建包括,
9.选取变压器及断路器设备标准数据作为种子数据,所述变压器及断路器设备标准数据的三元组格式与构建数据集需要的格式存在较大偏差,在构建数据集前需进行预处理;
10.通过对知识库进行对齐获取大量训练数据并构建数据集;
11.若第i个句子包含多个实体,则令所有实体两两组合形成实体对,并将所述实体对输入所述变压器及断路器设备标准数据进行匹配,若所述实体对并无关系,则标记为null,作为负样本。
12.作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述知识抽取的过程包括,
13.对所述数据集进行预处理得到多个文本信息,针对每个文本信息将所述文本信息
分词后输入至bert子模型,得到对应的向量序列,然后将所述向量序列输入至bgru子模型中,输出用于揭示文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至crf子模型,计算最优标签序列,实现对实体的提取和属性的提取;
14.将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取。
15.作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述向量序列的获取包括,
16.对所述数据集进行预处理得到多个文本信息,将所述文本信息进行分词后得到长度为n的分词文本;
17.将所述分词文本w=([cls],w1,w2,

,wn,[sep])输入至bert子模型,得到对应的向量序列l=(l0,l1,l2,

,ln,l
n+1
),li∈rn×
l
,其中,[cls]表示起始符,wn表示第n个分词文本,[sep]表示结束符,ln表示第n个向量序列,l表示bert子模型的隐藏状态维数。
[0018]
作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述状态矩阵的获取包括,
[0019]
将所述向量序列中各个词向量序列作为bgru子模型中各个时间步的输入;
[0020]
通过将所述bgru子模型中正向gru输出的隐状态序列和反向gru输出的隐状态序列进行计算,得到所述向量序列对应的隐状态序列h
n+1
,h
n+1
∈rn×h,h为bgru子模型的隐藏状态维数;
[0021]
将所述隐状态序列h
n+1
从h维映射到k维,并计算每个分词分类到k个标签的标签分值,得到状态矩阵e=(e0,e1,e2,

,en,e
n+1
),其中ei∈rk表示一个列向量。
[0022]
作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述最优标签序列的计算包括,
[0023]
将所述状态矩阵输入至crf子模型,基于所述crf子模型中引入的约束矩阵和输入的状态矩阵,计算每个标签序列的总分值;
[0024]
基于所述每个标签序列的总分值计算最优标签序列具体的计算如下:
[0025][0026]
其中,表示每个标签序列的总分值,表示所有可能的标签序列的集合。
[0027]
作为本发明所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述变压器及断路器设备标准知识图谱的构建包括,
[0028]
基于抽取的知识进行知识融合,将融合后的数据导入neo4j图数据库中进行分类与存储,并构建变压器及断路器设备标准知识图谱。
[0029]
本发明实施例的第二方面,提供一种面向变压器及断路器设备标准知识图谱构建系统,包括:
[0030]
数据获取单元,用于选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;
[0031]
知识抽取单元,用于对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;
[0032]
知识图谱构建单元,用于基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。
[0033]
本发明实施例的第三方面,提供一种设备,所述设备包括,
[0034]
处理器;
[0035]
用于存储处理器可执行指令的存储器;
[0036]
所述处理器被配置为调用所述存储器存储的指令,以执行本发明任一实施例所述的方法。
[0037]
本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,包括:
[0038]
所述计算机程序指令被处理器执行时实现如本发明任一实施例所述的方法。
[0039]
本发明的有益效果:本发明提供一种面向变压器及断路器设备标准知识图谱构建方法,通过对数据集进行知识抽取,抽取出实体、属性及实体间关系,基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱,提升知识抽取的准确率,较高质量地构建了电力变压器运维知识图谱,进而实现了基于知识图谱的智能辅助决策,对推动电力系统数字化转型具有重要意义。
附图说明
[0040]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0041]
图1为本发明提供的一种面向变压器及断路器设备标准知识图谱构建方法的整体流程图。
具体实施方式
[0042]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0043]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0044]
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0045]
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
[0046]
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位
或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0047]
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0048]
实施例1
[0049]
参照图1为本发明的一个实施例,提供了一种面向变压器及断路器设备标准知识图谱构建方法,包括:
[0050]
s1:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集。需要说明的是:
[0051]
数据集的构建包括,
[0052]
选取变压器及断路器设备标准数据作为种子数据,变压器及断路器设备标准数据的三元组格式与构建数据集需要的格式存在较大偏差,在构建数据集前需进行预处理;
[0053]
通过对知识库进行对齐获取大量训练数据并构建数据集;
[0054]
若第i个句子包含多个实体,则令所有实体两两组合形成实体对,并将实体对输入变压器及断路器设备标准数据进行匹配,若实体对并无关系,则标记为null,作为负样本。
[0055]
s2:对数据集进行知识抽取,抽取出实体、属性及实体间关系。需要说明的是:
[0056]
知识抽取的过程包括,
[0057]
对数据集进行预处理得到多个文本信息,针对每个文本信息将文本信息分词后输入至bert子模型,得到对应的向量序列,然后将向量序列输入至bgru子模型中,输出用于揭示文本信息中各个单词对应各个标签分值的状态矩阵,再将状态矩阵输入至crf子模型,计算最优标签序列,实现对实体的提取和属性的提取;
[0058]
将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取;
[0059]
进一步的,向量序列的获取包括,
[0060]
对数据集进行预处理得到多个文本信息,将文本信息进行分词后得到长度为n的分词文本,将分词文本w=([cls],w1,w2,

,wn,[sep])输入至bert子模型,得到对应的向量序列l=(l0,l1,l2,

,ln,l
n+1
),li∈rn×
l
,其中,[cls]表示起始符,wn表示第n个分词文本,[sep]表示结束符,ln表示第n个向量序列,l表示bert子模型的隐藏状态维数;
[0061]
再进一步的,状态矩阵的获取包括,
[0062]
将向量序列中各个词向量序列作为bgru子模型中各个时间步的输入;
[0063]
通过将bgru子模型中正向gru输出的隐状态序列和反向gru输出的隐状态序列进行计算,得到向量序列对应的隐状态序列h
n+1
,h
n+1
∈rn×h,h为bgru子模型的隐藏状态维数;
[0064]
将隐状态序列h
n+1
从h维映射到k维,并计算每个分词分类到k个标签的标签分值,
得到状态矩阵e=(e0,e1,e2,

,en,e
n+1
),其中ei∈rk表示一个列向量;
[0065]
更进一步的,最优标签序列的计算包括,
[0066]
将状态矩阵输入至crf子模型,基于crf子模型中引入的约束矩阵和输入的状态矩阵,计算每个标签序列的总分值;
[0067]
基于每个标签序列的总分值计算最优标签序列具体的计算如下:
[0068][0069]
其中,表示每个标签序列的总分值,表示所有可能的标签序列的集合。
[0070]
s3:基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。需要说明的是:
[0071]
基于抽取的知识进行知识融合,将融合后的数据导入neo4j图数据库中进行分类与存储,并构建变压器及断路器设备标准知识图谱。
[0072]
应说明的,本发明提供一种面向变压器及断路器设备标准知识图谱构建方法,通过对数据集进行知识抽取,抽取出实体、属性及实体间关系,基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱,提升知识抽取的准确率,较高质量地构建了电力变压器运维知识图谱,进而实现了基于知识图谱的智能辅助决策,对推动电力系统数字化转型具有重要意义。
[0073]
本发明公开的第二方面,
[0074]
提供一种面向变压器及断路器设备标准知识图谱构建系统,包括:
[0075]
数据获取单元,用于选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;
[0076]
知识抽取单元,用于对数据集进行知识抽取,抽取出实体、属性及实体间关系;
[0077]
知识图谱构建单元,用于基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。
[0078]
本发明公开的第三方面,
[0079]
提供一种设备,包括:
[0080]
处理器;
[0081]
用于存储处理器可执行指令的存储器;
[0082]
其中,处理器被配置为调用存储器存储的指令,以执行前述中任意一项的方法。
[0083]
本发明公开的第四方面,
[0084]
提供一种计算机可读存储介质,其上存储有计算机程序指令,包括:
[0085]
计算机程序指令被处理器执行时实现前述中任意一项的方法。
[0086]
本发明可以是方法、装置、系统和/或计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
[0087]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式
压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0088]
实施例2
[0089]
该实施例不同于第一个实施例的是,提供了一种面向变压器及断路器设备标准知识图谱构建方法的验证测试,为对本方法中采用的技术效果加以验证说明。
[0090]
本实施例选取1000条变压器及断路器设备标准数据构建数据集,按照7:2:1划分为训练集(700条)、验证集(200条)和测试集(100条),对知识图谱进行训练、验证和测试,以精确率、召回率和f1值作为评价指标,对知识图谱的效果进行验证,具体结果数据如表1所示。
[0091]
表1:验证结果数据。
[0092]
测试次数精确率召回率f1值184.3%90.1%87.1%283.8%89.8%87.7%384.9%90.7%88.1%
[0093]
根据表1可以看出知识图谱的效果是很不错的,因此本发明提供的方法能够提升知识抽取的准确率,较高质量地构建了电力变压器运维知识图谱,进而实现了基于知识图谱的智能辅助决策,对推动电力系统数字化转型具有重要意义。
[0094]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

技术特征:
1.一种面向变压器及断路器设备标准知识图谱构建方法,其特征在于,包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。2.如权利要求1所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述数据集的构建包括,选取变压器及断路器设备标准数据作为种子数据,所述变压器及断路器设备标准数据的三元组格式与构建数据集需要的格式存在较大偏差,在构建数据集前需进行预处理;通过对知识库进行对齐获取大量训练数据并构建数据集;若第i个句子包含多个实体,则令所有实体两两组合形成实体对,并将所述实体对输入所述变压器及断路器设备标准数据进行匹配,若所述实体对并无关系,则标记为null,作为负样本。3.如权利要求2所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述知识抽取的过程包括,对所述数据集进行预处理得到多个文本信息,针对每个文本信息将所述文本信息分词后输入至bert子模型,得到对应的向量序列,然后将所述向量序列输入至bgru子模型中,输出用于揭示文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至crf子模型,计算最优标签序列,实现对实体的提取和属性的提取;将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取。4.如权利要求3所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述向量序列的获取包括,对所述数据集进行预处理得到多个文本信息,将所述文本信息进行分词后得到长度为n的分词文本;将所述分词文本w=([cls],w1,w2,

,w
n
,[sep])输入至bert子模型,得到对应的向量序列l=(l0,l1,l2,

,l
n
,l
n+1
),l
i
∈r
n
×
l
,其中,[cls]表示起始符,w
n
表示第n个分词文本,[sep]表示结束符,l
n
表示第n个向量序列,l表示bert子模型的隐藏状态维数。5.如权利要求4所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述状态矩阵的获取包括,将所述向量序列中各个词向量序列作为bgru子模型中各个时间步的输入;通过将所述bgru子模型中正向gru输出的隐状态序列和反向gru输出的隐状态序列进行计算,得到所述向量序列对应的隐状态序列h
n+1
,h
n+1
∈r
n
×
h
,h为bgru子模型的隐藏状态维数;将所述隐状态序列h
n+1
从h维映射到k维,并计算每个分词分类到k个标签的标签分值,得到状态矩阵e=(e0,e1,e2,

,e
n
,e
n+1
),其中e
i
∈r
k
表示一个列向量。6.如权利要求5所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:
所述最优标签序列的计算包括,将所述状态矩阵输入至crf子模型,基于所述crf子模型中引入的约束矩阵和输入的状态矩阵,计算每个标签序列的总分值;基于所述每个标签序列的总分值计算最优标签序列具体的计算如下:其中,表示每个标签序列的总分值,表示所有可能的标签序列的集合。7.如权利要求6所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述变压器及断路器设备标准知识图谱的构建包括,基于抽取的知识进行知识融合,将融合后的数据导入neo4j图数据库中进行分类与存储,并构建变压器及断路器设备标准知识图谱。8.一种面向变压器及断路器设备标准知识图谱构建系统,其特征在于,包括:数据获取单元,用于选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;知识抽取单元,用于对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;知识图谱构建单元,用于基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。9.一种设备,其特征在于,所述设备包括,处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1~7中任一所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1~7中任一所述的方法。

技术总结
本发明公开了一种面向变压器及断路器设备标准知识图谱构建方法包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱;本发明提供的方法能够提升知识抽取的准确率,较高质量地构建了电力变压器运维知识图谱,进而实现了基于知识图谱的智能辅助决策,对推动电力系统数字化转型具有重要意义。有重要意义。有重要意义。


技术研发人员:周育忠 林正平 宋禹飞 黄军凯
受保护的技术使用者:贵州电网有限责任公司
技术研发日:2023.04.03
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐