一种面向工艺知识的知识图谱构建方法

未命名 10-09 阅读：217 评论：0

1.本发明数据属于工艺制造系统领域，尤其是涉及一种基于工艺知识的统一结构化表示方法。

背景技术：

2.物联网、大数据、人工智能、云计算、5g等新一代信息技术的发展促使工艺制造业从发展理念、模式体系到技术应用多方面革新与升级。世界各国纷纷提出工艺制造业转型升级与高质量发展国家战略并积极采取行动，将发展智能制造作为构建国家制造业核心竞争力的关键举措。在数据信息化的背景下，工艺制造业展现出蓬勃发展的趋势，在智能生产系统的设计、生产、装配等生命周期内，大量的数字化三维模型及关联的工艺数据和知识不断地生成并存储在企业的数据和知识库中，而重用和共享这些资源已成为工艺制造企业保持竞争优势的有效手段。因此，针对这些知识资源获得有效的统一结构化表示成为了发展智能工艺制造领域的基本前提，这将影响这些知识和数据在工艺设计过程中的重用和共享，同时也影响工艺知识管理、工艺知识推送等针对智能工艺制造领域的下游任务。
3.工艺知识具有两个重要特征：(1)多源异构数据：工艺知识包含三维mbd模型、工艺文件、工艺数据库等不同的结构，其中工艺文件中还包含工艺路线、工艺方案、工艺规程等，同时工艺路线这种生产数据又带有高关联的序列关系，处理这些异构的工艺知识，对工艺知识的统一结构化表达带来了巨大的挑战。(2)知识层级结构：工艺知识本身具有层级或序列关系。例如：工艺本身包含材料、尺寸等属性，但工艺包含工序、工步等序列化的结构，现有的技术在处理这种拥有层级序列关系的工艺知识有一定的缺陷。例如基于超网络的方法模型，由产品、知识、问题网络等构成，明确捕获多方面知识中各元素之间的关系，采用贝叶斯方法进行协同推理，通过各个节点网络的属性来进行拓扑识别，捕捉多方面元素的复杂关联，但是其知识的形式化表示途径过程是有待改进的。最近，知识图谱技术在知识统一表征方面受到了日益关注和青睐，其本质是构建具备语义处理能力和开放互联能力的知识库，可以对现实世界的概念、关系等进行形式化描述。其构建步骤为:首先从数据库中抽取能够反映其数据模式的概念、关系、属性等信息，然后以此为基础建立统一数据模式引导下的数据的结构化表示。针对于工艺知识数据的特点和知识图谱的优点，我们进一步提出了面向工艺知识的知识图谱构建技术，将工艺知识分类为规则类工艺知识、和实例类工艺知识，构建工艺知识图谱模式层和工艺知识图谱数据层，最后完成工艺知识图谱的构建，以实现规则类和工艺实例类工艺知识的统一结构化表征。

技术实现要素：

4.针对现有复杂、多样工艺知识难以统一表示对工艺知识重用和共享的影响等问题，本发明旨在使用知识图谱技术统一化表征工艺知识，有效地消除了工艺知识本身存在的异构性，从而使得不同层次之间的知识能够相互共享，为研究智能工艺制造领域知识图谱奠定坚实基础。本发明将工艺知识分为规则类和实例类工艺知识，通过构建模式层和数
据层，保证工艺知识数据模式的准确性和通用性，并将两者融合完成工艺知识图谱的构建，实现规则类与实例类工艺知识的统一结构化表征。
5.为了达到上述目的，本发明提供了一种面向工艺知识的知识图谱构建方法，包括如下步骤：
6.s1、工艺知识图谱模式层构建：使用国际化工业标准step-nc和工艺国家标准文件作为规则类工艺知识，分别采用自顶向下和自底向上相结合的方式，完成工艺知识图谱基本模式层和工艺知识图谱扩展模式层的构建；
7.s2、工艺知识图谱数据层构建：基于美国ndr系统数据库的工艺实例数据，进行构建；包括如下子步骤：
8.s21、数据预处理：所述工艺实例数据利用向量空间模型形式化表示，即
9.ki＝{(t1，ω1)，(t2，ω2)，...，(tn，ωn)}
ꢀꢀꢀꢀꢀ
(5)
10.式中，ti为工艺知识图谱模式层的第i个实体概念，ωi为ti相对于工艺实例数据的重要程度，n表示工艺知识图谱模式层的实体概念数量；其中ωi的计算采用tf-idf方法得到，具体的计算公式如下
[0011][0012]
式中，{f(ti，ki)|ti∈ki}表示ti在工艺实例数据ki中出现的频率；{f(tj，ki)|tj∈ki}为工艺实例数据ki中出现所有实体概念的次数之和；k表示工艺实例数据集；|k|指的是工艺实例数据数量；|ki∈k|ti∈ki|表示包含ti的工艺实例数据数量；若此时|ki∈k|ti∈ki|＝0。
[0013]
根据公式(6)可得到工艺知识图谱模式层候选实体概念与工艺实例数据集的关联矩阵，可表示为
[0014][0015]
式中，n为工艺知识图谱模式层的候选实体概念数量，m为工艺实例数据数量；
[0016]
其中，矩阵的行表示pkgs候选概念，列表示孔特征加工工艺实例，同时矩阵中的数值表示pkgs的候选概念相对于该工艺实例的重要度；
[0017]
s22、降维分解
[0018]
利用奇异值分解对原关联矩阵kn×m进行降维分解，以获取工艺知识图谱模式层概念与工艺实例的特征语义空间，具体说，
[0019]
将kn×n转化为n阶和m阶正交矩阵u和v，该矩阵的秩为r。
[0020][0021]
∑＝[λ1，λ2，...，λn]，且λ1≥λ2≥
…
≥≥λr[0022]
式中，u为k的左奇异矩阵，其行向量为k的左奇异向量，即kk
t
的特征向量，v为k的
右奇异矩阵，其列向量为kk
t
的右奇异向量，λi为k的第i个奇异值；
[0023]
其中，u中每一行对应的是工艺知识图谱模式层概念的向量表示，v中每一列对应的是工艺实例的向量表示；
[0024]
s23、计算实例之间的相似度；
[0025]
计算公式为
[0026][0027]
公式(9)中，ki，kj分别表示工艺实例集k中的2个工艺实例，且i≠j；vi，vj分别为第i，j个工艺实例向量；||ki||2，||kj||2为对应向量的二范数。由公式(9)可计算得到所有工艺实例间的相似度，由计算得到-1≤b
sim
(ki，kj)≤1。然而，由于作为度量值其值应为非负，则b
′
sim
(ki，kj)定义如下：
[0028][0029]
利用公式(9)和(10)对关联矩阵进行计算可以得到工艺实例间的语义相似度；
[0030]
然后将工艺实例作为结点，实例间的语义相似度作为边，采用k-means智能聚类算法对工艺实例进行聚类，获得工艺知识图谱数据层pkgd＝《ed，nd，rd》，ed表示实体或实例结点，nd表示属性边，rd为2个实例结点间的关系；
[0031]
s3、工艺知识图谱的形式化表示，所述工艺知识图谱由模式层pkgs和数据层pkgd组成，pkg＝《pkgs，pkgd，r》，其中r为pkgs和pkgd的关系；此外，pkgs＝《es，ns，rs》，其中，es表示模式层的概念结点，ns为模式层的属性边，rs表示模式层中多条边连接的概念之间的关系；pkgd＝《ed，nd，rd》，ed表示数据层的实体或实例结点，nd表示数据层的属性边，rd为数据层中2个实例结点间的关系。
[0032]
优选方式下，步骤s1包括如下子步骤：
[0033]
s11、自顶向下构建工艺知识图谱基本模式层：基本模式层使用国际化工业标准step-nc中的数据段作为数据来源，使用开源的本体编辑器prot
égé
，得到工艺知识图谱基本模式层pkgbs＝《es，ns，rs》，其中es表示实体概念结点，ns为属性边，rs表示多条边连接的概念之间的关系，在prot
égé
中以xml格式的本体文件存储；
[0034]
s12、自底向上构建工艺知识图谱扩展模式层：主要包括工艺知识解析和工艺知识合并两步，具体说：
[0035]
s121、工艺知识解析，基于开源的斯坦福自然语言处理软件，提取工艺知识中加工特征、工艺属性、加工方法概念及关系，得到工艺知识解析图pka＝《es，ns，rs》，其中es表示实体概念结点，ns为属性边，rs表示多条边连接的概念之间的关系；工艺文件来自于国家标准文件gb/t 4863-2008机械制造工艺基本术语、gb/t 1008-2008机械加工工艺装备基本术语；
[0036]
s122、工艺知识合并：需要比较工艺知识图谱基本模式层与工艺知识解析得到的概念间的语义相似性；包括以下2种情形：
[0037]
s1221语义相似度。输入工艺知识图谱基本模式层实体概念集e＝{e1，e2，e3，
…
}和
工艺知识解析实体概念集e＝{e1，e2，e3，
…
}，则2个概念之间的语义相似度c
sim
(ei，ej)为
[0038][0039]
式中，0≤c
sim
(ei，ej)≤1，|ei∩ej|表示ei和ej共有的概念数目，|ei|表示概念ei的数目，且|ei|》0。当|ei∩ej|＝|ei|时，c
sim
(ei，ej)＝1，表示ei和ej的相似度为1，此时工艺知识图谱基本模式层完全覆盖解析出的工艺知识概念；当|ei∩ej|＝0时，c
sim
(ei，ej)＝0，此时工艺知识图谱基本模式层未包含解析出的工艺知识概念，则将解析出的工艺知识概念添加到工艺知识图谱基本模式层；
[0040]
当0＜|ei∩ej|＜|ei|，0＜c
sim
(ei，ej)＜1时，表示ei和ej语义相关，此时需要计算语义相关度；
[0041]
s1222语义相关度。给定概念ej的属性集为p(ej)＝{p
i1
，p
i2
，
…
}，当p(ej)＝null时，则概念的语义相关性c
rel
(ei，ej)为
[0042][0043]
式中，c
dis
(ei，ej)表示结点ei和ej的语义距离，实质上为结点ei到ej经过的路径长度；
[0044]
当工艺知识概念具有某个属性p
ij
∈p(ej)时，其属性值为vi(p
ij
)由以下几种情形组成：
①
单一数值类型v1(p
ij
)，
②
最大最小数值类型v2(p
ij
)，
③
字符串数值类型v
string
(p
ij
)；
[0045]
则，概念属性值的相似性a
sim
(p(ei)，p(ej))为
[0046][0047]
在公式(3)基础上，其概念的语义相关性c
rel
(ei，ej)可以表示为
[0048][0049]
式中，0≤ω(p(ej))≤1表示属性信息的权重值。当属性信息为材料时，ω(p(ej))＝0.55，否则ω(p(ej))＝0.45；i(ei，ej)为概念ei，ej的引导函数，若解析的工艺知识概念ej包含属性信息，则i(ei，ej)＝1；若ei≠ej，则i(ei，ej)＝0；α＝0.5；
[0050]
对于解析的工艺知识概念，δ为语义相似度最大阈值，取δ＝0.5，当c
sim
＜δ时，需要计算语义相关性，ε为语义相关度的最小阈值，取ε＝0.4；当c
rel
》ε时，则将抽取的工艺知识概念及属性信息合并到工艺知识图谱基本模式层；合并后得到工艺知识图谱的模式层
pkgbs＝《e
′s，n
′s，r
′s》，其中e
′s表示概念结点，n
′s为属性边，r
′s表示多条边连接的概念之间的关系。
[0051]
本发明提出利用工艺知识图谱统一表示加工工艺知识的方法。将知识图谱技术引入工艺知识的表示中，利用知识图谱的模式层和数据层分别对规则和工艺实例进行表示，以弥补已有基于规则、框架等方法表示已有经验规则和实例数据较难分离的不足；本发明利用本体技术表示工艺知识图谱模式层，充分利用本体技术的概念准确性、共享性和语义性等特点，满足了工艺知识概念的统一语义表达，更有利于计算机及工艺设计人员理解和解释；本发明采用知识驱动(自顶向下)和数据驱动(自底向上)相结合的方式完成工艺知识图谱的构建，充分利用知识的准确性和数据的广泛性。
附图说明
[0052]
图1step-nc数据模型图；
[0053]
图2step-nc与工艺知识图谱基本模式层之间的部分数据映射关系；
[0054]
图3工艺知识解析概念关系图；
[0055]
图4工艺合并示例示意图；
[0056]
图5工艺知识图谱的形式化表示示例(部分)示意图。
具体实施方式
[0057]
本发明由三步组成：
[0058]
第一步为工艺知识图谱模式层构建。使用国际化工业标准step-nc和工艺国家标准文件作为规则类工艺知识，分别采用自顶向下和自底向上相结合的方式，完成工艺知识图谱基本模式层和工艺知识图谱扩展模式层的构建。
[0059]
1)自顶向下构建工艺知识图谱基本模式层：基本模式层使用国际化工业标准step-nc中的数据段作为数据来源。step-nc数据模型图如下图1所示。
[0060]
使用开源的本体编辑器prot
égé
作为图形化的人机界面，采用文献[1]方法将国际化工业标准step-nc中的概念、关系及层次结构映射到具有丰富语义表达的本体进行表示，得到工艺知识图谱基本模式层(process knowledge graph basic schema)pkgbs＝《es，ns，rs》，其中es表示实体概念结点，ns为属性边，rs表示多条边连接的概念之间的关系，在prot
égé
中以xml格式的本体文件存储。
[0061]
其中，文献[1]为：chhim p，chinnam rb，sadawi n.product design and manufacturing process based ontology formanufacturing knowledge reuse[j].journal of intelligent manufacturing，2019，30(2)：905-916
[0062]
举例：此过程具体的映射关联关系如图2所示。其中左图的step-nc标准中，两个实体之间拥有子类型或拥有属性的关系转化为本体模式类和类之间具体唯一的节点关系，包含拥有工件、具有操作、具有特征和具有子类。而左图中的set[0：？]关系代表工件可以进行机械加工，set[0：？]映射为本体模式中方案的具有操作。此例中得到的工艺知识图谱基本模式层的概念集为{方案，工件，机械加工，加工特征，槽腔，狭槽，步骤}。
[0063]
2)自底向上构建工艺知识图谱扩展模式层：主要包括工艺知识解析和工艺知识合并两步。
[0064]
(1)工艺知识解析
[0065]
工艺知识解析是在工艺文件的基础上，采用开源的斯坦福自然语言处理软件，提取工艺知识中加工特征、工艺属性、加工方法概念及关系，得到工艺知识解析图(process knowledge analysis)pka＝《es，ns，rs》，其中es表示实体概念结点，ns为属性边，rs表示多条边连接的概念之间的关系。工艺文件来自于国家标准文件gb/t 4863-2008(机械制造工艺基本术语)、gb/t 1008-2008(机械加工工艺装备基本术语)。
[0066]
举例：示例工艺知识解析概念关系图如图3所示。
[0067]
(2)工艺知识合并
[0068]
工艺知识合并过程是比较工艺知识图谱基本模式层与工艺知识解析得到的概念间的语义相似性。包括以下2种情形：
[0069]
1)语义相似度。输入工艺知识图谱基本模式层实体概念集e＝{e1，e2，es，
…
}和工艺知识解析实体概念集e＝{e1，e2，e3，
…
}，则2个概念之间的语义相似度c
sim
(ei，ej)为
[0070][0071]
式中，0≤c
sim
(ei，ej)≤1，|ei∩ej|表示ei和ej共有的概念数目，|ei|表示概念ei的数目，且|ei|》0。当|ei∩ej|＝|ei|时，c
sim
(ei，ej)＝1，表示ei和ej的相似度为1，此时工艺知识图谱基本模式层完全覆盖解析出的工艺知识概念；当|ei∩ej|＝0时，c
sim
(ei，ej)＝0，此时工艺知识图谱基本模式层未包含解析出的工艺知识概念，则将解析出的工艺知识概念添加到工艺知识图谱基本模式层。
[0072]
当0＜|ei∩ej|＜|ei|，0＜c
sim
(ei，ej)＜1时，表示ei和ej语义相关，此时需要计算语义相关度。
[0073]
2)语义相关度。给定概念ej的属性集为p(ej)＝{p
i1
，p
i2
，
…
}，当p(ej)＝null时，则概念的语义相关性c
rel
(ei，ej)为
[0074][0075]
式中，c
dis
(ei，ej)表示结点ei到ej的语义距离，实质上为结点ei到ej经过的路径长度。
[0076]
当工艺知识概念具有某个属性p
ij
∈p(ej)时，其属性值为vi(p
ij
)由以下几种情形组成：
①
单一数值类型v1(p
ij
)，例如圆度公差值为0.03mm；
②
最大最小数值类型v2(p
ij
)，例如对于槽腔特征，加工精度为it8-it9，ra为3.2～6.3μm；
③
字符串数值类型v
string
(p
ij
)，例如材料类型为钛合金。则概念属性值的相似性a
sim
(p(ei)，p(ej))为
frequency-inverse document frequency)方法得到。其具体的计算公式如下
[0089][0090]
式中，{f(ti，ki)|ti∈ki}表示ti在工艺实例数据ki中出现的频率；{f(tj，ki)|tj∈ki}为工艺实例数据ki中出现所有实体概念的次数之和；k表示工艺实例数据集；|k|指的是工艺实例数据数量；|ki∈k|ti∈ki|表示包含ti的工艺实例数据数量；若此时|ki∈k|ti∈ki|＝0。
[0091]
根据公式(6)可得到工艺知识图谱模式层候选实体概念与工艺实例数据集的关联矩阵，可表示为
[0092][0093]
式中，n为工艺知识图谱模式层的候选实体概念数量，m为工艺实例数据数量。
[0094]
例如，从工艺实例数据中随机选取16个孔特征加工工艺实例数据，依次编号为k1，k2，...，k
16
；并从工艺知识图谱模式层中得到孔径、加工精度、表面粗糙度、材料、深径比、批量、单件等14个候选概念；若非淬火钢在ki1中出现的次数为1，且16个工艺实例数据包含非淬火钢的数量为10；候选概念在实例k1中出现的次数之和为4，则根据公式(6)计算非淬火钢在k1的权重ωi＝0.062则，依据公式(6)和(7)可得工艺知识图谱模式层候选概念与工艺实例的关联矩阵
[0095][0096]
其中，矩阵的行表示pkgs候选概念，列表示孔特征加工工艺实例，同时矩阵中的数值表示pkgs的候选概念相对于该工艺实例的重要度。矩阵k
14
×
16
为稀疏矩阵，需要对原关联矩阵进行进一步处理。
[0097]
(2)对kn×m进行降维分解。为了解决原关联矩阵的稀疏性和维数灾难，利用奇异值分解(singular valued composition，svd)对原关联矩阵进行降维分解，以获取工艺知识图谱模式层概念与工艺实例的特征语义空间。
[0098]
将kn×m转化为n阶和m阶正交矩阵u和v，该矩阵的秩为r。
[0099][0100]
∑＝[λ1，λ2，
…
，λn]，且λ1≥λ2≥
…
≥≥λr[0101]
式中，u为k的左奇异矩阵，其行向量为k的左奇异向量，即kk
t
的特征向量，v为k的右奇异矩阵，其列向量为kk
t
的右奇异向量，λi为k的第i个奇异值(特征值)。
[0102]
其中，u中每一行对应的是工艺知识图谱模式层概念的向量表示，v中每一列对应的是工艺实例的向量表示。
[0103]
(3)计算实例之间的相似度。实例间的相似度计算公式为
[0104][0105]
公式(9)中，ki，kj分别表示工艺实例集k中的2个工艺实例，且i≠j；vi，vj分别为第i，j个工艺实例向量；||ki||2，||kj||2为对应向量的二范数。由公式(9)可计算得到所有工艺实例间的相似度，由计算得到-1≤b
sim
(ki，kj)≤1。然而，由于作为度量值其值应为非负，则b
′
sim
(ki，kj)定义如下：
[0106][0107]
利用公式(9)和(10)对关联矩阵进行计算可以得到工艺实例间的语义相似度。
[0108]
然后将工艺实例作为结点，实例间的语义相似度作为边，采用文献[2]中的k-means智能聚类算法对工艺实例进行聚类，获得工艺知识图谱数据层(process knowledge graph data)pkgd＝《ed，nd，rd》，ed表示实体或实例结点，nd表示属性边，rd为2个实例结点间的关系。
[0109]
文献[2]为wong jaha.algorithm as 136：a k-means clustering algorithm[j].joumal of the royal statistical society，1979，28(1)：100-108.
[0110]
第三步是工艺知识图谱的形式化表示。工艺知识图谱由模式层(pkgs)和数据层(pkgd)组成，即工艺知识图谱(process knowledge graph)pkg＝《pkgs，pkgd，r》，其中r为pkgs和pkgd的关系。
[0111]
下图5为工艺知识图谱的形式化表示示例。工艺知识图谱模式图pkgs＝es，ns，rs》，其中es表示概念结点，ns，为属性边，rs表示多条边连接的概念之间的关系。工艺知识图谱数据图pkgd＝《ed，nd，rd》，ed表示实体或实例结点，如图5中实体孔，it8，45#等，nd表示属性边，例如孔和ra6.3相连的边，rd为2个实例结点间的关系，例如k5和k8的连接边，其ω
58
为工艺实例的语义相似度。
[0112]
其中，s只是代表模式层(schema)的一个下标，d是数据层(data)的下标，为了区分不同的图。此外，第三步骤中pkgs中的es就是从第一步骤中得到的。
[0113]
以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

技术特征：
1.一种面向工艺知识的知识图谱构建方法，其特征在于，包括如下步骤：s1、工艺知识图谱模式层构建：使用国际化工业标准step-nc和工艺国家标准文件作为规则类工艺知识，分别采用自顶向下和自底向上相结合的方式，完成工艺知识图谱基本模式层和工艺知识图谱扩展模式层的构建；s2、工艺知识图谱数据层构建：基于美国ndr系统数据库的工艺实例数据，进行构建；包括如下子步骤：s21、数据预处理：所述工艺实例数据利用向量空间模型形式化表示，即ki＝{(t1，ω1)，(t2，ω2)，
…
，(t
n
，ω
n
)}
ꢀꢀꢀꢀ
(5)式中，t
i
为工艺知识图谱模式层的第i个实体概念，ω
i
为t
i
相对于工艺实例数据的重要程度，n表示工艺知识图谱模式层的实体概念数量；其中ω
i
的计算采用tf-idf方法得到，具体的计算公式如下式中，{f(t
i
，k
i
)|t
i
∈k
j
}表示t
i
在工艺实例数据k
i
中出现的频率；{f(t
j
，k
i
)|t
j
∈k
i
}为工艺实例数据k
i
中出现所有实体概念的次数之和；k表示工艺实例数据集；|k|指的是工艺实例数据数量；|k
i
∈k|t
i
∈k
i
|表示包含t
i
的工艺实例数据数量；若此时|k
i
∈k|t
i
∈k
i
|＝0。根据公式(6)可得到工艺知识图谱模式层候选实体概念与工艺实例数据集的关联矩阵，可表示为式中，n为工艺知识图谱模式层的候选实体概念数量，m为工艺实例数据数量；其中，矩阵的行表示pkgs候选概念，列表示孔特征加工工艺实例，同时矩阵中的数值表示pkgs的候选概念相对于该工艺实例的重要度；s22、降维分解利用奇异值分解对原关联矩阵k
n
×
m
进行降维分解，以获取工艺知识图谱模式层概念与工艺实例的特征语义空间，具体说，将k
n
×
m
转化为n阶和m阶正交矩阵u和v，该矩阵的秩为r。∑＝[λ1，λ2，...，λ
n
]，且λ1≥λ2≥
…
≥≥λ
r
式中，u为k的左奇异矩阵，其行向量为k的左奇异向量，即kk
t
的特征向量，v为k的右奇异矩阵，其列向量为kk
t
的右奇异向量，λ
i
为k的第i个奇异值；其中，u中每一行对应的是工艺知识图谱模式层概念的向量表示，v中每一列对应的是工艺实例的向量表示；
s23、计算实例之间的相似度；计算公式为公式(9)中，k
i
，k
j
分别表示工艺实例集k中的2个工艺实例，且i≠j；v
i
，v
j
分别为第i，j个工艺实例向量；||k
i
||2，||k
j
||2为对应向量的二范数。由公式(9)可计算得到所有工艺实例间的相似度，由计算得到-1≤b
sim
(k
i
，k
j
)≤1。然而，由于作为度量值其值应为非负，则b
′
sim
(k
i
，k
j
)定义如下：利用公式(9)和(10)对关联矩阵进行计算可以得到工艺实例间的语义相似度；然后将工艺实例作为结点，实例间的语义相似度作为边，采用k-means智能聚类算法对工艺实例进行聚类，获得工艺知识图谱数据层pkgd＝＜e
d
，n
d
，r
d
＞，e
d
表示实体或实例结点，n
d
表示属性边，r
d
为2个实例结点间的关系；s3、工艺知识图谱的形式化表示，所述工艺知识图谱由模式层pkgs和数据层pkgd组成，pkg＝<pkgs，pkgd，r>，其中r为pkgs和pkgd的关系；此外，pkgs＝<e
s
，n
s
，r
s
>，其中，e
s
表示模式层的概念结点，n
s
为模式层的属性边，r
s
表示模式层中多条边连接的概念之间的关系；pkgd＝<e
d
，n
d
，r
d
>，e
d
表示数据层的实体或实例结点，n
d
表示数据层的属性边，r
d
为数据层中2个实例结点间的关系。2.根据权利要求1所述面向工艺知识的知识图谱构建方法，其特征在于，步骤s1包括如下子步骤：s11、自顶向下构建工艺知识图谱基本模式层：基本模式层使用国际化工业标准step-nc中的数据段作为数据来源，使用开源的本体编辑器prot
é
g
é
得到工艺知识图谱基本模式层pkgbs＝<e
s
，n
s
，r
s
>，其中e
s
表示实体概念结点，n
s
为属性边，r
s
表示多条边连接的概念之间的关系，在prot
é
g
é
中以xml格式的本体文件存储；s12、自底向上构建工艺知识图谱扩展模式层：主要包括工艺知识解析和工艺知识合并两步，具体说：s121、工艺知识解析，基于开源的斯坦福自然语言处理软件，提取工艺知识中加工特征、工艺属性、加工方法概念及关系，得到工艺知识解析图pka＝<e
s
，n
s
，r
s
>，其中e
s
表示实体概念结点，n
s
为属性边，r
s
表示多条边连接的概念之间的关系；工艺文件来自于国家标准文件gb/t 4863-2008机械制造工艺基本术语、gb/t 1008-2008机械加工工艺装备基本术语；s122、工艺知识合并：需要比较工艺知识图谱基本模式层与工艺知识解析得到的概念间的语义相似性；包括以下2种情形：s1221语义相似度。输入工艺知识图谱基本模式层实体概念集e＝{e1，e2，e3，
…
}和工艺知识解析实体概念集e＝{e1，e2，e3，
…
}，则2个概念之间的语义相似度c
sim
(e
i
，e
j
)为
式中，0≤c
sim
(e
i
，e
j
)≤1，|e
i
∩e
j
|表示e
i
和e
j
共有的概念数目，|e
i
|表示概念e
i
的数目，且|e
i
|>0。当|e
i
∩e
j
|＝|e
i
|时，c
sim
(e
i
，e
j
)＝1，表示e
i
和e
j
的相似度为1，此时工艺知识图谱基本模式层完全覆盖解析出的工艺知识概念；当|e
i
∩e
j
|＝0时，c
sim
(e
i
，e
j
)＝0，此时工艺知识图谱基本模式层未包含解析出的工艺知识概念，则将解析出的工艺知识概念添加到工艺知识图谱基本模式层；当0＜|e
i
∩e
j
|＜|e
i
|，0＜c
sim
(e
i
，e
j
)＜1时，表示e
i
和e
j
语义相关，此时需要计算语义相关度；s1222语义相关度。给定概念e
j
的属性集为p(e
j
)＝{p
i1
，p
i2
，
…
}，当p(e
j
)＝null时，则概念的语义相关性c
rel
(e
i
，e
j
)为式中，c
dis
(e
i
，e
j
)表示结点e
i
和e
j
的语义距离，实质上为结点e
i
到e
j
经过的路径长度；当工艺知识概念具有某个属性p
ij
∈p(e
j
)时，其属性值为v
i
(p
ij
)由以下几种情形组成：
①
单一数值类型v1(p
ij
)，
②
最大最小数值类型v2(p
ij
)，
③
字符串数值类型v
string
(p
ij
)；则，概念属性值的相似性a
sim
(p(e
i
)，p(e
j
))为在公式(3)基础上，其概念的语义相关性c
rel
(e
i
，e
j
)可以表示为式中，0≤ω(p(e
j
))≤1表示属性信息的权重值。当属性信息为材料时，ω(p(e
j
))＝0.55，否则ω(p(e
j
))＝0.45；i(e
i
，e
j
)为概念e
i
，e
j
的引导函数，若解析的工艺知识概念e
j
包含属性信息，则i(e
i
，e
j
)＝1；若e
i
≠e
j
，则i(e
i
，e
j
)＝0；α＝0.5；对于解析的工艺知识概念，δ为语义相似度最大阈值，取δ＝0.5，当c
sim
<δ时，需要计算语义相关性，ε为语义相关度的最小阈值，取ε＝0.4；当c
rel
>ε时，则将抽取的工艺知识概念及属性信息合并到工艺知识图谱基本模式层；合并后得到工艺知识图谱的模式层pkgbs＝＜e
′
s
，n
′
s
，r
′
s
>，其中e
′
s
表示概念结点，n
′
s
为属性边，r
′
s
表示多条边连接的概念之间的关系。

技术总结
本发明公开了一种面向工艺知识的知识图谱构建方法，包括步骤：S1、工艺知识图谱模式层构建：使用国际化工业标准step-NC和工艺国家标准文件作为规则类工艺知识，分别采用自顶向下和自底向上相结合的方式，完成工艺知识图谱基本模式层和工艺知识图谱扩展模式层的构建；S2、工艺知识图谱数据层构建：基于美国NDR系统数据库的工艺实例数据，进行构建；S3、工艺知识图谱的形式化表示。本发明旨在使用知识图谱技术统一化表征工艺知识，有效地消除了工艺知识本身存在的异构性，从而使得不同层次之间的知识能够相互共享，为研究智能工艺制造领域知识图谱奠定坚实基础。图谱奠定坚实基础。

技术研发人员：周婷婷金博
受保护的技术使用者：大连理工大学
技术研发日：2023.06.26
技术公布日：2023/10/8

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种通信车用自动接地机构及方法与流程 下一篇：一种适用于网络安全发展的考核成果展示方法及系统与流程

一种面向工艺知识的知识图谱构建方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种面向工艺知识的知识图谱构建方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表