知识图谱构建方法、装置、计算机设备和存储介质与流程

未命名 10-19 阅读:102 评论:0


1.本技术涉及人工智能技术领域,特别是涉及一种知识图谱构建方法、装置、计算机设备和存储介质。


背景技术:

2.随着信息化的飞速发展,各行业均存在不同量级的历史数据沉淀。利用现有数据资源,将累积数据转化为高质量的知识库成为提升竞争力的重要手段。知识图谱以图数据结构的形式描述实体对象及其相互关系,能够直观地呈现真实世界里的复杂实体关系。基于知识图谱的方法能够有效利用数据之间的联系,提升数据利用水平,目前已经在金融、电商等垂直领域得到广泛的落地应用。
3.目前针对结构化数据在构建知识图谱时,需要人工确定筛选各数据表,获取数据表中的实体数据,再基于实体数据间的关系,人工构建知识图谱,不仅效率低,而且构建得到的知识图谱准确性较低。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种可自动且准确的构建知识图谱构建方法、装置、计算机设备和存储介质。
5.第一方面,本技术提供了一种知识图谱构建方法。该方法包括:
6.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
7.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
8.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
9.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
10.在其中一个实施例中,根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:
11.根据各数据表的表内容,确定各数据表的候选关键字段;
12.从各数据表的候选关键字段中,确定各数据表的主键实体;
13.将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
14.在其中一个实施例中,根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:
15.针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;
16.若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关
系。
17.在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
18.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;
19.根据实体关系数据表,构建知识图谱。
20.在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:
21.根据各数据表对应的主键实体和属性实体,创建实体数据表;
22.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;
23.根据实体数据表和关系数据表,创建实体关系数据表。
24.在其中一个实施例中,关联信息包括关系类型、关系名称、关系属性和关联实体。
25.在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
26.根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;
27.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;
28.根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
29.第二方面,本技术还提供了一种知识图谱构建装置。该装置包括:
30.第一确定模块,用于根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
31.第二确定模块,用于根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
32.第三确定模块,用于根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
33.构建模块,用于根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
34.第三方面,本技术还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
35.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
36.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
37.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关
联关系的主键实体之间的关系信息;
38.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
39.第四方面,本技术还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
40.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
41.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
42.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
43.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
44.第五方面,本技术还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
45.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
46.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
47.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
48.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
49.上述知识图谱构建方法、装置、计算机设备和存储介质,根据各数据表的表内容,可确定各数据表对应的主键实体和属性实体,再根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,可确定各数据表的主键实体之间的关联关系,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息,最后根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,可自动实现对知识图谱的构建,相较于传统的知识图谱构建方法,不仅构建效率更高,而且构建得到的知识图谱的更加准确。
附图说明
50.图1为本实施例提供的知识图谱构建方法的应用环境图;
51.图2为本实施例提供的第一种知识图谱构建方法的流程示意图;
52.图3为本实施例提供的构建知识图谱的流程示意图;
53.图4为本实施例提供的创建实体关系数据表的流程示意图;
54.图5为本实施例提供的实体数据表结构示意图;
55.图6为本实施例提供的关系数据表的结构示意图;
56.图7为本实施例提供的第二种知识图谱构建方法的流程示意图;
57.图8为本实施例提供的知识图谱构建装置的结构框图;
58.图9为本实施例提供的计算机设备的内部结构图。
具体实施方式
59.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
60.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异常数据的获取数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种知识图谱构建方法。
61.在其中一个实施例中,提供了一种知识图谱构建方法,如图2所示,包括以下步骤:
62.s201,根据各数据表的表内容,确定各数据表对应的主键实体和属性实体。
63.其中,数据表是指结构化数据表。表内容是指结构化数据表中的内容。主键实体是指基于结构化数据表中的表内容进行分析,确定得到的实体;主键数据用于唯一标识表中的每一条数据,主键不能为空,不能重复。属性实体是指数据表中用于表征主键实体属性的字段。
64.本实施例一种可选的实施方式为:对各数据表的表内容进行特征分析,则根据特征分析结果,确定各数据表对应的主键实体和属性实体。例如,对某一数据表进行分析,发现数据表中的内容主要为学生姓名、学生学号、各科成绩、年龄等。则可将学生学号作为主键实体,学生姓名、各科成绩、年龄等作为属性实体。
65.本实施例另一种可选的实施方式为:根据各数据表的表内容,确定各数据表的候选关键字段,从各数据表的候选关键字段中,确定各数据表的主键实体,将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。其中,候选关键字段是指数据表中的内容字段,例如数据表中的表头字段。
66.根据各数据表的表内容,确定各数据表的候选关键字段,一种可选的实施方式为:根据各数据表的表内容,获取各数据表中的表头字段,作为各数据表的候选关键字段。
67.根据各数据表的表内容,确定各数据表的候选关键字段,另一种可选的实施方式为:根据各数据表的表内容,获取各数据表中各行或各列的数据字段,对各数据表中各行或各列的数据字段进行特征分析,得到各行或各列的数据字段对应的特征语义字段,作为各数据表的候选关键字段。示例性的,例如对数据表中某列数据字段(例如120103xxxxxxxxxxxx)进行特征分析,特征分析的结果为该数据字段为身份证号,则将身份证号作为该列的特征语义字段,即候选关键字段。
68.从各数据表的候选关键字段中,确定各数据表的主键实体的一种可选实施方式为:对各数据表的候选关键字段进行语义分析,确定能够唯一标识一条记录的表头字段作为主键实体。
69.从各数据表的候选关键字段中,确定各数据表的主键实体的另一种可选的实施方
式为:对各数据表的候选关键字段输入至训练好的神经网络模型中,由训练好的神经网络模型输出能够唯一标识一条记录的表头字段,作为主键实体。
70.s202,根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系。
71.可选的,本实施例中针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表,若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关系,若不存在,则确定该数据表的主键实体与关联数据表的主键实体之间不具有关联关系。其中,关联数据表是指某一数据表的主键实体与另一数据表的属性实体一致,则说明两个数据表之间属于关联数据表。
72.s203,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息。
73.其中,关系信息是指具有关联关系的两个数据表的主键之间的关系的相关信息,例如关系类型、关系属性和关系名称等。
74.本实施例一种可选的实施方式为:根据对具有关联关系的主键实体对应的数据表的主键实体和属性实体进行分析比对,基于分析比对结果,确定具有关联关系的主键实体之间的关系信息。例如,具有关联关系的学生信息表和老师信息表,经过比对分析(例如比对表内容中的年级、课程、班级等),可确定关系信息(例如关系名称为师生关系,关系类型为教育关系,关系属性包括年级、课程和班级等)。
75.本实施例另一种可选的实施方式为:将具有关联关系的主键实体对应的数据表的主键实体和属性实体,输入至第一模型(例如聚类模型),得出具有关联关系的数据表对应的实体标签(每个数据表对应一个实体标签),再将具有关联关系的不同数据表的实体标签输入至第二模型(例如语义分析模型),由第二模型基于实体标签分析不同实体标签之间的关系信息。例如,将具有联关系的主键实体对应的学生数据表和老师数据表的主键实体和属性实体输入至第一模型,第一模型根据学生数据表的主键实体和属性实体输出的实体标签为学生标签,第一模型根据老师数据表的主键实体和属性实体输出的实体标签为老师标签,再将学生标签和老师标签输入至第二模型,由第二标签对学生标签和老师标签进行语义分析,确定具有关联关系的主键实体之间的关系信息。
76.需要说明的是,本实施例中的实体标签在构建知识图谱时,可作为该数据表在知识图谱中的节点名称。
77.s204,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
78.其中,知识图谱是指一种语义网络,是基于图的数据结构,包括实体节点和实体节点之间的关系。
79.可选的,本实施例中可根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性,根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息,根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。具体的,根据各数据表对应的主键实体,确定节点名称,根据各数据表对应的属性实体确定节点属性,根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体
之间的关系信息(可将关联关系看作知识图谱中节点与节点之间的连接线,关系信息用于定义该连接线的相关信息),确定知识图谱节点之间的拓扑关系和关系信息,根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
80.本实施例根据各数据表的表内容,可确定各数据表对应的主键实体和属性实体,再根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,可确定各数据表的主键实体之间的关联关系,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息,最后根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,可自动实现对知识图谱的构建,相较于传统的知识图谱构建方法,不仅构建效率更高,而且构建得到的知识图谱的更加准确。
81.在其中一个实施例中,为了更加快速、准确的构建知识图谱,如图3所示,s204中,一种可选实施方式,包括:
82.s301,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表。
83.其中,实体关系数据表是指既能体现主键实体的属性信息,又能体现主键实体键的关联信息和关系信息的数据表,实体关系数据表的格式可以但不限于为xls格式、csv格式、mysql数据库文件对应的格式等。
84.本实施例一种可选的实施方式为:将各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息等输入至神经网络模型,由神经网络模型输出实体关系数据表。
85.本实施例另一种可选的实施方式为:根据各数据表对应的主键实体和属性实体,确定实体节点,根据属性实体,确定实体节点的属性信息,根据各数据表的主键实体之间的关联关系,确定实体节点之间的边,根据具有关联关系的主键实体之间的关系信息确定边属性,根据实体节点、实体节点的属性信息、实体节点之间的边,以及实体节点之间的边属性,创建实体关系数据表。
86.s302,根据实体关系数据表,构建知识图谱。
87.本实施例一种可选的实施方式为:根据实体关系数据表,抽取内部的实体数据和关系数据,对实体数据和关系数据进行综合分析,构建知识图谱。其中,实体数据中包括各数据表对应的主键实体和属性实体,关系数据中包括各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息。
88.本实施例另一种可选的实施方式为:将实体关系数据表到入至图数据库中,由图数据库基于实体关系数据表构建知识图谱。
89.本实施例中根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,并根据实体关系数据表,可快速构建知识图谱。
90.在其中一个实施例中,为了快速构建实体关系数据表,如图4所示,s301可选实施方式为:
91.s401,根据各数据表对应的主键实体和属性实体,创建实体数据表。
92.其中,实体数据表是指基于主键实体和属性实体创建的拓扑结构表。
93.可选的,本实施例中根据各数据表的主键实体,确定实体数据表中的实体节点的名称和类型,根据属性实体确定实体节点的实体属性。具体的,如图5所示,实体数据表一级节点为实体主题节点,二级节点为实体名称(每个实体具有唯一的名称,知识图谱中一般具有多个实体,即实体名称的数量一般为多个),三级节点是与二级节点的实体名称对应的实体类型和实体属性,四级节点为三级节点的实体属性的属性分支,五级节点为四级节点的属性分支对应的属性名称和数据来源。其中,数据来源是指该实体属性所属数据表的数据来源,例如,xx数据库、xx平台等。
94.s402,根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表。
95.其中,关系数据表是指基于实体主键之间的关联关系和具有关联关系的实体主键之间的关系信息创建得到的拓扑结构表。
96.可选的,本实施例中根据各数据表的主键实体之间的关联关系,可确定关联实体,根据具有关联关系的主键实体之间的关系信息,可确定关系信息中的关系名称、关系类型和关系属性。其中,关联实体是指存在关联关系的主键实体。具体的,如图6所示,实体数据表一级节点为关系主题节点,二级节点为关系名称,三级节点是与二级节点的关系名称对应的关系类型、实体属性和关联实体,四级节点为三级节点的关系属性的属性分支,五级节点为四级节点的属性分支对应的属性名称。
97.s403,根据实体数据表和关系数据表,创建实体关系数据表。
98.可选的,可将实体数据表和关系数据表导入至同一数据表中,进而得到实体关系数据表。也可将实体数据表和关系数据表保存为数据表组,作为实体关系数据表。即,将相互关联的实体数据表和关系数据表单独保存在同一文件中,该文件作为数据表组。
99.本实施例根据各数据表对应的主键实体和属性实体,创建实体数据表,根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表,根据实体数据表和关系数据表,可快速创建实体关系数据表。
100.在其中一个实施例中,如图7所示,一种知识图谱构建方法可选的实施方式,包括:
101.s701,根据各数据表的表内容,确定各数据表的候选关键字段。
102.s702,从各数据表的候选关键字段中,确定各数据表的主键实体。
103.s703,将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
104.s704,针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表。
105.s705,若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关系。
106.s706,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息。其中,关联信息包括关系类型、关系名称、关系属性和关联实体。
107.s707,根据各数据表对应的主键实体和属性实体,创建实体数据表。
108.s708,根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表。
109.s709,根据实体数据表和关系数据表,创建实体关系数据表。
110.s7010,根据实体关系数据表,构建知识图谱。
111.本实施例根据各数据表的表内容,可确定各数据表对应的主键实体和属性实体,再根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,可确定各数据表的主键实体之间的关联关系,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息,最后根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,可自动实现对知识图谱的构建,相较于传统的知识图谱构建方法,不仅构建效率更高,而且构建得到的知识图谱的更加准确。
112.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
113.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的知识图谱构建方法的知识图谱构建装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个知识图谱构建装置实施例中的具体限定可以参见上文中对于知识图谱构建方法的限定,在此不再赘述。
114.在其中一个实施例中,如图8所示,提供了一种知识图谱构建装置1,包括:第一确定模块10、第一确定模块20、第三确定模块30和构建模块40,其中:
115.第一确定模块10,用于根据各数据表的表内容,确定各数据表对应的主键实体和属性实体。
116.第二确定模块20,用于根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系。
117.第三确定模块30,用于根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息。
118.构建模块40,用于根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
119.在其中一个实施例中,上图8中的第一确定模块10,进一步包括:
120.第一确定单元,根据各数据表的表内容,确定各数据表的候选关键字段。
121.第二确定单元,用于从各数据表的候选关键字段中,确定各数据表的主键实体。
122.第三确定单元,用于将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
123.在其中一个实施例中,上图8中的第二确定模块20,进一步包括:
124.判断单元,用于针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表。
125.第四确定单元,用于若存在,则确定该数据表的主键实体与关联数据表的主键实
体之间具有关联关系。
126.在其中一个实施例中,上图8中的构建模块40,进一步包括:
127.创建单元,用于根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表。
128.构建单元,用于根据实体关系数据表,构建知识图谱。
129.在其中一个实施例中,上述实施例中的创建单元,还具体用于:根据各数据表对应的主键实体和属性实体,创建实体数据表;根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;根据实体数据表和关系数据表,创建实体关系数据表。
130.在其中一个实施例中,上述实施例中的构建模块,还具体用于:根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
131.上述知识图谱构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
132.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各数据表的相关内容和数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种知识图谱构建方法。
133.本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
134.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
135.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
136.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
137.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
138.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
139.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:
140.根据各数据表的表内容,确定各数据表的候选关键字段;
141.从各数据表的候选关键字段中,确定各数据表的主键实体;
142.将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
143.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:
144.针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;
145.若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关系。
146.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
147.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;
148.根据实体关系数据表,构建知识图谱。
149.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:
150.根据各数据表对应的主键实体和属性实体,创建实体数据表;
151.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;
152.根据实体数据表和关系数据表,创建实体关系数据表。
153.在一个实施例中,处理器执行计算机程序时还实现以下步骤:关联信息包括关系类型、关系名称、关系属性和关联实体。
154.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
155.根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;
156.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;
157.根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
158.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
159.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
160.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
161.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
162.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
163.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:
164.根据各数据表的表内容,确定各数据表的候选关键字段;
165.从各数据表的候选关键字段中,确定各数据表的主键实体;
166.将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
167.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:
168.针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;
169.若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关系。
170.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
171.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;
172.根据实体关系数据表,构建知识图谱。
173.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:
174.根据各数据表对应的主键实体和属性实体,创建实体数据表;
175.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;
176.根据实体数据表和关系数据表,创建实体关系数据表。
177.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:关联信息包括关系类型、关系名称、关系属性和关联实体。
178.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
179.根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点
属性;
180.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;
181.根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
182.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
183.根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
184.根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
185.根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
186.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
187.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:
188.根据各数据表的表内容,确定各数据表的候选关键字段;
189.从各数据表的候选关键字段中,确定各数据表的主键实体;
190.将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
191.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:
192.针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;
193.若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关系。
194.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
195.根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;
196.根据实体关系数据表,构建知识图谱。
197.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:
198.根据各数据表对应的主键实体和属性实体,创建实体数据表;
199.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;
200.根据实体数据表和关系数据表,创建实体关系数据表。
201.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:关联信息包括关系类型、关系名称、关系属性和关联实体。
202.在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
203.根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;
204.根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;
205.根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
206.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
207.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
208.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种知识图谱构建方法,其特征在于,所述方法包括:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的所述属性实体之间的关系,确定各数据表的主键实体之间的关联关系;根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。2.根据权利要求1所述的方法,其特征在于,所述根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:根据各数据表的表内容,确定各数据表的候选关键字段;从各数据表的所述候选关键字段中,确定各数据表的主键实体;将各数据表的候选关键字段中除所述主键实体外的其他各候选关键字段作为各数据表的属性实体。3.根据权利要求1所述的方法,其特征在于,所述根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的所述属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;若存在,则确定该数据表的主键实体与所述关联数据表的主键实体之间具有关联关系。4.根据权利要求1所述的方法,其特征在于,所述根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;根据实体关系数据表,构建知识图谱。5.根据权利要求4所述的方法,其特征在于,所述根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:根据各数据表对应的主键实体和属性实体,创建实体数据表;根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;根据实体数据表和关系数据表,创建实体关系数据表。6.根据权利要求1-5中任一项所述的方法,其特征在于,所述关联信息包括关系类型、关系名称、关系属性和关联实体。7.根据权利要求1所述的方法,其特征在于,所述根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。8.一种知识图谱构建装置,其特征在于,包括:第一确定模块,用于根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;第二确定模块,用于根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的所述属性实体之间的关系,确定各数据表的主键实体之间的关联关系;第三确定模块,用于根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;构建模块,用于根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的知识图谱构建方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的知识图谱构建方法的步骤。11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的知识图谱构建方法的步骤。

技术总结
本申请涉及一种知识图谱构建方法、装置、计算机设备和存储介质。属于人工智能技术领域,所述方法包括:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,可自动实现对知识图谱的构建,不仅构建效率更高,而且构建得到的知识图谱的更加准确。而且构建得到的知识图谱的更加准确。而且构建得到的知识图谱的更加准确。


技术研发人员:李敏 汪美玲
受保护的技术使用者:工银科技有限公司
技术研发日:2023.04.28
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐