基于知识图谱的数据查询方法、系统、设备及存储介质与流程
未命名
07-14
阅读:122
评论:0
1.本技术实施例涉及通信领域,特别涉及一种基于知识图谱的数据查询方法、系统、设备及存储介质。
背景技术:
2.目前,基于知识图谱的数据查询方法主要有两种,一种是采用遍历整个数据源的方式,但这种方式在大规模数据场景下基本不可用,也无法达到实时查询的效果;另一种则是引入外部离线任务,即引入外部的分布式计算组件来帮助数据查询,但这种方法需要额外的计算资源,成本高、系统复杂,且同样无法实现实时查询。
技术实现要素:
3.本技术实施例的主要目的在于提出一种基于知识图谱的数据查询方法、系统、设备及存储介质,实现快速、实时获取数据查询结果。
4.为实现上述目的,本技术实施例提供了一种基于知识图谱的数据查询方法,包括:获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。
5.为实现上述目的,本技术实施例还提出了一种基于知识图谱的数据查询系统,包括:
6.意图解析模块,用于获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;
7.统计查询模块,用于当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;
8.遍历查询模块,用于当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。
9.为实现上述目的,本技术实施例还提出了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上实施例所述的基于知识图谱的数据查询方法。
10.为实现上述目的,本技术实施例还提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现以上实施例所述的基于知识图谱的数据查询
方法。
11.本技术提出的一种基于知识图谱的数据查询方法、系统、设备及存储介质,通过对待查询语句进行意图解析,确定待查询语句所属的查询类型,按照所属类型使用不同的查询方法,可以提高数据查询的效率,当待查询语句属于统计查询类型时,将待查询语句与路径索引进行映射确定目标索引,根据目标索引即可确定待查询语句对应的数据结果和数据结果的统计值,也就是说,本技术在统计查询时直接根据目标索引即可获取查询结果,无需遍历所有数据源,也无需在遍历完成后才能获取统计值,实现了快速、实时查询的目的。当待查询语句需要进行遍历查询时,则遍历所有的基本索引获取查询结果。
附图说明
12.一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
13.图1是本技术的实施例提供的基于知识图谱的数据查询方法的流程图一;
14.图2是本技术的实施例提供的基于知识图谱的数据查询方法的流程图二;
15.图3是本技术的实施例提供的基于知识图谱的数据查询系统的结构示意图;
16.图4是本技术的实施方式提供的电子设备的结构示意图。
具体实施方式
17.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本技术的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本技术各实施例中,为了使读者更好地理解本技术而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本技术所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本技术的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
18.本技术的实施例涉及一种基于知识图谱的数据查询方法,如图1所示,包括:
19.步骤101,获取待查询语句,并对待查询语句进行意图解析,确定待查询语句所属的查询类型。
20.在一实施例中,步骤101具体包括:对待查询语句进行意图解析,获取待查询语句对应的原子操作集合;当原子操作集合中不包含统计操作,则待查询语句为遍历查询类型;当原子操作集合中包含统计操作,则待查询语句为统计查询类型。具体地,可以通过意图解析器对待查询语句进行意图解析,比如当待查询语句为gremlin语言时,采用gremlin语言解析器对待查询语句进行意图解析。获取原子操作集合后,若原子操作集合中不包含任何统计操作,则待查询语句为遍历查询类型,若原子操作集合中包含了一个统计操作,则待查询语句为统计查询类型。
21.需要说明的是,原子操作指的是不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,在执行完毕之前不会被任何其它任务或事件中断。原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序不可以被打乱,也不可以被切割而只执行其中的一部分。将整个操作视作一个整体是原子性的核心特征。
22.步骤102,当待查询语句属于统计查询类型时,将待查询语句与预设的路径索引进
行映射,获取待查询语句对应的目标索引,并从目标索引中获取查询结果,其中查询结果包含数据结果和数据结果对应的统计值,统计值表示所述待查询语句对应的数据结果的数量。
23.在本实施例中,在确定待查询语句的所属类型后,需要将待查询语句的格式转换为路径索引的格式,然后将格式转换后的待查询语句与路径索引进行映射,从多个路径索引中确定目标索引,根据目标索引即可获取数据结果和该数据结果对应的统计值。
24.也就是说,通过路径索引可以在数据查询时直接获取符合查询语句的数据结果和对应的数据结果的数量,达到实时查询海量数据的效果,而不用遍历整个数据源,也不用最终遍历完成后才能获取数据结果对应的数量。
25.步骤103,当待查询语句属于遍历查询类型时,根据待查询语句遍历预设的基本索引,获取与待查询语句对应的查询结果。
26.本实施例中,当待查询语句属于遍历查询类型时,可以直接使用查询引擎遍历每一条基本索引获取查询结果。比如:当待查询语句为gremlin语言时,直接采用gremlin查询引擎遍历每一条基本索引,然后过滤掉重复或不合法的结果,获取查询结果。
27.需要说明的是,遍历查询类型指的是,根据待查询语句需要搜索遍历整个数据源,遍历完成后才能获取准确且完成的查询结果,而统计查询类型指的是根据待查询语句在获取查询结果同时还要对查询结果的数量进行统计。
28.本技术提出的一种基于知识图谱的数据查询方法,通过对待查询语句进行意图解析,确定待查询语句所属的查询类型,按照所属类型使用不同的查询方法,可以提高数据查询的效率,当待查询语句属于统计查询类型时,将待查询语句与路径索引进行映射确定目标索引,根据目标索引即可确定待查询语句对应的数据结果和数据结果的统计值,也就是说,本技术在统计查询时直接根据目标索引即可获取查询结果,无需遍历所有数据源,也无需在遍历完成后才能获取统计值,实现了快速、实时查询的目的。当待查询语句需要进行遍历查询时,则遍历所有的基本索引获取查询结果。
29.本技术的实施例涉及一种基于知识图谱的数据查询方法,如图2所示,包括:
30.步骤201,获取知识图谱的本体,并将知识图谱的本体进行解析,转化为图结构。
31.本实施例中,获取的知识图谱本体由数据查询方法应用场景的相关数据构成。比如:当本技术的数据查询方法应用于某公司的销售系统时,则获取该公司的销售数据,从销售数据中提取出销售知识图谱的本体。当本技术的数据查询方法应用于某公司的货物运输过程时,则获取该公司的货物流程转数据,从货物流转数据中提取出物流知识图谱的本体。当本技术的数据方法应用于对互联网信息进行舆情分析时,则获取互联网数据,对互联网数据进行分析提取出互联网数据知识图谱的本体。当然,此处仅为具体的举例,本技术的数据方法可以应用于任何场景,在此不作赘述。
32.在一实施例中,知识图谱的本体包含实体、关系和属性,所述属性包含实体属性和关系属性;步骤201具体包括:将实体映射为图结构的顶点,其中实体属性为顶点的附加信息;将关系映射为图结构的边,其中关系属性为边的附加信息;顶点和边构成图结构。
33.需要说明的是,知识图谱是一种基于图的数据结果,主要用来描述真实世界中存在的各种实体和概念,以及他们之间的关系。知识图谱的本体包含实体、关系和属性。具体地,实体可以是现实世界中的任何事务,比如:人、地方、公司、书、动物等等,关系则表达不
同实体之间的联系。属性包括实体属性和关系属性,表示实体或关系本身具体的信息。比如实体a为一个具体的人,实体a的属性包括年龄、身高、血型、学生身份。实体b为另一个具体的人,实体b的属性包括年龄、身高、血型、老师身份。实体a和实体b的关系为师生关系,则关系的属性可以包括:师生关系的开始时间、师生关系的结束时间、师生关系的地点等。另外,每个实体都具有一个实体标签,用于标识实体类型,每一个关系也有一个关系标签,用于标识关系类型。
34.具体地,实体映射为顶点,关系映射为边,实体属性作为顶点的附加信息,顶点和附加信息之间采用空边连接,空边指的是没有标签的边,表现得物理含义为该实体含有该属性。类似地,关系属性作为边的附加信息,边和边的附加信息之间采用空边连接。另外,实体还携带主谓信息,用于表示该实体和具有关系的另一个实体之间的主谓关系,比如:实体a和实体b之间具有某种关系,实体a为实体a和实体b之间关系的发起者,实体b为实体a和实体b之间关系的接受者。通过主谓信息使得每一个关系映射为一个含有附加信息的有向边。
35.步骤202,根据图结构构建基本索引。
36.在一实施例中,步骤202具体包括:分别获取每个顶点的所有附加信息的组合方式和每个边的所有附加信息的组合方式;将顶点的所有附加信息的组合方式和边的所有附加信息的组合方式合并,得到组合方式集合;将组合方式集合中的每一种组合方式作为一条基本索引。
37.值得一提的是,目前基于知识图谱的查询方法,大多需要先人工设计并创建索引,当面对海量数据时,人工构建索引的方法极易出现错误和遗漏,且人工构建的索引无法解决统计查询的问题,不适用于实时场景。而本技术根据图结构自动构建基本索引,避免了人工构建索引造成的问题,同时根据图结构构建路径索引,解决了实时查询的问题。
38.本实施例中,基本索引的构建是针对每个顶点或每个边来说的,而一个顶点或一个边的附加信息可能有多个,因此对于每个顶点或每个边来说,获取所有附加信息的组合方式,每一种组合方式作为一条基本索引,比如:有一图结构,包括:顶点a(含有附加信息a1、a2)、顶点b(含有附加信息b1、b2、b3)、顶点c(含有附加信息c1、c2),顶点a和顶点b之间存在边m1(含有附加信息m11、m12),顶点a和顶点c之间存在边m2(含有附加信息m21、m22、m23),那么顶点a附加信息的组合方式有{a1,a2,a1a2},顶点b附加信息的组合方式有{b1,b2,b3,b1b2,b1b3,b2b3},顶点c附加信息的组合方式有{c1,c2,c1c2},边m1附加信息的组合方式有{m11,m12,m11m12},边m2附加信息的组合方式有{m21,m22,m21m22},则该图结构的组合方式集合为{a1,a2,a1a2,b1,b2,b3,b1b2,b1b3,b2b3,c1,c2,c1c2,m11,m12,m11m12,m21,m22,m21m22},其中每一种组合方式为一条基本索引。
39.需要说明的是,将知识图谱的本体转化为图结构,图结构可以很容易获取数据之间的联系,从图结构中提取构建基本索引,可以很容易获取顶点(实体)的相关信息和边(关系)的相关信息,避免出现顶点和边组合或混淆的情况。另外,整个基本索引构建过程均为自动化构建,相比于人工构建的方式,节约成本且构建的过程不容易出现错误或遗漏的情况。
40.另外,在构建基本索引过程中,可以根据每个附加信息的类型,为每个附加信息设置优先级或权重,当附加信息的数量超过预设的上限值时,根据优先级或权重剔除掉低优先级的或低权重的附加信息。比如:当本技术的数据查询方法应用于销售系统时,顶点(实
体)为销售员,则顶点附加信息(属性)如年龄、身高等信息对于销售分析来说不重要,可以将这些附加信息的优先级或权重设置的低一些,顶点附加信息(属性)如工作时间、性格等信息可能对于销售分析来说比较重要,则可以将这些附加信息的优先级或权重设置的高一些。
41.步骤203,从图结构中提取查询模式,基于查询模式构建路径索引。
42.在一实施例中,步骤203具体包括:采用预设的图遍历算法遍历图结构,获取图结构中顶点之间的所有路径;将每一条路径作为一种查询模式,获取查询模式下的多个查询条件;获取每个查询条件对应的统计值,并将每一种包含多个查询条件和多个统计值的查询模式作为一条路径索引。也就是说,在构建路径索引过程中,已经对每一种查询条件的数量进行统计保存,如此,在后续数据查询过程中,只需直接抽取数据和统计值即可,从而达到了实时查询的目的。
43.本实施例中,路径索引是针对图结构中每一条路径来说的,因此通过图遍历算法获取图结构中两两顶点之间的所有路径,将每一条路径作为一种查询模式,然后确定该查询模式下对应的多个查询条件,进一步获取每个查询条件在该图结构中的数量作为查询条件的统计值。比如:本技术的数据查询方法应用于物流系统,该图结构中有20个顶点,这20个顶点均表示不同的物品,但这些物品的发货地均相同,因此当查询条件为发货地时,该查询条件对应的统计值为20。
44.进一步地,将每一条路径作为一种查询模式,获取查询模式下的多个查询条件,具体包括:分别计算每一条路径中所有顶点的所有附加信息的组合方式和每一条路径中所有边的所有附加信息的组合方式;对于每一条路径,将顶点的附加信息的组合方式和边的附加信息的组合方式合并,得到路径组合方式集合;将所述路径组合方式集合中每一种组合方式作为一个查询条件。
45.本实施例中,以图结构中路径a-b-c为例,该路径中有三个顶点a(含3个附加信息)、b(含有5个附加信息)、c(含有2个附加信息),以及两个边m1(含有1个附加信息)、m2(含有3个附加信息),然后计算这条路径中3个顶点的共10个附加信息的组合方式,并计算这条路径中2个边的共4个附加信息的组合方式。进一步,将顶点的附加信息的组合方式和边的附加信息的组合方式合并得到路径组合方式集合,这个集合中每一种组合方式都是一个查询条件。
46.在一实施例中,将顶点的附加信息的组合方式和边的附加信息的组合方式合并,得到路径组合方式集合之后,还包括:对路径组合方式集合中的每一种组合方式按照字符串大小排序。将路径组合方式集合按字符串大小排序可以提高搜索查询时的速度。
47.另外,在获取每个查询条件对应的统计值,并将每一种包含多个查询条件和多个统计值的查询模式作为一条路径索引之后,还包括:当有新的实体或新的关系加入所述路径索引时,获取所述新的实体的实体属性或新的关系的关系属性;将新的实体属性或新的关系属性与每一条路径索引进行比对,确定与所述新的实体属性或所述新的关系属性相符合的路径索引;根据所述新的实体属性或所述新的关系属性,更新与新的实体属性或新的关系属性相符合的路径索引中的查询条件和所述查询条件对应的统计值。
48.本实施例中,当有新的实体或新的关系加入路径索引时,获取该实体属性或关系属性,将实体属性或关系属性与每一条路径索引进行比对。比如:当有新的关系加入路径索
引时,确定新的关系的关系属性是描述哪两个实体之间的关系的,确定与之相符合的路径索引,即相符合的路径索引中包含有描述这两个实体的对应的附加信息。当有新的实体加入路径索引时,确定新的实体的实体属性与哪些路径索引相符合,比如:当某一路径索引中包含了多个附加信息组合方式,而这些附加信息均为多个实体的实体属性和实体间关系的关系属性,若这些实体均为销售员,且这些销售员均在同一家公司、互为同事关系,当有一个新的实体加入时,该实体同样为销售员,且与上述这些销售员互为同事关系,则新的实体属性与这一条路径索引相符合。
49.在一实施例中,在获取图结构中顶点之间的所有路径之后,还包括:根据预设的顶点附加信息类型和优先级的对应关系,为路径中所有顶点的附加信息确定优先级;根据预设的边附加信息类型和优先级的对应关系,为路径中所有边的附加信息确定优先级;当所述顶点的附加信息数量超过预设的顶点附加信息数量上限值时,根据顶点的附加信息的优先级从所有顶点的附加信息中剔除n个附加信息,n为顶点的附加信息数量与顶点附加信息数量上限值之差;当所述边的附加信息数量超过预设的边附加信息数量上限值时,根据边的附加信息的优先级从所有边的附加信息中剔除m个附加信息,m为边的附加信息数量与边附加信息数量上限值之差。
50.本实施例中,优先级的设定根据附加信息对业务的重要性、附加信息在查询时的使用频率等信息确定。当顶点(或边)附加信息的数量超过预设的顶点(边)附加信息数量上限值时,将对附加信息的优先级从高到低进行排序,剔除超出上限值且优先级等级较低的附加信息,以此来提高查询速率。
51.步骤204,获取待查询语句,并对待查询语句进行意图解析,确定待查询语句所属的查询类型。
52.步骤205,当待查询语句属于统计查询类型时,将待查询语句与预设的路径索引进行映射,获取待查询语句对应的目标索引,并从目标索引中获取查询结果,其中查询结果包含数据结果和数据结果对应的统计值,统计值表示所述待查询语句对应的数据结果的数量。
53.步骤206,当待查询语句属于遍历查询类型时,根据待查询语句遍历预设的基本索引,获取与待查询语句对应的查询结果。
54.本实施例中,步骤204-步骤204的具体实施细节与步骤101-步骤103的基本相同,在此不做赘述。
55.本技术提出的一种基于知识图谱的数据查询方法,通过对待查询语句进行意图解析,确定待查询语句所属的查询类型,按照所属类型使用不同的查询方法,可以提高数据查询的效率,当待查询语句属于统计查询类型时,将待查询语句与路径索引进行映射确定目标索引,根据目标索引即可确定待查询语句对应的数据结果和数据结果的统计值,也就是说,本技术在统计查询时直接根据目标索引即可获取查询结果,无需遍历所有数据源,也无需在遍历完成后才能获取统计值,实现了快速、实时查询的目的。当待查询语句需要进行遍历查询时,则遍历所有的基本索引获取查询结果。
56.此外,应当理解的是,上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对流程中添加无关紧要的修改或者引入无关紧要的设计,但不改
变其流程的核心设计都在该专利的保护范围内。
57.本技术的实施例涉及一种基于知识图谱的数据查询系统,如图3所示,包括:
58.意图解析模块301,用于获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;
59.统计查询模块302,用于当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;
60.遍历查询模块303,用于当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。
61.值得一提的是,本实施例中所涉及到的各模块均为逻辑模块,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施例中不存在其它的单元。
62.不难发现,本实施例为与基于知识图谱的数据查询方法实施例相对应的系统实施例,本实施例可与上述实施例互相配合实施。上述实施例中提到的相关技术细节在本实施例中依然有效,为了减少重复,这里不再赘述。相应地,本实施例中提到的相关技术细节也可应用在上述方法实施例中。
63.本发明的实施方式涉及一种电子设备,如图4所示,包括:至少一个处理器401;以及,与所述至少一个处理器401通信连接的存储器402;其中,所述存储器402存储有可被所述至少一个处理器401执行的指令,所述指令被所述至少一个处理器401执行,以使所述至少一个处理器401能够执行上述实施方式的基于知识图谱的数据查询方法。
64.其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他系统通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
65.处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
66.本发明的实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述基于知识图谱的数据查询方法。
67.即,本领域技术人员可以理解,实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本技术各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以
存储程序代码的介质。
68.本领域的普通技术人员可以理解,上述各实施例是实现本技术的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本技术的精神和范围。
技术特征:
1.一种基于知识图谱的数据查询方法,其特征在于,包括:获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。2.根据权利要求1所述的基于知识图谱的数据查询方法,其特征在于,在所述获取待查询语句之前,还包括:获取知识图谱的本体,并将所述知识图谱的本体进行解析,转化为图结构;根据所述图结构构建所述基本索引;从所述图结构中提取查询模式,基于所述查询模式构建所述路径索引。3.根据权利要求2所述的基于知识图谱的数据查询方法,其特征在于,所述知识图谱的本体包含实体、关系和属性,所述属性包含实体属性和关系属性;所述将所述知识图谱的本体进行解析,转化为图结构,包括:将所述实体映射为所述图结构的顶点,其中所述实体属性为所述顶点的附加信息;将所述关系映射为所述图结构的边,其中所述关系属性为所述边的附加信息;所述顶点和所述边构成所述图结构。4.根据权利要求3所述的基于知识图谱的数据查询方法,其特征在于,所述根据所述图结构构建所述基本索引,包括:分别获取每个顶点的所有附加信息的组合方式和每个边的所有附加信息的组合方式;将顶点的所有附加信息的组合方式和边的所有附加信息的组合方式合并,得到组合方式集合;将所述组合方式集合中的每一种组合方式作为一条基本索引。5.根据权利要求3所述的基于知识图谱的数据查询方法,其特征在于,所述从所述图结构中提取查询模式,基于所述查询模式构建所述路径索引,包括:采用预设的图遍历算法遍历所述图结构,获取所述图结构中顶点之间的所有路径;将每一条路径作为一种查询模式,获取所述查询模式下的多个查询条件;获取每个查询条件对应的统计值,并将每一种包含多个查询条件和多个统计值的查询模式作为一条路径索引。6.根据权利要求5所述的基于知识图谱的数据查询方法,其特征在于,所述将每一条路径作为一种查询模式,获取所述查询模式下的多个查询条件,包括:分别计算每一条路径中所有顶点的所有附加信息的组合方式和每一条路径中所有边的所有附加信息的组合方式;对于每一条路径,将顶点的附加信息的组合方式和边的附加信息的组合方式合并,得到路径组合方式集合;将所述路径组合方式集合中每一种组合方式作为一个查询条件。
7.根据权利要求5所述的基于知识图谱的数据查询方法,其特征在于,在所述获取每个查询条件对应的统计值,并将每一种包含多个查询条件和多个统计值的查询模式作为一条路径索引之后,还包括:当有新的实体或新的关系加入所述路径索引时,获取所述新的实体的实体属性或新的关系的关系属性;将新的实体属性或新的关系属性与每一条路径索引进行比对,确定与所述新的实体属性或所述新的关系属性相符合的路径索引;根据所述新的实体属性或所述新的关系属性,更新与所述新的实体属性或所述新的关系属性相符合的路径索引中的查询条件和所述查询条件对应的统计值。8.根据权利要求5所述的基于知识图谱的数据查询方法,其特征在于,所述获取所述图结构中顶点之间的所有路径之后,还包括:根据预设的顶点附加信息类型和优先级的对应关系,为所述路径中所有顶点的附加信息确定优先级;根据预设的边附加信息类型和优先级的对应关系,为所述路径中所有边的附加信息确定优先级;当所述顶点的附加信息数量超过预设的顶点附加信息数量上限值时,根据顶点的附加信息的优先级从所有顶点的附加信息中剔除n个附加信息,n为顶点的附加信息数量与顶点附加信息数量上限值之差;当所述边的附加信息数量超过预设的边附加信息数量上限值时,根据边的附加信息的优先级从所有边的附加信息中剔除m个附加信息,m为边的附加信息数量与边附加信息数量上限值之差。9.根据权利要求6所述的基于知识图谱的数据查询方法,其特征在于,所述将顶点的附加信息的组合方式和边的附加信息的组合方式合并,得到路径组合方式集合之后,还包括:对所述路径组合方式集合中的每一种组合方式按照字符串大小排序。10.根据权利要求1所述的基于知识图谱的数据查询方法,其特征在于,所述对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型,包括:对所述待查询语句进行意图解析,获取所述待查询语句对应的原子操作集合;当所述原子操作集合中不包含统计操作,则所述待查询语句为遍历查询类型;当所述原子操作集合中包含统计操作,则所述待查询语句为统计查询类型。11.一种基于知识图谱的数据查询系统,其特征在于,包括:意图解析模块,用于获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;统计查询模块,用于当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;遍历查询模块,用于当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。12.一种电子设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至10中任一项所述的基于知识图谱的数据查询方法。13.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的基于知识图谱的数据查询方法。
技术总结
本申请提出一种基于知识图谱的数据查询方法、系统、设备及存储介质,涉及通信领域。基于知识图谱的数据查询方法包括:获取待查询语句,并对所述待查询语句进行意图解析,确定所述待查询语句所属的查询类型;当所述待查询语句属于统计查询类型时,将所述待查询语句与预设的路径索引进行映射,获取所述待查询语句对应的目标索引,并从所述目标索引中获取查询结果,其中所述查询结果包含数据结果和所述数据结果对应的统计值,所述统计值表示所述待查询语句对应的数据结果的数量;当所述待查询语句属于遍历查询类型时,根据所述待查询语句遍历预设的基本索引,获取与所述待查询语句对应的查询结果。查询结果。查询结果。
技术研发人员:刘丰 刘东方 程东碧 杨旭 李潇洋 王云飞 胡晓
受保护的技术使用者:中兴通讯股份有限公司
技术研发日:2021.12.29
技术公布日:2023/7/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
