基于知识图谱的信息查询方法、装置、设备和存储介质与流程

未命名 10-09 阅读:123 评论:0


1.本技术涉及人工智能技术领域,特别是涉及一种基于知识图谱的信息查询方法、装置、设备和存储介质。


背景技术:

2.随着互联网应用的不断发展,利用知识图谱进行信息查询的技术受到越来越多的关注。在相关技术中,可以通过预先训练好的模型直接输出自然问句对应的图谱查询语句,然后利用图谱查询语句在知识图谱中定位相应的答案。但是,上述模型需要大量的语料才能训练出来,模型的预测性能不高,从而导致查询结果的准确率较低。


技术实现要素:

3.为克服相关技术中存在的技术问题,本技术提供一种基于知识图谱的信息查询方法、装置、设备和存储介质。
4.第一方面,本技术实施例提供一种基于知识图谱的信息查询方法,包括:
5.根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;
6.确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;
7.利用所述目标查询模式将所述实体词关联至对应的图谱特征项;
8.根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;
9.根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。
10.第二方面,本技术实施例提供一种基于知识图谱的信息查询装置,包括:
11.构建模块,用于根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;
12.确定模块,用于确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;
13.关联模块,用于利用所述目标查询模式将所述实体词关联至对应的图谱特征项;
14.生成模块,用于根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;
15.查询模块,用于根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。
16.第三方面,本技术实施例提供一种电子设备,包括:存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本技术实施例第一方面提供的所述基于知识图谱的信息查询方法的步骤。
17.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,
所述计算机程序被处理器执行时实现本技术实施例第一方面提供的所述基于知识图谱的信息查询方法的步骤。
18.本技术实施例提供的技术方案,在得到待查询文本的目标实体向量之后,确定目标实体向量对应的目标查询模式,并获取目标查询模式对应的图谱特征项,利用目标查询模式将实体词关联至对应的图谱特征项,根据目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句,根据图谱查询语句查询知识图谱,得到对应的第一查询结果。也就是说,本方案无需依赖大量的语料数据即可以定位出待查询文本对应的答案,并且通过目标查询模式辅助进行待查询文本中的实体词与图谱查询时所需的图谱特征项之间的关联,确保了特征关联的准确性,从而提高了所生成的图谱查询语句的准确性,进而提高了查询结果的准确率。
附图说明
19.图1为本技术实施例提供的基于知识图谱的信息查询方法的一种流程示意图;
20.图2为本技术实施例提供的基于知识图谱的信息查询方法的另一种流程示意图;
21.图3为本技术实施例提供的基于知识图谱的信息查询装置的一种结构示意图;
22.图4为本技术实施例提供的电子设备的一种结构示意图。
具体实施方式
23.为了使本技术的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本技术中的技术方案进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
24.在现有的信息查询场景下,为了保证用户能够准确地获取想要的信息,通常是采用预先训练好的模型直接输出用户所咨询的自然问句对应的图谱查询语句,然后利用图谱查询语句在知识图谱中定位相应的答案。但是,上述模型需要大量的语料才能训练出来,对语料数据的依赖度过高,导致模型的预测性能不佳,从而导致查询结果的准确率较低。为此,本技术实施例提供的技术方案,能够提高信息查询结果的准确率。
25.需要说明的是,下述方法实施例的执行主体可以是基于知识图谱的信息查询装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为电子设备的部分或者全部。可选的,该电子设备可以为客户端,包括但不限于智能手机、平板电脑、电子书阅读器以及车载终端等。当然,该电子设备也可以为独立的服务器或者服务器集群,本发明实施例对电子设备的具体形式不做限定。下述方法实施例以执行主体是电子设备为例进行说明。
26.图1为本技术实施例提供的基于知识图谱的信息查询方法的一种流程示意图。如图1所示,该方法可以包括:
27.s101、根据待查询文本中的实体词以及实体词对应的实体类型,构建待查询文本的目标实体向量。
28.其中,待查询文本是指需要定位答案的文本,其为自然语句文本。
29.具体的,可以使用结巴分词工具以及自定义词库对待查询文本进行分词和词性抽取;接着,使用依存句法分析提取出待查询文本中的关键词以及关键词类型;进一步地,将分词结果、词性结果以及关键词识别结果输入至预先训练好的实体识别模型中,通过该实
体识别模型确定待查询文本中的实体词以及实体词对应的实体类型。其中,上述实体识别模型可以包括embedding层、bert层以及全连接层。进一步地,还可以使用自定义词典将识别出的一些口语化的实体词转换为标准化的实体词,如将“几座”标准化为“座位数”。
30.在得到待查询文本中的实体词以及实体词对应的实体类型之后,分别合并各实体词以及各实体词对应的实体类型,得到实体词向量和实体类型向量,将实体词向量和实体类型向量进行组合,得到待查询文本的目标实体向量。
31.示例性地,在汽车信息查询领域,假设待查询文本为“领睿都有几座的车?”,识别该待查询文本中的实体词以及实体词对应的实体类型,得到如“车系-领睿”、“属性-座位数”等识别结果,并基于该识别结果构建待查询文本的目标实体向量,得到的目标实体向量如[[车系,属性],[领睿,座位数]]。
[0032]
s102、确定目标实体向量对应的目标查询模式,并获取目标查询模式对应的图谱特征项。
[0033]
其中,目标查询模式用于指示待查询文本在知识图谱中的查询过程。知识图谱中包括大量的点知识和边知识,目标查询模式可以由输入节点和输出节点以及查询内容组成,输入节点是需要在知识图谱中查询的目标节点,输出是隐含的输出节点,查询内容是实际输出的节点,即目标查询模式的格式可以为输入节点_输出节点(查询内容)。例如,在目标查询模式为“keyword_vehicle(attrs)”时,该目标查询模式指示的查询过程为“先通过关键词查询车型,再根据车型查询属性”。又如,在目标查询模式为“compare_keyword_vehicle(attrs)”时,该目标查询模式指示的查询过程为“先通过关键词确定车型,再比较多个车型的属性(如油耗)”,再如,在目标查询模式为“condition_series(attrs)”时,该目标查询模式指示的查询过程为“查询在某个条件下的所有车的属性”。
[0034]
上述图谱特征项为利用图谱查询语句查询时所需要的特征项,不同的目标查询模式对应不同的图谱特征项。例如,在目标查询模式为“keyword_vehicle(attrs)”时,该目标查询模式对应的图谱特征项包括关键词特征项、车型特征项和属性特征项等。
[0035]
作为一种可选地实施方式,上述确定目标实体向量对应的目标查询模式的过程可以是:获取预先构建的映射关系表;其中,映射关系表中包括多个历史查询文本的参考实体向量以及各参考实体向量对应的查询模式;确定目标实体向量与多个参考实体向量之间的第一匹配度;将第一匹配度满足第一预设条件的参考实体向量对应的查询模式确定为目标查询模式。
[0036]
具体的,历史查询文本的参考实体向量基于历史查询文本中的实体词以及实体词对应的实体类型构建得到,并预先定义各参考实体向量对应的查询模式以及图谱特征项,构建相应的映射关系表。以汽车领域信息查询为例,上述映射关系表可以如下述表1所述:
[0037]
表1
[0038][0039][0040]
在得到待查询文本的目标实体向量之后,将该目标实体向量与映射关系表中各的参考实体向量进行相似度计算,得到目标实体向量与各参考实体向量之间的第一匹配度,将第一匹配度满足第一预设条件的参考实体向量对应的查询模式确定目标查询模式。例如,可以将第一匹配度最高的参考实体向量对应的查询模式确定为待查询文本的目标查询模式。在确定出目标查询模式之后,可以从上述映射关系表中查询获得该目标查询模式对应的图谱特征项。
[0041]
示例性,继续以汽车信息查询为例,假设待查询文本的目标实体向量为“vehicle-seat”,则通过上述映射关系表确定该目标实体向量对应的目标查询模式为“keyword_vehicle(attrs)”,并通过上述映射关系表得到利用该目标查询模式查询时所需的图谱特征项为“vertex”(即点特征项)、“vertex”(即属性特征项)以及“manufacturer”(即制造商特征项)。
[0042]
s103、利用所述目标查询模式将所述实体词关联至对应的图谱特征项。
[0043]
在本步骤中,特征关联方式主要包括预置填槽、利用目标查询模式填槽以及后置填槽。
[0044]
其中,预置填槽是指填入固定不定的特征,如品牌、制造商等。
[0045]
利用目标查询模式填槽是指通过解析目标查询模式来确定图谱特征项中所需的特征值分别是什么,即利用目标查询模式将待查询文本中的实体词关联到对应的图谱特征项。
[0046]
后置填槽主要是指对填槽后的结果进行检查,以确定特征关联的准确性。
[0047]
示例性地,以待查询文本为“领睿都有几座的车?”为例,该待查询文本的目标实体向量为“[[车系,属性],[领睿,座位数]]”,通过查表可得,该目标实体向量对应的目标查询
模式为“keyword_vehicle(attrs)”,查询时所需的图谱特征项为“{"vertex":[],"attrs":[],"manufacturer":[]}”。由于目标查询模式中的keyword与图谱特征项"vertex"对应,则可将待查询文本中的实体类型“keyword”下的实体词“领睿”关联到图谱特征项"vertex",将待查询文本中的实体类型“属性”下的“座位数”关联到图谱特征项"attrs"。对于图谱特征项"manufacturer"可以采用预置填槽的方式填入对应的特征值,如“江铃福特”。
[0048]
s104、根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句。
[0049]
其中,知识图谱中保存有点知识和边知识,可支持查询点、根据属性查询点、子图查询以及管道查询等不同的查询方式,不同的查询方式对应有不同的图谱查询语句。因此,可以根据已确定出的目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句。
[0050]
作为一种可选地实施方式,上述s104的过程可以为:获取目标查询模式对应的待填充图谱语句;将目标查询模式和图谱特征项关联的实体词填充到待填充图谱语句中的对应位置,得到图谱查询语句。
[0051]
其中,不同的查询模式对应有不同的待填充图谱语句,在得到目标查询模式之后,便可以根据目标查询模式获取对应的待填充图谱语句。接着,将目标查询模式作为边知识标签填充至待填充图谱语句中的对应位置,将图谱特征项关联的实体词作为点知识索引以及点知识对应的属性填充到待填充图谱语句中的对应位置,得到图谱查询语句。
[0052]
例如,目标查询模式“keyword_vehicle(attrs)”表示根据关键词查询车型的属性,这是根据点查询属性的查询方式,其对应的待填充图谱语句为“go from〈vertex〉over〈keyword_vehilcle〉yield$$.〈vehicle.attr〉as attr”。其中,待填充图谱语句中的〈〉是需要填充的图谱特征信息;然后,将图谱特征项关联的实体词以及目标查询模式填充到待填充图谱语句中的对应位置,得到的图谱查询语句为“go from领睿over keyword_vehilcle yield$$.座位数as attr”。
[0053]
s105、根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。
[0054]
在得到图谱查询语句之后,便可以使用exacute函数执行该图谱查询语句,从而在知识图谱中查询得到对应的第一查询结果。
[0055]
可选地,在上述s101之前,可以预先利用相关技术领域的知识构建上述知识图谱。具体的,可以将相关技术领域知识格式化成点知识和边知识,并基于点知识和边知识构建相应的知识图谱。例如,针对汽车领域的信息查询,可以获取汽车产品相关知识,如常见车辆故障受理及引导、常见用车问题、三包相关问题、保养类问题、车辆识别号、随车工具及购车活动类知识等,将汽车产品相关知识格式化成点知识(如"brand_name":"福特")和边知识(如{"head":"领界","edge":"series_brand","tail":"福特","weight":"10.0"}),并构建点知识索引和边知识标签,将上述点知识和边知识批量导入到图谱中,从而得到汽车知识图谱。
[0056]
本技术实施例提供的基于知识图谱的信息查询方法,在得到待查询文本的目标实体向量之后,确定目标实体向量对应的目标查询模式,并获取目标查询模式对应的图谱特征项,利用目标查询模式将实体词关联至对应的图谱特征项,根据目标查询模式和关联有
实体词的图谱特征项生成对应的图谱查询语句,根据图谱查询语句查询知识图谱,得到对应的第一查询结果。也就是说,本方案无需依赖大量的语料数据即可以定位出待查询文本对应的答案,并且通过目标查询模式辅助进行待查询文本中的实体词与图谱查询时所需的图谱特征项之间的关联,确保了特征关联的准确性,从而提高了所生成的图谱查询语句的准确性,进而提高了查询结果的准确率。
[0057]
在实际应用中,往往查询出的结果有很多内容,为了能够给用户提供更精准的信息,需要进一步细化查询结果。为此,在上述实施例的基础上,可选地,如图2所示,该方法还可以包括:
[0058]
s201、当第一查询结果包括多个答复文本时,从多个答复文本中确定与待查询文本匹配的目标答复文本。
[0059]
在得到第一查询结果之后,在第一查询结果包含的内容较多时,可以对第一查询结果进行分段,每段对应一个答复文本,得到多个答复文本;然后对每个答复文本进行分析,以从多个答复文本中确定出与待查询文本匹配的目标答复文本。
[0060]
可选地,可以通过下述过程来确定目标答复文本:对各答复文本的内容进行分类,得到各答复文本对应的分类词;确定待查询文本的实体词与各分类词之间的第二匹配度;将第二匹配度满足第二预设条件的分类词对应的答复文本确定为目标答复文本。
[0061]
具体的,可以获取多个样本数据,并结合多个样本数据的内容进行分类词标注,将多个样本数据以及样本数据的标注数据作为训练数据,对文本分类器进行训练。这样,可以通过上述训练好的文本分类器对各答复文本的内容进行分类,得到各答复文本对应的分类词。例如,针对汽车活动类的咨询,各答复文本对应的分类词可以为促销、折扣、补贴、时间、权益、基金以及购车利率等。
[0062]
接着,将待查询文本的实体词(即搜索词)与各答复文本对应的分类词进行cosine相似度计算,得到对应的第二匹配度,将第二匹配度满足第二预设条件的分类词对应的答复文本确定为目标答复文本。例如,将第二匹配度最高的分类词对应的答复文本确定为目标答复文本。
[0063]
s202、提取目标答复文本的摘要信息。
[0064]
具体的,可以使用textrank算法提取目标答复文本的摘要信息。
[0065]
s203、将摘要信息确定为待查询文本对应的目标查询结果。
[0066]
在本实施例中,可以针对第一查询结果挖掘与用户待查询文本匹配的目标答复文本,并将目标答复文本的摘要信息作为目标查询结果,实现了更细粒度的信息查询,使得定位的查询结果更加精准,与用户咨询的问题的匹配度更高。
[0067]
为了提高信息查询结果的准确度,在上述实施例的基础上,可选地,在上述s105之后,还可以对第一查询结果进行校正。这里,可以采用多种校验方式对第一查询结果进行校验,在校验通过时,将第一查询结果返回给用户,在校验不通过时,对第一查询结果进行校正。
[0068]
进一步地,可选地,可以通过以下方式之一对第一查询结果进行校正:
[0069]
方式一:获取待查询文本中的第一实体词和第二实体词;通过预训练好的上下文预测模型,确定第一实体词在待查询文本中的预测上下文词;在预测上下文词不包含第二实体词时,对第一查询结果进行校正。
[0070]
其中,第二实体词为第一实体词在待查询文本中的实际上下文词。上述上下文预测模型可以通过训练数据对word2vec的连续词袋模型(continuous bag of words,cbow)反复迭代训练得到的。在识别出待查询文本中的实体词之后,可以将部分实体词作为第一实体词,剩余实体词作为第二实体词,并将第一实体词输入至上下文预测模型,通过该上下文预测模型确定第一实体词在待查询文本中的预测上下文词。接着,将第二实体词与预测上下文词进行比较,在预测上下文词中包含第二实体词时,表明待查询文本中的第一实体词与第二实体词具有实体相关性,此时第一查询结果的准确度较高,无需对第一查询结果进行校正。在预测上下文词不包含第二实体词时,表明待查询文本中的第一实体词与第二实体词不具有实体相关性,第一查询结果的错误率较高,需要对第一查询结果进行校正。
[0071]
在实际应用中,实体词还存在别名词的情况,比如“福特”可能是“ford”,宝马可能是“bmw”。为此,还可以预先建立一个别名库,从别名库中确定第二实体词对应的别名词,将别名词以及第二实体词分别与预测上下文词进行比对,若预测上下文词中不包含别名词和第二实体词,则对第一查询结果进行校正。
[0072]
示例性地,假设待查询文本为一个错误的语句,如“宝马的领睿有几座的?”,通过对待查询文本进行实体相关性校验,可以得到“宝马”与“领睿”之间不具有相关性,这样,针对该待查询文本的理论查询结果应该为空。若实际查询得到的第一查询结果不为空,此时可以对第一查询结果进行校正,如将第一查询结果置为空。
[0073]
方式二:确定待查询文本的查询项目是否符合常识;在确定查询项目不符合常识时,对第一查询结果进行校正。
[0074]
具体的,常识包括实体属性常识以及实体关系常识。在具体应用时,可以通过通识表来确定待查询文本的查询项目是否符合常识,通识表包括两类,一类是关系通识表,一类是属性通识表。关系通识表用于判断查询的实体之间是否符合常识,如待查询文本“宝马物流为什么这么慢?”,通过关系通识表可知品牌与物流没有查询关系,宝马的售后服务和物流才有关系,因此查询“宝马”和“物流”的关系会被判定为通识错误,此时需要对第一查询结果进行校正。
[0075]
属性通识表用于判断查询的实体属性是否符合常识,如“十座”宝马车、“国二领睿”都是通识错误,若待查询文本中包含此类通识错误,则需要对第一查询结果进行校正。例如,将第一查询结果置为空。
[0076]
方式三:在确定待查询文本中存在未被关联的实体词时,利用目标查询模式将对应图谱特征项下的实体词替换为未被关联的实体词;并继续执行上述实施例中s104中根据目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句的步骤,直至得到对应的第二查询结果;将第二查询结果与第一查询结果的交集确定为待查询文本对应的目标查询结果。
[0077]
在待查询文本中还存在未被关联的实体词时,可以利用该未被关联的实体词替换上一次查询过程中的同类型实体,即利用目标查询模式将对应图谱特征项下的实体词替换为该未被关联的实体词,并再次执行上述查询过程,得到第二查询结果,将第二查询结果与第一查询结果的交集确定为目标查询结果。
[0078]
示例性地,假设待查询文本为“宝马领睿都有几座的车?”,同时,第一查询结果是通过将“领睿”和“座位数”作为图谱特征值得到的查询结果。在补充查询时,可以将待查询
文本中的未被关联的实体词“宝马”替换上次查询过程中的实体词“领睿”,即将“宝马”和“座位数”作为图谱特征值再次进行补充查询,得到第二查询结果。由于两个品牌“宝马”和“福特”没有公有的车型,因此,目标查询结果为空。
[0079]
在本实施例中,在得到第一查询结果之后,可以通过多种方式对第一查询结果进行检验,包括实体相关性校验、别名处理、常识验证以及补充查询等,在第一查询结果校验不通过时对第一查询结果进行校正,从而提高了第一查询结果的准确度。
[0080]
图3为本技术实施例提供的基于知识图谱的信息查询装置的一种结构示意图。如图3所示,该装置可以包括:构建模块301、确定模块302、关联模块303、生成模块304和查询模块305。
[0081]
具体的,构建模块301用于根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;
[0082]
确定模块302用于确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;
[0083]
关联模块303用于利用所述目标查询模式将所述实体词关联至对应的图谱特征项;
[0084]
生成模块304用于根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;
[0085]
查询模块305用于根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。
[0086]
在上述实施例的基础上,可选地,确定模块302具体用于获取预先构建的映射关系表;确定所述目标实体向量与所述多个参考实体向量之间的第一匹配度;将第一匹配度满足第一预设条件的参考实体向量对应的查询模式确定为所述目标查询模式;其中,所述映射关系表中包括多个历史查询文本的参考实体向量以及各参考实体向量对应的查询模式。
[0087]
在上述实施例的基础上,可选地,生成模块304具体用于获取所述目标查询模式对应的待填充图谱语句;将所述目标查询模式和所述图谱特征项关联的实体词填充到所述待填充图谱语句中的对应位置,得到图谱查询语句。
[0088]
在上述实施例的基础上,可选地,该装置还包括:细节查询模块。
[0089]
具体的,细节查询模块用于当所述第一查询结果包括多个答复文本时,从所述多个答复文本中确定与所述待查询文本匹配的目标答复文本;提取所述目标答复文本的摘要信息;将所述摘要信息确定为所述待查询文本对应的目标查询结果。
[0090]
在上述实施例的基础上,可选地,细节查询模块还用于对各答复文本的内容进行分类,得到所述各答复文本对应的分类词;确定所述待查询文本的实体词与各分类词之间的第二匹配度;将第二匹配度满足第二预设条件的分类词对应的答复文本确定为所述目标答复文本。
[0091]
在上述实施例的基础上,可选地,该装置还包括:查询结果校正模块;
[0092]
具体的,查询结果校正模块用于获取所述待查询文本中的第一实体词和第二实体词;其中,所述第二实体词为所述第一实体词在所述待查询文本中的实际上下文词;通过预训练好的上下文预测模型,确定所述第一实体词在所述待查询文本中的预测上下文词;在
所述预测上下文词不包含所述第二实体词时,对所述第一查询结果进行校正。
[0093]
在上述实施例的基础上,可选地,查询结果校正模块还用于确定所述第二实体词对应的别名词;将所述别名词以及所述第二实体词分别与所述预测上下文词进行比对;若所述预测上下文词中不包含所述别名词和所述第二实体词,则对所述第一查询结果进行校正。
[0094]
在上述实施例的基础上,可选地,查询结果校正模块还用于在确定所述待查询文本中存在未被关联的实体词时,利用所述目标查询模式将对应图谱特征项下的实体词替换为所述未被关联的实体词;并继续执行所述根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句的步骤,直至得到对应的第二查询结果;将所述第二查询结果与所述第一查询结果的交集确定为所述待查询文本对应的目标查询结果。
[0095]
图4为本技术实施例提供的电子设备的一种结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;该设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;该设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
[0096]
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本技术实施例中的基于知识图谱的信息查询方法对应的程序指令/模块(例如,基于知识图谱的信息查询装置中的构建模块101、确定模块102、关联模块103、生成模块104和查询模块105)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的基于知识图谱的信息查询方法。
[0097]
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0098]
输入装置42可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
[0099]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0100]
根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;
[0101]
确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;
[0102]
利用所述目标查询模式将所述实体词关联至对应的图谱特征项;
[0103]
根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;
[0104]
根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。
[0105]
上述实施例中提供的基于知识图谱的信息查询装置、电子设备以及存储介质可执行上述任意实施例所提供的基于知识图谱的信息查询方法,具备执行该方法相应的功能模
块和有益效果。未在上述实施例中详尽描述的技术细节,可参见上述任意实施例所提供的基于知识图谱的信息查询方法。
[0106]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0107]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。

技术特征:
1.一种基于知识图谱的信息查询方法,其特征在于,包括:根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;利用所述目标查询模式将所述实体词关联至对应的图谱特征项;根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标实体向量对应的目标查询模式,包括:获取预先构建的映射关系表;其中,所述映射关系表中包括多个历史查询文本的参考实体向量以及各参考实体向量对应的查询模式;确定所述目标实体向量与所述多个参考实体向量之间的第一匹配度;将第一匹配度满足第一预设条件的参考实体向量对应的查询模式确定为所述目标查询模式。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句,包括:获取所述目标查询模式对应的待填充图谱语句;将所述目标查询模式和所述图谱特征项关联的实体词填充到所述待填充图谱语句中的对应位置,得到图谱查询语句。4.根据权利要求1所述的方法,其特征在于,还包括:当所述第一查询结果包括多个答复文本时,从所述多个答复文本中确定与所述待查询文本匹配的目标答复文本;提取所述目标答复文本的摘要信息;将所述摘要信息确定为所述待查询文本对应的目标查询结果。5.根据权利要求4所述的方法,其特征在于,所述从所述多个答复文本中确定与所述待查询文本匹配的目标答复文本,包括:对各答复文本的内容进行分类,得到所述各答复文本对应的分类词;确定所述待查询文本的实体词与各分类词之间的第二匹配度;将第二匹配度满足第二预设条件的分类词对应的答复文本确定为所述目标答复文本。6.根据权利要求1所述的方法,其特征在于,还包括:获取所述待查询文本中的第一实体词和第二实体词;其中,所述第二实体词为所述第一实体词在所述待查询文本中的实际上下文词;通过预训练好的上下文预测模型,确定所述第一实体词在所述待查询文本中的预测上下文词;在所述预测上下文词不包含所述第二实体词时,对所述第一查询结果进行校正。7.根据权利要求6所述的方法,其特征在于,在所述预测上下文词不包含所述第二实体词时,对所述第一查询结果进行校正,包括:确定所述第二实体词对应的别名词;
将所述别名词以及所述第二实体词分别与所述预测上下文词进行比对;若所述预测上下文词中不包含所述别名词和所述第二实体词,则对所述第一查询结果进行校正。8.根据权利要求1所述的方法,其特征在于,还包括:在确定所述待查询文本中存在未被关联的实体词时,利用所述目标查询模式将对应图谱特征项下的实体词替换为所述未被关联的实体词;并继续执行所述根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句的步骤,直至得到对应的第二查询结果;将所述第二查询结果与所述第一查询结果的交集确定为所述待查询文本对应的目标查询结果。9.一种基于知识图谱的信息查询装置,其特征在于,包括:构建模块,用于根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;确定模块,用于确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;关联模块,用于利用所述目标查询模式将所述实体词关联至对应的图谱特征项;生成模块,用于根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;查询模块,用于根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述方法的步骤。

技术总结
本申请提供一种基于知识图谱的信息查询方法、装置、设备和存储介质。该方法包括:根据待查询文本中的实体词以及所述实体词对应的实体类型,构建所述待查询文本的目标实体向量;确定所述目标实体向量对应的目标查询模式,并获取所述目标查询模式对应的图谱特征项;其中,所述目标查询模式用于指示所述待查询文本在知识图谱中的查询过程;利用所述目标查询模式将所述实体词关联至对应的图谱特征项;根据所述目标查询模式和关联有实体词的图谱特征项生成对应的图谱查询语句;根据所述图谱查询语句查询所述知识图谱,得到对应的第一查询结果。该方法提供了查询结果的准确率。该方法提供了查询结果的准确率。该方法提供了查询结果的准确率。


技术研发人员:袁斌 刘翠翠 安旭 杨晓阳 岳保军
受保护的技术使用者:联通智网科技股份有限公司
技术研发日:2023.06.30
技术公布日:2023/10/8
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐