知识图谱构建方法、基于知识图谱的问答方法及装置与流程
未命名
07-14
阅读:118
评论:0
1.本发明涉及智能问答技术领域,特别是涉及一种知识图谱构建方法、基于知识图谱的问答方法及装置。
背景技术:
2.知识图谱是一种规模非常大的语义网络系统,它主要目的就是为了描述真实世界里实体或概念之间的关联关系。知识图谱其是智能问答的基础,智能问答主要任务是将自然语言问题通过不同方法映射到结构化的查询,并在知识图谱中获取答案。
3.目前,知识图谱的构建中,对智能问答能够实现问答数据的梳理及问答数据库的搭建。知识图谱对于问题语句能够提供针对问题的答案,但是所提供的问题答案均是以文字描述的形式呈现,这种以文字描述呈现答案的方式,用户并不能直观的得到清楚答案,可能需要对文字进行理解后才能理解答案。
技术实现要素:
4.有鉴于此,本发明提出了一种知识图谱构建方法及装置,主要目的在于在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
5.为了达到上述目的,本发明主要提供了如下技术方案:
6.第一方面,本发明提供了一种知识图谱构建方法,该方法包括:
7.获取知识文档对应的多个本体之间的关联关系;
8.提取所述知识文档中的目标数据;
9.调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体;
10.基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;
11.对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。
12.第二方面,本发明提供了一种基于知识图谱的问答方法,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系,所述方法包括:
13.对问题语句分别进行实体识别和意图识别;
14.根据实体识别结果及意图识别结果生成知识图谱查询语句;
15.基于所述知识图谱查询语句在所述知识图谱中进行答案搜索;
16.若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。
17.第三方面,本发明提供了一种知识图谱构建装置,所述装置包括:
18.获取单元,用于获取知识文档对应的多个本体之间的关联关系;
19.提取单元,用于提取所述知识文档中的目标数据;
20.调用单元,用于调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体;
21.第一生成单元,用于基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;
22.设置单元,用于对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。
23.第四方面,本发明提供了一种基于知识图谱的问答装置,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系,所述装置包括:
24.识别单元,用于对问题语句分别进行实体识别和意图识别;
25.第二生成单元,用于根据实体识别结果及意图识别结果生成知识图谱查询语句;
26.搜索单元,用于基于所述知识图谱查询语句在所述知识图谱中进行答案搜索;
27.提供单元,用于若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。
28.第五方面,本发明提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的知识图谱构建方法,或执行第二方面所述的基于知识图谱的问答方法。
29.第六方面,本发明提供了一种存储管理设备,所述存储管理设备包括:
30.存储器,用于存储程序;
31.处理器,耦合至所述存储器,用于运行所述程序以执行第一方面所述的知识图谱构建方法,或执行第二方面所述的基于知识图谱的问答方法。
32.借由上述技术方案,本发明提供的知识图谱构建方法、基于知识图谱的问答方法及装置,在需要构建知识图谱时,首先获取知识文档对应的多个本体之间的关联关系。然后提取知识文档中的目标数据,调用实体识别模型对目标数据进行实体识别,获取知识文档中的实体以及实体所属的本体。最后,基于实体与其所属本体之间的所属关系、多个本体之间的关联关系生成知识图谱,并对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系。可见,本发明提供的方案中在基于知识图谱中的实体与其所属本体之间的所属关系、本体之间的关联关系构建知识图谱的同时,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端,使得用户更为直观的查看答案,从而减少用户对答案的理解时间。因此本发明提供的方案在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
33.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
34.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
35.图1示出了本发明一个实施例提供的一种知识图谱构建方法的流程图;
36.图2示出了本发明一个实施例提供的一种本体之间关联关系的示意图;
37.图3示出了本发明一个实施例提供的一种基于知识图谱的问答方法的流程图;
38.图4示出了本发明一个实施例提供的一种知识图谱构建装置的结构示意图;
39.图5示出了本发明另一个实施例提供的一种知识图谱构建装置的结构示意图;
40.图6示出了本发明一个实施例提供的一种基于知识图谱的问答装置的结构示意图。
具体实施方式
41.下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
42.如图1所示,本发明实施例提供了一种知识图谱构建方法,该方法主要包括:
43.101、获取知识文档对应的多个本体之间的关联关系。
44.在实际应用中,若存在构建一个针对某个知识领域的知识图谱的需求,则需要获取构建该知识图谱的知识文档,该知识文档是构建知识图谱的基础,其记载了构建知识图谱所用的数据。
45.在构建知识图谱时,需要基于知识图谱所属的知识领域获取多个本体之间的关联关系,这里的本体是指知识领域中的抽象概念,这里的本体之间的关联关系,是上述提及的抽象概念之间的关系抽象表达。上述提及的多个本体之间的关联关系即为所获取的知识文档对应的多个本体之间的关联关系。
46.示例性的,知识文档涉及公司管理这个知识领域,获取的本体包括有公司、部门、部门规章、操作手册。上述本体之间的关联关系为如图2所示,公司关联部门,部门关联部门规章和操作手册。
47.102、提取所述知识文档中的目标数据。
48.知识文档是构建知识图谱的基础,其记载了构建知识图谱所用的数据,因此需要从知识文档中提取目标数据,以基于目标数据获取构建知识图谱所用实体。
49.下面对提取知识文档中的目标数据的具体过程进行说明,该过程包括如下步骤一至步骤二:
50.步骤一,对于所述知识文档中的结构化数据,基于所述结构化数据中数据之间的预定关系,提取所述目标数据。
51.知识文档中可以包括如下两种数据:一种是结构化数据,另一种是非机构化数据。结构数据为数据之间具有预定关系的数据,非结构数据为数据之间不具有预设关系的数据。
52.示例性的,知识文档为《管理办法》这个公司管理文档,《管理办法》中的数据表即为结构化数据,因为数据表中的数据存在预设关系。而对于《管理办法》一些说明性的数据,由于之间没有预设关系,这些数据即为非结构性数据。
53.从结构化数据和非结构化数据提取目标数据的需要采用不同的目标数据提取方法。对于知识文档中的结构化数据,基于所述结构化数据中数据之间的预定关系,提取目标数据。比如,对数据表类的结构化数据,采用直接映射或映射规则定义的方法,分析其语义信息,将数据表中的数据映射到图谱对应实体上,形成目标数据。
54.步骤二,对于所述知识文档中的非结构化数据,对所述非结构化数据进行数据分割,将分割后形成的数据提取为所述目标数据。
55.对于知识文档中的非结构化数据,对非结构化数据进行数据分割,将分割后形成的数据提取为目标数据。具体的,对于非结构化数据通过构建词表、正则等方式、利用依存句法分析进行数据关系抽取,对知识文档进行文档标题、文档名称的提取,实现抽取文件信息,然后对文件信息中涉及的文档内容进行提取,通过文件名称将文件标题与文件内容建立关联,然后对文件内容进行分割,从而形成目标数据。可选的,分割可基于标点符号和语义分析进行。
56.示例性的,对《管理办法》进行文档内容的定位,实现抽取,文件标题的解析方法为:定位文件标题,提取“(((|\()(一|二|三|四|五|六|七|八|九|十).*?(?=((|\()(一|二|三|四|五|六|七|八|九|十))|((|\()(一|二|三|四|五|六|七|八|九|十).*(?!((|\()))”符号内容且符合结尾字典的数据,并抽取该规则后描述的标题文字。对标题文字对应的文档内容进行数据分割,形成目标数据。
57.103、调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体。
58.实体识别模型以目标数据为输入,可对输入的目标数据进行实体识别,识别后以实体以及实体所属的本体为输出。下面对实体识别模型的具体确定进行说明,该过程包括如下步骤一至步骤三:
59.步骤一,提取样本文档的样本数据。
60.样本文档为与知识文档属于同一知识领域的文档,其用于提供训练实体识别模型所需的样本数据。从样本文档中提取样本数据的方法与从知识文档中提取目标数据的方法基本相同,因此对于具体的提取过程这里将不再赘述。
61.步骤二,为所述样本数据标注实体信息标签,其中,所述实体信息标签用于标注样本数据对应的实体以及对应的实体所属的本体。
62.为样本数据标注实体信息标签的基于检验丰富的数据标注人员的标注信息完成,实体信息标签用于标注样本数据对应的实体以及对应的实体所属的本体。
63.步骤三,将标注后的样本数据输入预设的神经网络模型进行训练,得到所述实体识别模型。
64.将标注后的样本数据输入预先的神经网络模型进行训练,在模型训练收敛时,即可得到实体识别模型,在后续构建知识图谱时,直接调用实体识别模型即可。
65.这种通过少量的人工标注手段,实现实体、本体、关系三方面的数据构建后进行模型训练的方式,可在模型训练过程中,不断的对模型进行调试优化,直到实现模型对大量数据具有良好的实体识别能力。
66.进一步的,在构建知识图谱后,可将知识文档也作为样本文档使用,以利用知识文档进一步优化实体识别模型。
67.104、基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱。
68.知识图谱基于实体与其所属本体之间的所属关系、各本体之间的关联关系所生成,下面对知识图谱的具体生成过程进行说明,该过程包括如下步骤一至步骤二:
69.步骤一,根据所述实体所属的本体之间的关联关系,确定各个所述实体之间的关系。
70.确定各实体之间的关系的依据是各实体所属本体之间的关联关系,关联关系的建立原则如下:第一,对同属于一个本体的实体建立关联关系;第二,对于两个存在关联关系的本体,建立这两个本体的实体之间的关联关系。
71.步骤二,建立所述实体与其所属的本体之间的关联关系,生成所述知识图谱。
72.在确定实体之间的关联关系之后,建立实体与其所属的本体之间的关联关系,即形成了知识图谱,该知识图谱能够支持针对知识文档的问答。
73.105、对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。
74.在基于知识图谱的问答时,对于有的问题,若仅提供文字描述的答案,用户并不能直观的得到清楚答案,可能需要对文字进行理解后才能理解答案。因此为了使得用户直观的查看答案,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端。由于图像能够对一些问题更为直观的进行解答,因此可减少用户对答案的理解时间。
75.下面说明对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系的具体过程进行说明,该过程包括如下步骤一至步骤二:
76.步骤一,为对应于所述实体的图像生成图像链接。
77.图像链接是调取图像的依据,在需要调用图像时,可直接通过该图像链接调取。
78.步骤二,在所述知识图谱中设置所述实体与所述图像链接的关联关系,以在所述实体作为答案的来源时,通过所述图像链接调取图像,将所述图像与答案一同提供给用户端。
79.为了在实体作为答案的来源,能够调用实体对应的图像,则在知识图谱中设置实体与图像链接的关联关系。在这种关联关系的基础上,在所述实体作为答案的来源时,通过图像链接调取图像,将图像与答案一同提供给用户端,以使用户基于图像更为直观的查看到答案。
80.本发明实施例提供的知识图谱构建方法,在需要构建知识图谱时,首先获取知识文档对应的多个本体之间的关联关系。然后提取知识文档中的目标数据,调用实体识别模型对目标数据进行实体识别,获取知识文档中的实体以及实体所属的本体。最后,基于实体与其所属本体之间的所属关系、多个本体之间的关联关系生成知识图谱,并对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系。可见,本发明实施例提供的方案中在基于知识图谱中的实体与其所属本体之间的所属关系、本体之间的关联关系构建知识图谱的同时,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端,使得用户更为直观的查看答案,从而减少用户对答案的理解时间。
因此本发明实施例提供的方案在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
81.如图3所示,本发明实施例提供了一种基于知识图谱的问答方法,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系,所述方法包括:
82.201、对问题语句分别进行实体识别和意图识别。
83.问题语句为用户通过用户端输入的问题,为了在知识图谱中查询针对问题语句的答案,首先需要对问题语句分别进行实体识别和意图识别。
84.实体识别和意图识别的过程可以为,分别调用实体识别模型和意图识别模型,从而得到针对问题语句的实体识别结果和意图识别结果。需要说明的是,实体识别模型和意图识别模型均是预先训练好的模型,在使用时直接调用即可。
85.202、根据实体识别结果及意图识别结果生成知识图谱查询语句。
86.实体识别结果中包括实体和实体所述的本体,意图识别结果中包括问题语句的意图对应的实体指称和查询条件。在获取到实体识别结果和意图识别结果后,对其进行组合,从而生成知识图谱查询语句。所生成的知识图谱查询语句的查询对象可以是知识图谱中实体之间的关系,也可以是实体的具体属性。
87.203、基于所述知识图谱查询语句在所述知识图谱中进行答案搜索。
88.基于知识图谱查询语句在知识图谱中进行答案搜索时,通过实体链接技术将知识图谱查询语句中的实体指称通过一跳、两跳等跳转形式,定位到知识图谱中相应的实体上,通过意图相应的推理查询模式进行答案的排列组合查询,从而得到针对知识图谱查询语句的答案。
89.204、若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。
90.在基于知识图谱的问答时,对于有的问题,若仅提供文字描述的答案,用户并不能直观的得到清楚答案,可能需要对文字进行理解后才能理解答案。因此为了使得用户直观的查看答案,若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。由于图像能够对一些问题更为直观的进行解答,因此可减少用户对答案的理解时间。
91.本发明实施例提供的基于知识图谱的问答方法,问答所涉及的知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系。在接收到问题语句时,对问题语句分别进行实体识别和意图识别,并根据实体识别结果及意图识别结果生成知识图谱查询语句。然后基于知识图谱查询语句在知识图谱中进行答案搜索,若答案搜索的结果对应的实体存在关联的图像时,将实体对应的图像与答案搜索而得的答案一同提供给用户端。可见,本发明实施例提供的方案中在基于知识图谱中的实体与其所属本体之间的所属关系、本体之间的关联关系构建知识图谱的同时,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端,使得用户更为直观的查看答案,从而减少用户对答案的理解时间。因此本发明实施例提供的方案在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
92.进一步的,依据上述图1方法实施例,本发明的另一个实施例还提供了一种知识图
谱构建装置,如图4所示,所述装置包括:
93.获取单元31,用于获取知识文档对应的多个本体之间的关联关系;
94.提取单元32,用于提取所述知识文档中的目标数据;
95.调用单元33,用于调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体;
96.第一生成单元34,用于基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;
97.设置单元35,用于对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。
98.本发明实施例提供的知识图谱构建装置,在需要构建知识图谱时,首先获取知识文档对应的多个本体之间的关联关系。然后提取知识文档中的目标数据,调用实体识别模型对目标数据进行实体识别,获取知识文档中的实体以及实体所属的本体。最后,基于实体与其所属本体之间的所属关系、多个本体之间的关联关系生成知识图谱,并对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系。可见,本发明实施例提供的方案中在基于知识图谱中的实体与其所属本体之间的所属关系、本体之间的关联关系构建知识图谱的同时,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端,使得用户更为直观的查看答案,从而减少用户对答案的理解时间。因此本发明实施例提供的方案在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
99.可选的,如图5所示,所述提取单元32包括:
100.第一提取单元321,用于对于所述知识文档中的结构化数据,基于所述结构化数据中数据之间的预定关系,提取所述目标数据;
101.第二提取单元322,用于对于所述知识文档中的非结构化数据,对所述非结构化数据进行数据分割,将分割后形成的数据提取为所述目标数据。
102.可选的,如图5所示,第一生成单元34,具体用于根据所述实体所属的本体之间的关联关系,确定各个所述实体之间的关系;建立所述实体与其所属的本体之间的关联关系,生成所述知识图谱。
103.可选的,如图5所示,所述设置单元35,具体用于为对应于所述实体的图像生成图像链接;在所述知识图谱中设置所述实体与所述图像链接的关联关系,以在所述实体作为答案的来源时,通过所述图像链接调取图像,将所述图像与答案一同提供给用户端。
104.可选的,如图5所示,所述装置还包括:
105.训练单元36,用于提取样本文档的样本数据;为所述样本数据标注实体信息标签,其中,所述实体信息标签用于标注样本数据对应的实体以及对应的实体所属的本体;将标注后的样本数据输入预设的神经网络模型进行训练,得到所述实体识别模型。
106.本发明实施例提供的知识图谱构建装置中,各个功能模块运行过程中所采用的方法详解可以参见图1方法实施例的对应方法详解,在此不再赘述。
107.进一步的,依据上述图3方法实施例,本发明的另一个实施例还提供了一种基于知识图谱的问答装置,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像
的关联关系,如图6所示,所述装置包括:
108.识别单元41,用于对问题语句分别进行实体识别和意图识别;
109.第二生成单元42,用于根据实体识别结果及意图识别结果生成知识图谱查询语句;
110.搜索单元43,用于基于所述知识图谱查询语句在所述知识图谱中进行答案搜索;
111.提供单元44,用于答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。
112.本发明实施例提供的基于知识图谱的问答装置,问答所涉及的知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系。在接收到问题语句时,对问题语句分别进行实体识别和意图识别,并根据实体识别结果及意图识别结果生成知识图谱查询语句。然后基于知识图谱查询语句在知识图谱中进行答案搜索,若答案搜索的结果对应的实体存在关联的图像时,将实体对应的图像与答案搜索而得的答案一同提供给用户端。可见,本发明实施例提供的方案中在基于知识图谱中的实体与其所属本体之间的所属关系、本体之间的关联关系构建知识图谱的同时,对于在知识文档中存在对应图像的实体,在知识图谱中设置其与对应的图像之间的关联关系,以在实体作为答案的来源时,将实体关联的图像与答案一同提供给用户端,使得用户更为直观的查看答案,从而减少用户对答案的理解时间。因此本发明实施例提供的方案在提高问答系统输出答案的准确性同时,输出图文并茂的答案。
113.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行图1所述的知识图谱构建方法。
114.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行图3所述的基于知识图谱的问答方法。
115.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储管理设备,所述存储管理设备包括:
116.存储器,用于存储程序;
117.处理器,耦合至所述存储器,用于运行所述程序以执行图1所述的知识图谱构建方法。
118.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储管理设备,所述存储管理设备包括:
119.存储器,用于存储程序;
120.处理器,耦合至所述存储器,用于运行所述程序以执行图3所述的基于知识图谱的问答方法。
121.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
122.可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
123.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,
装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
124.在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
125.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
126.此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
127.本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
128.应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
技术特征:
1.一种知识图谱构建方法,其特征在于,所述方法包括:获取知识文档对应的多个本体之间的关联关系;提取所述知识文档中的目标数据;调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体;基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。2.根据权利要求1所述的方法,其特征在于,提取所述知识文档中的目标数据,包括:对于所述知识文档中的结构化数据,基于所述结构化数据中数据之间的预定关系,提取所述目标数据;对于所述知识文档中的非结构化数据,对所述非结构化数据进行数据分割,将分割后形成的数据提取为所述目标数据。3.根据权利要求1所述的方法,其特征在于,基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱,包括:根据所述实体所属的本体之间的关联关系,确定各个所述实体之间的关系;建立所述实体与其所属的本体之间的关联关系,生成所述知识图谱。4.根据权利要求1所述的方法,其特征在于,对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系,包括:为对应于所述实体的图像生成图像链接;在所述知识图谱中设置所述实体与所述图像链接的关联关系,以在所述实体作为答案的来源时,通过所述图像链接调取图像,将所述图像与答案一同提供给用户端。5.根据权利要求1-4中任一所述的方法,其特征在于,所述方法还包括:提取样本文档的样本数据;为所述样本数据标注实体信息标签,其中,所述实体信息标签用于标注样本数据对应的实体以及对应的实体所属的本体;将标注后的样本数据输入预设的神经网络模型进行训练,得到所述实体识别模型。6.一种基于知识图谱的问答方法,其特征在于,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系,所述方法包括:对问题语句分别进行实体识别和意图识别;根据实体识别结果及意图识别结果生成知识图谱查询语句;基于所述知识图谱查询语句在所述知识图谱中进行答案搜索;若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。7.一种知识图谱构建装置,其特征在于,所述装置包括:获取单元,用于获取知识文档对应的多个本体之间的关联关系;提取单元,用于提取所述知识文档中的目标数据;调用单元,用于调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档
中的实体以及实体所属的本体;第一生成单元,用于基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;设置单元,用于对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。8.一种基于知识图谱的问答装置,其特征在于,知识图谱包括本体和实体之间的关联关系,以及至少部分实体与图像的关联关系,所述装置包括:识别单元,用于对问题语句分别进行实体识别和意图识别;第二生成单元,用于根据实体识别结果及意图识别结果生成知识图谱查询语句;搜索单元,用于基于所述知识图谱查询语句在所述知识图谱中进行答案搜索;提供单元,用于若答案搜索的结果对应的实体存在关联的图像时,将所述实体对应的图像与答案搜索而得的答案一同提供给用户端。9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求5中任意一项所述的知识图谱构建方法,或执行权利要求6所述的基于知识图谱的问答方法。10.一种存储管理设备,其特征在于,所述存储管理设备包括:存储器,用于存储程序;处理器,耦合至所述存储器,用于运行所述程序以执行权利要求1至权利要求5中任意一项所述的知识图谱构建方法,或执行权利要求6所述的基于知识图谱的问答方法。
技术总结
本发明公开了一种知识图谱构建方法、基于知识图谱的问答方法及装置,涉及智能问答技术领域,主要目的在于在提高问答系统输出答案的准确性同时,输出图文并茂的答案;主要技术方案包括:获取知识文档对应的多个本体之间的关联关系;提取所述知识文档中的目标数据;调用实体识别模型对所述目标数据进行实体识别,获取所述知识文档中的实体以及实体所属的本体;基于所述实体与其所属本体之间的所属关系、所述多个本体之间的关联关系,生成知识图谱;对于在所述知识文档中存在对应图像的实体,在所述知识图谱中设置其与对应的图像之间的关联关系。关系。关系。
技术研发人员:沈寰
受保护的技术使用者:北京国双科技有限公司
技术研发日:2021.12.30
技术公布日:2023/7/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
