一种基于知识图谱目标人物身份识别系统

未命名 07-29 阅读:270 评论:0


1.本发明属于身份识别技术领域,具体为一种基于知识图谱目标人物身份识别系统。


背景技术:

2.身份识别的主流思路是基于生物特征的唯一性、稳定性及不易伪造性,通过采集目标人物的生物特征数据,并与数据库中样本进行匹配比对实现目标人身份确认。已有研究成果包括针对人像、声纹、步态等生物特征的身份识别方法,以及融合多种生物特征的个体身份识别方法。
3.但是常见的人物身份识别在使用过程中,使用时间久了之后不能自我更新,从而使得使用久了之后,精确性会下降。


技术实现要素:

4.本发明的目的在于:为了解决上述提出的问题,提供一种基于知识图谱目标人物身份识别系统。
5.本发明采用的技术方案如下:一种基于知识图谱目标人物身份识别系统,包括启动模块、数据获取模块、知识图谱构建模块、特征提取模块、候选身份排序模块、身份识别决策模块、身份生成模块、信息抽取模块、知识融合模块和图谱构建模块,所述启动模块的输出端连接有所述数据获取模块的输入端,所述数据获取模块的输出端连接有所述知识图谱构建模块的输入端,所述知识图谱构建模块的输出端连接有所述特征提取模块的输入端,所述特征提取模块的输出端连接有所述候选身份排序模块的输入端,所述候选身份排序模块的输出端连接有所述身份识别决策模块的输入端,所述身份识别决策模块的输出端连接有所述身份生成模块的输入端。
6.在一优选的实施方式中,所述知识图谱构建模块的内部设置有信息抽取模块、知识融合模块和图谱构建模块,所述信息抽取模块、知识融合模块和图谱构建模块的整体输出端连接有所述知识图谱构建模块的输入端。
7.在一优选的实施方式中,所述数据获取模块采集与目标人物相关的社会信息,如目标人物乘坐车辆的车牌、目标人物出示的身份证件卡号、通信电话号、目标人物同行人的社会信息等,并将采集获得的社会信息输入计算层。
8.在一优选的实施方式中,所述信息抽取模块以命名实体识别、实体链接及关系和事件抽取;实体抽取:主要任务是识别命名实体的文本范围,并将其分类为预定义的类别,学术上所涉及一般包含三大类,实体类、时间类、数字类和7个小类;关系抽取:基于模板的关系抽取,通过模板匹配实现,需要语言专家进行严格的语言模板制定,从文本中匹配出实体之间的关系,这种方法在小规模、特定领域内,可以取得较好的结果;事件抽取:事件抽取是把事件任务分解成一个个小的子任务,是一个多分类问题,比如事件识别、元素抽取、属性分类;包含五类分类器:事件触发词分类器、在元素分类器、元素角色分类器、属性分类
器、可报告性分类器;为实现对大数据平台中采集全量数据的价值发现,需要利用数据挖掘、机器学习、包括深度神经网络等分析技术对相应数据集进行挖掘建模。
9.在一优选的实施方式中,所述知识融合模块对知识资源数据进行整理和融合,通过技术手段来减少信息提取缺陷造成的数据错误、数据歧义、数据冗余等现象;在知识融合过程中、主要包括知识合并和实体链接;知识合并是两种知识图谱进行合并,需要人工构建知识图谱的合并逻辑,如实体同名处理、属性融合。
10.在一优选的实施方式中,所述图谱构建模块采用自顶向下来构建知识图谱,也就是先确定知识资源知识图谱的数据模型,根据模型框架补充数据,完成知识图谱的建设;根据已有的数据模型进行知识推理,对最后的结果数据进行评估,将合乎要求的数据构建在知识资源知识图谱中;根据已获的结构化数据实体、关系和属性,向图数据模式的转换,具体的操作如下:
11.s1:对实体表中数据进行提取,然后转存到建立的图数据库;
12.s2:对实体关系进行整理提取;
13.s3:在建立的图数据库中对数据和关系进行逐个映射,通过关系连线完成节点间网络的建立,从而完成知识资源知识图谱的构建工作;
14.所述图谱构建模块的内部还设置有知识更新模块,知识更新模块包括概念层更新和数据层更新。
15.在一优选的实施方式中,所述特征提取模块的计算层在获得生物特征信息后,经过身份识别算法对信息进行特征提取、与知识图谱中人物实体的生物属性进行特征匹配等处理,得到该人物实体对应的归一化匹配分数,即生物信息分数;生物信息分数的取值范围为[0,1]。
[0016]
在一优选的实施方式中,所述候选身份排序模块确定实战场景下的目标识别人物后,信息采集层首先采集该目标人物的各类生物特征信息,包括可在车站入口处或收费站等处近距离采集的指纹、虹膜、声纹等,以及可利用道路卡口处摄像头或无人机远距离采集的人像、步态信息;需要注意的是,人像、步态、声纹信息由于可通过广泛分布的音视频采集系统获得,将成为未来实时身份识别场景下的主要应用生物特征信息。
[0017]
在一优选的实施方式中,所述身份识别决策模块计算层负责计算各候选身份的社会信息分数;社会信息分数计算函数为l=f(s
11
,s
12
,

,s
nm
),社会信息分数的取值范围,即函数f(
·
)的值域为[0,1];s表示函数的变量,变量的筛选原则:变量可反映候选身份与信息采集层获取的与目标人物相关的社会信息的关联度;n表示变量包含多种不同类型;m表示在识别场景下获取的同一类型的多个变量值;所述身份识别决策模块在决策层,逐个将各候选身份的生物信息分数和社会信息分数进行融合计算,获得各候选身份的综合分数li,之后依据综合分数对候选身份集合排序,分数越高,排序越靠前,代表该候选身份为识别目标人物真实身份的可能性越大。
[0018]
在一优选的实施方式中,所述身份生成模块分数计算结果对候选身份集合排序,并将分数和排序结果存入表1第一列。
[0019]
综上所述,由于采用了上述技术方案,本发明的有益效果是:
[0020]
本发明中,在对目标任务进行身份识别时,知识图谱构建模块的内部设置有图谱构建模块,且图谱构建模块内部的知识更新模块,知识更新模块随着知识图谱不断扩容,依
靠自动化手段进行增量更新,提高了更新效率,概念层更新指的是现有概念不能很好地描述实体时,进行的各类操作。这类更新可以通过开发api进行更新。同时搜索语句处理模块和知识搜索分发模块配合使用,考虑根据用户的自然查询语言中抽取的实体信息,提供相关的知识图谱信息。通过知识图谱可以很容易的发现关联知识和新知识,因此提供额外的知识图谱信息可以便于用户发现更多其感兴趣的内容和知识点,提高了搜索系统的准确性,且通过语法规则识别实体来生成语义三元组集合,然后生成结构化的查询语句。之后将用模板匹配或语义抽取方法得到的结构化查询语句提交至图数据库执行,最终为用户提供精准的搜索结果,提高了该系统在进行任务身份识别的过程中的及时高效性。
附图说明
[0021]
图1为本发明的系统框图;
[0022]
图2为本发明中知识图谱构建模块系统框图。
[0023]
图中标记:1-启动模块、2-数据获取模块、3-知识图谱构建模块、4-特征提取模块、5-候选身份排序模块、6-身份识别决策模块、7-身份生成模块、8-信息抽取模块、9-知识融合模块、10-图谱构建模块。
具体实施方式
[0024]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0025]
参照图1-2,
[0026]
实施例:
[0027]
一种基于知识图谱目标人物身份识别系统,包括启动模块1、数据获取模块2、知识图谱构建模块3、特征提取模块4、候选身份排序模块5、身份识别决策模块6、身份生成模块7、信息抽取模块8、知识融合模块9和图谱构建模块10,启动模块1的输出端连接有数据获取模块2的输入端,数据获取模块2的输出端连接有知识图谱构建模块3的输入端,知识图谱构建模块3的输出端连接有特征提取模块4的输入端,特征提取模块4的输出端连接有候选身份排序模块5的输入端,候选身份排序模块5的输出端连接有身份识别决策模块6的输入端,身份识别决策模块6的输出端连接有身份生成模块7的输入端。
[0028]
知识图谱构建模块3的内部设置有信息抽取模块8、知识融合模块9和图谱构建模块10,信息抽取模块8、知识融合模块9和图谱构建模块10的整体输出端连接有知识图谱构建模块3的输入端。
[0029]
数据获取模块2采集与目标人物相关的社会信息,如目标人物乘坐车辆的车牌、目标人物出示的身份证件卡号、通信电话号、目标人物同行人的社会信息等,并将采集获得的社会信息输入计算层。
[0030]
信息抽取模块8以命名实体识别、实体链接及关系和事件抽取;实体抽取:主要任务是识别命名实体的文本范围,并将其分类为预定义的类别,学术上所涉及一般包含三大类,实体类、时间类、数字类和7个小类;关系抽取:基于模板的关系抽取,通过模板匹配实现,需要语言专家进行严格的语言模板制定,从文本中匹配出实体之间的关系,这种方法在
小规模、特定领域内,可以取得较好的结果;事件抽取:事件抽取是把事件任务分解成一个个小的子任务,是一个多分类问题,比如事件识别、元素抽取、属性分类;包含五类分类器:事件触发词分类器、在元素分类器、元素角色分类器、属性分类器、可报告性分类器;为实现对大数据平台中采集全量数据的价值发现,需要利用数据挖掘、机器学习、包括深度神经网络等分析技术对相应数据集进行挖掘建模。
[0031]
知识融合模块9对知识资源数据进行整理和融合,通过技术手段来减少信息提取缺陷造成的数据错误、数据歧义、数据冗余等现象;在知识融合过程中、主要包括知识合并和实体链接;知识合并是两种知识图谱进行合并,需要人工构建知识图谱的合并逻辑,如实体同名处理、属性融合。
[0032]
图谱构建模块10采用自顶向下来构建知识图谱,也就是先确定知识资源知识图谱的数据模型,根据模型框架补充数据,完成知识图谱的建设;根据已有的数据模型进行知识推理,对最后的结果数据进行评估,将合乎要求的数据构建在知识资源知识图谱中;根据已获的结构化数据实体、关系和属性,向图数据模式的转换,具体的操作如下:
[0033]
s1:对实体表中数据进行提取,然后转存到建立的图数据库;
[0034]
s2:对实体关系进行整理提取;
[0035]
s3:在建立的图数据库中对数据和关系进行逐个映射,通过关系连线完成节点间网络的建立,从而完成知识资源知识图谱的构建工作;
[0036]
图谱构建模块10的内部还设置有知识更新模块,知识更新模块包括概念层更新和数据层更新。
[0037]
特征提取模块4的计算层在获得生物特征信息后,经过身份识别算法对信息进行特征提取、与知识图谱中人物实体的生物属性进行特征匹配等处理,得到该人物实体对应的归一化匹配分数,即生物信息分数;生物信息分数的取值范围为[0,1]。
[0038]
候选身份排序模块5确定实战场景下的目标识别人物后,信息采集层首先采集该目标人物的各类生物特征信息,包括可在车站入口处或收费站等处近距离采集的指纹、虹膜、声纹等,以及可利用道路卡口处摄像头或无人机远距离采集的人像、步态信息;需要注意的是,人像、步态、声纹信息由于可通过广泛分布的音视频采集系统获得,将成为未来实时身份识别场景下的主要应用生物特征信息。
[0039]
身份识别决策模块6计算层负责计算各候选身份的社会信息分数;社会信息分数计算函数为l=f(s
11
,s
12
,

,s
nm
),社会信息分数的取值范围,即函数f(
·
)的值域为[0,1];s表示函数的变量,变量的筛选原则:变量可反映候选身份与信息采集层获取的与目标人物相关的社会信息的关联度;n表示变量包含多种不同类型;m表示在识别场景下获取的同一类型的多个变量值;身份识别决策模块6在决策层,逐个将各候选身份的生物信息分数和社会信息分数进行融合计算,获得各候选身份的综合分数li,之后依据综合分数对候选身份集合排序,分数越高,排序越靠前,代表该候选身份为识别目标人物真实身份的可能性越大。
[0040]
身份生成模块7分数计算结果对候选身份集合排序,并将分数和排序结果存入表1第一列。
[0041]
本发明中,在对目标任务进行身份识别时,知识图谱构建模块3的内部设置有图谱构建模块10,且图谱构建模块10内部的知识更新模块,知识更新模块随着知识图谱不断扩
容,依靠自动化手段进行增量更新,提高了更新效率,概念层更新指的是现有概念不能很好地描述实体时,进行的各类操作。这类更新可以通过开发api进行更新。同时搜索语句处理模块和知识搜索分发模块配合使用,考虑根据用户的自然查询语言中抽取的实体信息,提供相关的知识图谱信息。通过知识图谱可以很容易的发现关联知识和新知识,因此提供额外的知识图谱信息可以便于用户发现更多其感兴趣的内容和知识点,提高了搜索系统的准确性,且通过语法规则识别实体来生成语义三元组集合,然后生成结构化的查询语句。之后将用模板匹配或语义抽取方法得到的结构化查询语句提交至图数据库执行,最终为用户提供精准的搜索结果,提高了该系统在进行任务身份识别的过程中的及时高效性。
[0042]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0043]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种基于知识图谱目标人物身份识别系统,包括启动模块(1)、数据获取模块(2)、知识图谱构建模块(3)、特征提取模块(4)、候选身份排序模块(5)、身份识别决策模块(6)、身份生成模块(7)、信息抽取模块(8)、知识融合模块(9)和图谱构建模块(10),其特征在于:所述启动模块(1)的输出端连接有所述数据获取模块(2)的输入端,所述数据获取模块(2)的输出端连接有所述知识图谱构建模块(3)的输入端,所述知识图谱构建模块(3)的输出端连接有所述特征提取模块(4)的输入端,所述特征提取模块(4)的输出端连接有所述候选身份排序模块(5)的输入端,所述候选身份排序模块(5)的输出端连接有所述身份识别决策模块(6)的输入端,所述身份识别决策模块(6)的输出端连接有所述身份生成模块(7)的输入端。2.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述知识图谱构建模块(3)的内部设置有信息抽取模块(8)、知识融合模块(9)和图谱构建模块(10),所述信息抽取模块(8)、知识融合模块(9)和图谱构建模块(10)的整体输出端连接有所述知识图谱构建模块(3)的输入端。3.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述数据获取模块(2)采集与目标人物相关的社会信息,如目标人物乘坐车辆的车牌、目标人物出示的身份证件卡号、通信电话号、目标人物同行人的社会信息,并将采集获得的社会信息输入计算层。4.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述信息抽取模块(8)以命名实体识别、实体链接及关系和事件抽取;实体抽取:主要任务是识别命名实体的文本范围,并将其分类为预定义的类别,学术上所涉及一般包含三大类,实体类、时间类、数字类。5.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述知识融合模块(9)对知识资源数据进行整理和融合,通过技术手段来减少信息提取缺陷造成的数据错误、数据歧义、数据冗余现象;在知识融合过程中、主要包括知识合并和实体链接;知识合并是两种知识图谱进行合并,需要人工构建知识图谱的合并逻辑,如实体同名处理、属性融合。6.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述图谱构建模块(10)采用自顶向下来构建知识图谱,也就是先确定知识资源知识图谱的数据模型,根据模型框架补充数据,完成知识图谱的建设;根据已有的数据模型进行知识推理,对最后的结果数据进行评估,将合乎要求的数据构建在知识资源知识图谱中;根据已获的结构化数据实体、关系和属性,向图数据模式的转换,具体的操作如下:s1:对实体表中数据进行提取,然后转存到建立的图数据库;s2:对实体关系进行整理提取;s3:在建立的图数据库中对数据和关系进行逐个映射,通过关系连线完成节点间网络的建立,从而完成知识资源知识图谱的构建工作;所述图谱构建模块(10)的内部还设置有知识更新模块,知识更新模块包括概念层更新和数据层更新。7.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述特征提取模块(4)的计算层在获得生物特征信息后,经过身份识别算法对信息进行特征提取、与知识图谱中人物实体的生物属性进行特征匹配处理,得到该人物实体对应的归一化匹配
分数,即生物信息分数;生物信息分数的取值范围为[0,1]。8.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述候选身份排序模块(5)确定实战场景下的目标识别人物后,信息采集层首先采集该目标人物的各类生物特征信息,包括可在车站入口处或收费站处近距离采集的指纹、虹膜、声纹,以及可利用道路卡口处摄像头或无人机远距离采集的人像、步态信息;需要注意的是,人像、步态、声纹信息由于可通过广泛分布的音视频采集系统获得,将成为未来实时身份识别场景下的主要应用生物特征信息。9.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述身份识别决策模块(6)计算层负责计算各候选身份的社会信息分数;社会信息分数计算函数为l=f(s
11
,s
12
,

,s
nm
),社会信息分数的取值范围,即函数f(
·
)的值域为[0,1];s表示函数的变量,变量的筛选原则:变量可反映候选身份与信息采集层获取的与目标人物相关的社会信息的关联度;n表示变量包含多种不同类型;m表示在识别场景下获取的同一类型的多个变量值;所述身份识别决策模块(6)在决策层,逐个将各候选身份的生物信息分数和社会信息分数进行融合计算,获得各候选身份的综合分数li,之后依据综合分数对候选身份集合排序,分数越高,排序越靠前,代表该候选身份为识别目标人物真实身份的可能性越大。10.如权利要求1所述的一种基于知识图谱目标人物身份识别系统,其特征在于:所述身份生成模块(7)分数计算结果对候选身份集合排序,并将分数和排序结果存入表1第一列。

技术总结
本发明公开了一种基于知识图谱目标人物身份识别系统。本发明中,在对目标任务进行身份识别时,知识图谱构建模块的内部设置有图谱构建模块,且图谱构建模块内部的知识更新模块,知识更新模块随着知识图谱不断扩容,依靠自动化手段进行增量更新,提高了更新效率,概念层更新指的是现有概念不能很好地描述实体时,进行的各类操作。这类更新可以通过开发API进行更新。同时搜索语句处理模块和知识搜索分发模块配合使用,因此提供额外的知识图谱信息可以便于用户发现更多其感兴趣的内容和知识点,提高了搜索系统的准确性,最终为用户提供精准的搜索结果,提高了该系统在进行任务身份识别的过程中的及时高效性。识别的过程中的及时高效性。识别的过程中的及时高效性。


技术研发人员:程煜轩 赵静
受保护的技术使用者:华东师范大学
技术研发日:2023.02.23
技术公布日:2023/7/26
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐