一种基于知识图谱的人员关系挖掘方法及系统与流程
未命名
07-24
阅读:151
评论:0
1.本发明涉及知识图谱技术领域,特别是一种基于知识图谱的人员关系挖掘方法及系统。
背景技术:
2.随着智能化的科技浪潮不断推进,“智慧社区”、“智慧医疗”、“智慧农业”等众多新兴的智能化领域逐渐进入人们的实际生活,成为政府和企业的重点研发项目,其中“智慧社区”中的“智慧警务”领域也受到了较大的影响,发展出了一些强大的智能化监查手段,通过对社区的各个地点24小时不间断监控,以及依靠先进的机器学习技术,可以显著提高对社区的监管力度,对社区人民的生命财产安全提供重要保障。
3.其中如何在冗杂、海量的数据中选择有效信息对人员关系挖掘,在智慧社区中的作用越来越重要,但目前基于通用社交网络的分析方法无法满足在公共安全领域中的特定研判分析要求与应用,比如,在挖掘高风险人员的用户或者犯罪团伙时不能进行有效的分析、研判、可视化呈现。
技术实现要素:
4.本发明的目的在于克服现有技术的缺点,提供一种基于知识图谱的人员关系挖掘方法及系统。
5.本发明的目的通过以下技术方案来实现:一种基于知识图谱的人员关系挖掘方法,其特征在于:包括以下步骤:
6.s1:获取原始数据,并对数据进行预处理;
7.s2:构建知识图谱;
8.s3:通过知识图谱检索,分别得到第一关系数据和第二关系数据,分别存储及更新对应数据库;
9.s4:更新知识图谱;
10.s5:显示最终的判断结果给用户,同时用户可人为判定关系,反馈给系统,系统更新知识图谱。
11.优选的,步骤s2中,还包括以下步骤:
12.s21:利用自底向上的结构构建实体和关系组合,其中关系为人员之间的关系,实体为社区和人员,且不同实体之间通过关系连接;
13.s22:将数据进行实体抽取、关系抽取以及属性抽取,将中所有人员和社区进行实体生成,将人员信息和社区信息作为属性添加到对应的实体,再根据关系将不同的实体建立连接,以图的形式进行存储,建立初步知识图谱;
14.s23:利用基于图的关系推理算法对初步知识图谱进行数据挖掘,接着利用置信度较高的推理信息更新知识图谱,构成完整的知识图谱。
15.优选的,步骤s23中,知识加工使用关系图卷积网络r-gcn的关系推理算法应用到
知识图谱的关系网络中,利用已构造的图训练r-gcn网络,然后使用训练好的网络推理得到节点之间的关系,;r-gcn的前向传播公式为:
[0016][0017]
其中,i为节点,l为网络层数,h是节点的向量表示,σ是激活函数,r是关系,c是常量,w是参数矩阵,n是节点集合。
[0018]
优选的,步骤s1中,原始数据包括实时数据和历史数据,并对获取的实时数据进行过滤处理。
[0019]
优选的,步骤s3中,当对实时数据进行处理时,还包括以下步骤:
[0020]
s31:从实时数据中获取目标人员的户籍地址信息,并进行同乡模型匹配,当匹配成功时,则生成同乡关系,当匹配失败时,则进行下一步;
[0021]
s32:从实时数据中获取车辆信息,并与历史数据中发生嫌疑案件的车辆进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则进行下一步;
[0022]
s33:从实时数据中获取房产信息,并与历史数据中发生嫌疑案件的小区进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则生成访客关系;
[0023]
s34:根据关系得到第一关系数据,并录入数据库。
[0024]
优选的,步骤s3中,当对历史数据进行处理时,还包括以下步骤:
[0025]
s3.1:将目标人员与嫌疑人库和案件库进行匹配;
[0026]
s3.2:当发现可疑的同行人员时,标记可疑人员,并对其过往历史数据进行分析,得到目标人员与同行人员的关系密切程度;
[0027]
s3.3:根据关系得到第二关系数据,并录入数据库。
[0028]
一种基于知识图谱的人员关系挖掘系统,包括上述的一种基于知识图谱的人员关系挖掘方法,还包括数据获取模块、数据处理模块、实时计算模块、离线计算模块、图谱更新模块和显示模块,数据获取模块与数据处理模块电连接,数据获取模块用于获取原始数据,数据处理模块用于对原始数据进行过滤处理,实时计算模块和离线计算模块均与数据处理模块电连接,实时计算模块用于对实时数据进行分析挖掘得到第一关系数据,离线计算模块用于对历史数据进行分析挖掘得到第二关系数据,实时计算模块和离线计算模块均与图谱更新模块电连接,图谱更新模块用于更新知识图谱,图谱更新模块与显示模块电连接,显示模块用于用户交互。
[0029]
本发明具有以下优点:本发明基于知识图谱的思想,通过对已录入的智慧社区信息及其人员信息收集并建立知识图谱,同时通过获取的原始数据,对数据进行预处理,从而分析出人员关系数据,搭建目标人员的团队模型,建立起完整的人员社会关系图谱并对知识图谱进行更新,并将结果反馈给用户,同时用户可人为判定关系,反馈给系统,随即系统更新知识图谱,保障了推理的合理性。
附图说明
[0030]
图1为挖掘方法流程的结构示意图;
[0031]
图2为挖掘系统内部原理的结构示意图;
[0032]
图3为第一关系数据分类的结构示意图;
[0033]
图中,1-数据获取模块,2-数据处理模块,3-实时计算模块,4-离线计算模块,5-图谱更新模块,6-显示模块。
具体实施方式
[0034]
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。通常在此处附图中描述和示出的本发明实施方式的组件可以以各种不同的配置来布置和设计。
[0035]
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
[0036]
需要说明的是,在不冲突的情况下,本发明中的实施方式及实施方式中的特征可以相互组合。
[0037]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0038]
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0039]
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0040]
在本实施例中,如图1所示,一种基于知识图谱的人员关系挖掘方法,包括以下步骤:
[0041]
s1:获取原始数据,并对数据进行预处理;
[0042]
s2:构建知识图谱;
[0043]
s3:通过知识图谱检索,分别得到第一关系数据和第二关系数据,分别存储及更新对应数据库;
[0044]
s4:更新知识图谱;
[0045]
s5:显示最终的判断结果给用户,同时用户可人为判定关系,反馈给系统,系统更新知识图谱。基于知识图谱的思想,通过对已录入的智慧社区信息及其人员信息收集并建立知识图谱,同时通过获取的原始数据,对数据进行预处理,从而分析出人员关系数据,搭建目标人员的团队模型,建立起完整的人员社会关系图谱并对知识图谱进行更新,并将结果反馈给用户,同时用户可人为判定关系,反馈给系统,随即系统更新知识图谱,保障了推
理的合理性。
[0046]
进一步的,步骤s2中,还包括以下步骤:
[0047]
s21:利用自底向上的结构构建实体和关系组合,其中关系为人员之间的关系,实体为社区和人员,且不同实体之间通过关系连接;
[0048]
s22:将数据进行实体抽取、关系抽取以及属性抽取,将中所有人员和社区进行实体生成,将人员信息和社区信息作为属性添加到对应的实体,再根据关系将不同的实体建立连接,以图的形式进行存储,建立初步知识图谱;
[0049]
s23:利用基于图的关系推理算法对初步知识图谱进行数据挖掘,接着利用置信度较高的推理信息更新知识图谱,构成完整的知识图谱。再进一步的,步骤s23中,知识加工使用关系图卷积网络r-gcn的关系推理算法应用到知识图谱的关系网络中,利用已构造的图训练r-gcn网络,然后使用训练好的网络推理得到节点之间的关系,;r-gcn的前向传播公式为:
[0050][0051]
其中,i为节点,l为网络层数,h是节点的向量表示,σ是激活函数,r是关系,c是常量,w是参数矩阵,n是节点集合。
[0052]
在本实施例中,步骤s1中,原始数据包括实时数据和历史数据,并对获取的实时数据进行过滤处理。具体地说,对获取的实时数据进行过滤处理是通过现有方法实现的,这里并未对其改进,就不再进行赘述,其主要目的是将脏乱的数据转化为格式规范、整齐的符合标准的数据,从而便于后续数据分析挖掘。
[0053]
进一步的,如图3所示,步骤s3中,当对实时数据进行处理时,还包括以下步骤:
[0054]
s31:从实时数据中获取目标人员的户籍地址信息,并进行同乡模型匹配,当匹配成功时,则生成同乡关系,当匹配失败时,则进行下一步;
[0055]
s32:从实时数据中获取车辆信息,并与历史数据中发生嫌疑案件的车辆进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则进行下一步;
[0056]
s33:从实时数据中获取房产信息,并与历史数据中发生嫌疑案件的小区进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则生成访客关系;
[0057]
s34:根据关系得到第一关系数据,并录入数据库。
[0058]
再进一步的,步骤s3中,当对历史数据进行处理时,还包括以下步骤:
[0059]
s3.1:将目标人员与嫌疑人库和案件库进行匹配;
[0060]
s3.2:当发现可疑的同行人员时,标记可疑人员,并对其过往历史数据进行分析,得到目标人员与同行人员的关系密切程度;
[0061]
s3.3:根据关系得到第二关系数据,并录入数据库。
[0062]
如图2所示,一种基于知识图谱的人员关系挖掘系统,包括上述的一种基于知识图谱的人员关系挖掘方法,还包括数据获取模块1、数据处理模块2、实时计算模块3、离线计算模块4、图谱更新模块5和显示模块6,数据获取模块1与数据处理模块2电连接,数据获取模块1用于获取原始数据,数据处理模块2用于对原始数据进行过滤处理,实时计算模块3和离线计算模块4均与数据处理模块2电连接,实时计算模块3用于对实时数据进行分析挖掘得到第一关系数据,离线计算模块4用于对历史数据进行分析挖掘得到第二关系数据,实时计
算模块3和离线计算模块4均与图谱更新模块5电连接,图谱更新模块5用于更新知识图谱,图谱更新模块5与显示模块6电连接,显示模块6用于用户交互。
[0063]
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于知识图谱的人员关系挖掘方法,其特征在于:包括以下步骤:s1:获取原始数据,并对数据进行预处理;s2:构建知识图谱;s3:通过知识图谱检索,分别得到第一关系数据和第二关系数据,分别存储及更新对应数据库;s4:更新知识图谱;s5:显示最终的判断结果给用户,同时用户可人为判定关系,反馈给系统,系统更新知识图谱。2.根据权利要求1所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:所述步骤s2中,还包括以下步骤:s21:利用自底向上的结构构建实体和关系组合,其中关系为人员之间的关系,实体为社区和人员,且不同实体之间通过关系连接;s22:将数据进行实体抽取、关系抽取以及属性抽取,将中所有人员和社区进行实体生成,将人员信息和社区信息作为属性添加到对应的实体,再根据关系将不同的实体建立连接,以图的形式进行存储,建立初步知识图谱;s23:利用基于图的关系推理算法对初步知识图谱进行数据挖掘,接着利用置信度较高的推理信息更新知识图谱,构成完整的知识图谱。3.根据权利要求2所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:所述步骤s23中,知识加工使用关系图卷积网络r-gcn的关系推理算法应用到知识图谱的关系网络中,利用已构造的图训练r-gcn网络,然后使用训练好的网络推理得到节点之间的关系,;r-gcn的前向传播公式为:其中,i为节点,l为网络层数,h是节点的向量表示,σ是激活函数,r是关系,c是常量,w是参数矩阵,n是节点集合。4.根据权利要求1所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:所述步骤s1中,原始数据包括实时数据和历史数据,并对获取的实时数据进行过滤处理。5.根据权利要求1所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:所述步骤s3中,当对实时数据进行处理时,还包括以下步骤:s31:从实时数据中获取目标人员的户籍地址信息,并进行同乡模型匹配,当匹配成功时,则生成同乡关系,当匹配失败时,则进行下一步;s32:从实时数据中获取车辆信息,并与历史数据中发生嫌疑案件的车辆进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则进行下一步;s33:从实时数据中获取房产信息,并与历史数据中发生嫌疑案件的小区进行比对,若比对成功,则生成嫌疑人关系,若比对失败,则生成访客关系;s34:根据关系得到第一关系数据,并录入数据库。6.根据权利要求5所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:所述步骤s3中,当对历史数据进行处理时,还包括以下步骤:s3.1:将目标人员与嫌疑人库和案件库进行匹配;
s3.2:当发现可疑的同行人员时,标记可疑人员,并对其过往历史数据进行分析,得到目标人员与同行人员的关系密切程度;s3.3:根据关系得到第二关系数据,并录入数据库。7.一种基于知识图谱的人员关系挖掘系统,包括权利要求1~6任意一项所述的一种基于知识图谱的人员关系挖掘方法,其特征在于:还包括数据获取模块(1)、数据处理模块(2)、实时计算模块(3)、离线计算模块(4)、图谱更新模块(5)和显示模块(6),所述数据获取模块(1)与所述数据处理模块(2)电连接,所述数据获取模块(1)用于获取原始数据,所述数据处理模块(2)用于对原始数据进行过滤处理,所述实时计算模块(3)和所述离线计算模块(4)均与所述数据处理模块(2)电连接,所述实时计算模块(3)用于对实时数据进行分析挖掘得到第一关系数据,所述离线计算模块(4)用于对历史数据进行分析挖掘得到第二关系数据,所述实时计算模块(3)和所述离线计算模块(4)均与所述图谱更新模块(5)电连接,所述图谱更新模块(5)用于更新知识图谱,所述图谱更新模块(5)与所述显示模块(6)电连接,所述显示模块(6)用于用户交互。
技术总结
本发明公开了一种基于知识图谱的人员关系挖掘方法,S1:获取原始数据,并对数据进行预处理;S2:构建知识图谱;S3:应用知识图谱挖掘分析,获取目标第一关系数据和第二关系数据,分别存储及更新对应数据库;S4:更新知识图谱;S5:显示最终的挖掘结果给用户,同时用户可人为判定关系,反馈给系统,系统更新知识图谱,并且公开了系统。对已录入的智慧社区信息及人员信息收集并建立知识图谱,通过获取的原始数据,对数据进行预处理,分析出人员关系数据,搭建目标人员的团队模型,建立起完整的人员社会关系图谱并对知识图谱进行更新,并将结果反馈给用户,用户可人为判定关系,反馈给系统,系统更新知识图谱,保障推理合理性。保障推理合理性。保障推理合理性。
技术研发人员:杨勇 张笑难 刘华 夏平 蓝思思
受保护的技术使用者:成都合盛智联科技有限公司
技术研发日:2023.05.18
技术公布日:2023/7/22
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
