一种基于图网络的车险数据处理方法及装置与流程
未命名
08-09
阅读:111
评论:0
1.本发明涉及数据处理技术领域,具体涉及一种基于图网络的车险数据处理方法及装置。
背景技术:
2.近来,车险欺诈行为频发,导致出现不正当车险理赔的现象。随着新技术的运行,目前主要通过规则引擎和数据挖掘算法的方式来对车险欺诈行为进行检测,然而规则的制定和模型的学习需要大量的数据以及人工参与,而且欺诈行为会随时发生变化,导致检测结果不可靠,时效性不高。现有技术中车险欺诈存在漏检、误检,检测准确性低的技术问题。
技术实现要素:
3.本技术提供了一种基于图网络的车险数据处理方法及装置,用于针对解决现有技术中车险欺诈存在漏检、误检,检测准确性低的技术问题。
4.鉴于上述问题,本技术提供了一种基于图网络的车险数据处理方法及装置。
5.本技术的第一个方面,提供了一种基于图网络的车险数据处理方法,其中,所述方法包括:采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。
6.本技术的第二个方面,提供了一种基于图网络的车险数据处理装置,所述装置包括:主体信息获得模块,所述主体信息获得模块用于采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及
主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;网络图谱构建模块,所述网络图谱构建模块用于根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;实时单位获得模块,所述实时单位获得模块用于获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;关联关系获得模块,所述关联关系获得模块用于将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;关联值获得模块,所述关联值获得模块用于构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;加权计算模块,所述加权计算模块用于根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;预警处理模块,所述预警处理模块用于构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。
7.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:本技术通过采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体,然后根据四个主体信息集合,基于图网络,构建车险数据网络图谱,进而获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位,通过将实时车辆、实时人员、实时修理公司和实时单位更新至车险数据网络图谱,并进行检索,获取实时车辆、实时人员、实时修理公司和实时单位与车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合,然后构建欺诈关联数据库,欺诈关联数据库内包括距离关联对照表和关系关联对照表,将关联距离集合和多个关联关系集合输入欺诈关联数据库内,获得距离关联值集合和关系关联值集合,进而根据多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值,然后构建嵌入于欺诈关联数据库的欺诈评价通道,将综合距离关联值和综合关系关联值输入欺诈评价通道内,获得欺诈概率值,在欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。达到了通过对车险数据进行深入分析,提高欺诈行为识别的准确性,提升分析效率的技术效果。
附图说明
8.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于
本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
9.图1为本技术实施例提供的一种基于图网络的车险数据处理方法流程示意图;图2为本技术实施例提供的一种基于图网络的车险数据处理方法中获得多个关联关系集合的流程示意图;图3为本技术实施例提供的一种基于图网络的车险数据处理方法中获得综合距离关联值和综合关系关联值的流程示意图;图4为本技术实施例提供的一种基于图网络的车险数据处理装置结构示意图。
10.附图标记说明:主体信息获得模块11,网络图谱构建模块12,实时单位获得模块13,关联关系获得模块14,关联值获得模块15,加权计算模块16,预警处理模块17。
具体实施方式
11.本技术通过提供了一种基于图网络的车险数据处理方法及装置,用于针对解决现有技术中车险欺诈存在漏检、误检,检测准确性低的技术问题。
12.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
13.需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
14.实施例一如图1所示,本技术提供了一种基于图网络的车险数据处理方法,其中,所述方法包括:步骤s100:采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;进一步的,采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,本技术实施例步骤s100还包括:步骤s110:对所述预设历史时间范围内的车险处理数据进行提取和分类,获得正常车险数据集合和出现欺诈行为的异常车险数据集合;步骤s120:提取所述异常车险数据集合内每个异常车险数据的欺诈金额,获得欺诈金额集合;步骤s130:对所述正常车险数据集合和异常车险数据集合内的车辆、人员、修理公司、单位以及主体之间的关联关系进行提取和梳理,获得所述四个主体信息集合和所述主体关系信息集合;步骤s140:根据异常车险数据集合内多个欺诈主体的出现次数,以及所述欺诈金
额集合,对所述四个主体信息集合内的欺诈主体进行标记。
15.在本技术的一个实施例中,通过对预设历史时间范围内的车险数据进行相关主体的整理,对车险理赔过程中的主体信息进行提取梳理,从而对数据复杂程度进行降维,提升后续分析处理的效率。其中,所述预设历史时间范围是由本领域技术人员预先设置的进行车险数据分析的时间段,可以是3个月、6个月等。车险处理数据中包括进行车辆理赔的相关信息,包括事故发生起因、处理人员、理赔双方等信息。通过从车辆、人员、修理公司和单位四个方面进行数据提取,从而获得四个主体信息集合和主体关系信息集合。其中,所述四个主体信息集合是车辆处理数据中四个方面的具体内容进行描述的信息,所述主体关系信息集合对四个主体之间的关联关系进行描述。示例性的,修理公司和人员中的定损人员主体存在的关联关系为“车辆维修”;人员中的车主人员主体与车辆之间存在关系为“拥有”等,人员中的车主人员主体和单位之间的存在关系为“员工”或者“法人”等。优选的,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体。所述欺诈行为次数是主体在预设历史时间范围内进行欺诈的次数。所述欺诈金额标记是用于对多个欺诈主体在预设历史时间范围内进行欺诈获得的金额进行描述,可通过人工识别和计算获得。多个欺诈主体是在四个主体信息集合内发生欺诈行为的主体。
16.具体而言,通过将是否出现欺诈行为作为区分依据,将预设历史时间范围内出现欺诈行为的车险处理数据添加进异常车险数据集合,将预设历史时间范围内未出现欺诈行为的车险处理数据添加进正常车险数据集合中。进而,对异常车险数据集合内每个异常车险数据的欺诈金额进行提取,获得欺诈金额集合。根据正常车险数据集合和异常车险数据集合中的车辆、人员、修理公司、单位以及主体之间的关联关系进行提取和梳理,获得所述四个主体信息集合和主体关系信息集合。进而,根据多个欺诈主体的出现次数,如异常车险数据集合内的人员发生欺诈行为的次数,以及欺诈金额集合中对应人员主体的欺诈金额,对所述四个主体信息集合内的欺诈主体进行标记。
17.步骤s200:根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;进一步的,根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱,本技术实施例步骤s200还包括:步骤s210:基于所述四个主体信息集合,构建多个图节点;步骤s220:基于所述主体关系信息集合,构建多个关系线,并连接所述多个图节点,构建所述四个主体信息集合内多个主体的拓扑结构,获得所述车险数据网络图谱。
18.在一个可能的实施例中,通过根据四个主体信息集合中的主体,以图网络为图谱的基础框架,构建所述车险数据网络图谱。其中,所述车险数据网络图谱是一种全局分析车险数据,对主体之间的关联关系进行挖掘间隔,从而可以通过对异常数据点进行分析,识别出现潜在的欺诈案例。
19.具体而言,通过以所述四个主体信息集合中的主体作为图网络的节点,获得多个图节点。优选的,对于不同类型的主体,采用不同形式的图节点,如使用椭圆代表车辆主体,以矩形代表人员主体,以菱形代表修理公司,以正方形代表单位,将横线代表描述主体之间关系的关系线。然后根据主体关系信息集合中的主体关系构建多个关系线,并将多个关系线的横线两端分别与对应的多个图节点进行连接,从而构建所述四个主体信息集合内多个主体的拓扑结构,生成所述车险数据网络图谱。通过使用所述车险数据网络图谱是车险处
理数据中包含信息的复杂度降低,可以更直观、更准确的进行数据分析。
20.步骤s300:获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;在一个实施例中,通过从车辆、人员、修理公司和单位四个维度对当前待进行车险欺诈分析的车险数据进行主体信息提取,从而获得实时车辆、实时人员、实时修理公司和实时单位。优选的,使用车牌号或车架号对实时车辆进行标识,从而避免车辆改装或伪造导致车险处理不准确。通过对进行车险理赔产生的车险数据进行车险欺诈分析,从而可以保证车险赔付的合理性和准确性,并通过对主体信息进行获取,降低车险数据处理的复杂程度,提升处理分析效率。
21.步骤s400:将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;进一步的,如图2所示,将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,本技术实施例步骤s400还包括:步骤s410:判断所述实时车辆、实时人员、实时修理公司和实时单位是否存在于所述车险数据网络图谱,若是,则获取四个实时节点信息,若否,则将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱内,并获得四个实时节点信息;步骤s420:在所述车险数据网络图谱内,获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的数量,获得所述关联距离集合;步骤s430:获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的关联关系,获得所述多个关联关系集合。
22.在本技术的实施例中,通过将所述实时车辆、实时人员、实时修理公司和实施单位更新至所述车险数据网络图谱中,并分别根据实时车辆、实时人员、实时修理公司和实时单位进行检索,与所述车险数据网络图谱内的欺诈主体进行匹配,获得与匹配成功的不同欺诈主体的关联距离和关联关系,得到关联距离集合和多个关联关系集合。其中,所述关联距离是以实时车辆、实时人员、实时修理公司和实施单位中的任意一个主体出发,索引获得的一个欺诈主体具有的关系线数量。示例性的,根据实时人员对车险数据网络图谱进行检索,与实时人员主体相连的某一个欺诈车辆的关系线数量为3,则距离为3,距离值越小表明距离越近,与欺诈主体的关联越大,则当前的车险数据就是欺诈车险行为的概率也就越大。由此,为后续进行车险数据处理提供依据。
23.在一个可能的实施例中,通过将实时车辆、实时人员、实时修理公司和实时单位与车险数据网络图谱中的数据进行匹配比对,判断是否存在于所述车险数据网络图谱中,若是,则获取四个实时节点信息,若否,则首先将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱中,从而获得四个实时节点信息。
24.具体而言,在所述车险数据网络图谱内,分别根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的数量,将其作为关联距离集合。示例性的,
根据车辆实时节点信息在所述车险数据网络图谱中同一个维修地,然后该维修地与欺诈主体之间是拥有关系,也就是说该维修地是欺诈主体开的,则对应的关联距离为2。也就是说,待进行车险欺诈分析的车险数据中的车辆进行维修的修理公司发生过欺诈行为,而该车辆由于在该修理公司进行维修,可能也会发生欺诈行为。
25.步骤s500:构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;进一步的,构建欺诈关联数据库,本技术实施例步骤s500还包括:步骤s510:对历史时间内的历史车险数据网络图谱进行数据提取,获取样本关联距离集合和样本关联关系集合;步骤s520:根据所述样本关联距离集合和样本关联关系集合内样本关联距离的大小以及样本关联关系的关系信息,进行欺诈关联值分析,获得样本距离关联值集合和样本关系关联值集合;步骤s530:构建所述样本关联距离集合和所述样本距离关联值集合的映射关系,获得所述距离关联对照表;步骤s540:构建所述样本关联关系集合和所述样本关系关联值集合的映射关系,获得所述关系关联对照表;步骤s550:将所述关联距离集合输入所述距离关联对照表,获得所述距离关联值集合;步骤s560:将所述多个关联关系集合输入所述关系关联对照表,获得多个关系关联值集合,计算所述多个关系关联值集合的多个均值,获得所述关系关联值集合。
26.在一个可能的实施例中,所述欺诈关联数据库中包括距离关联对照表和关系关联对照表,所述欺诈关联数据库用于对待进行车险欺诈分析的车险数据发生欺诈行为的可能程度进行量化分析。所述距离关联值集合反映了待进行车险欺诈分析的车险数据与欺诈主体的距离关联程度。所述关系关联关系集合反映了待进行车险欺诈分析的车险数据与欺诈主体之间关系的关联程度。将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合。
27.在一个实施例中,通过对历史时间内的历史车险数据网络图谱进行数据提取,从而获得样本关联距离集合和样本关联关系集合,用于构建欺诈关联数据库。距离越小,关联值越大,不同的关联关系对应不同的关系关联值,如法人、亲人等关联关系的关系关联值比较大。通过根据所述样本关联距离集合和样本关联关系集合内样本关联距离的大小以及样本关联关系的关系信息,获得样本距离关联值集合和样本关系关联值集合。优选的,通过将任意一个样本关联距离除以所述样本关联距离集合中所有距离的总值,将计算结果作为样本距离关联值。通过根据样本关联关系的属性确定关系关联值,如法人、亲人等属性对应的关系关联值越大。
28.具体而言,构建所述样本关联距离集合和所述样本距离关联值集合的映射关系,获得所述距离关联对照表,然后将所述关联距离集合输入所述距离关联对照表,获得所述距离关联值集合。进而,将所述多个关联关系集合输入所述关系关联对照表,获得多个关系关联值集合,计算所述多个关系关联值集合的多个均值,获得所述关系关联值集合。
29.步骤s600:根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;进一步的,如图3所示,根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,本技术实施例步骤s600还包括:步骤s610:根据所述多个欺诈主体被标记的欺诈行为次数的大小,进行权重分配,获得多个次数权重值;步骤s620:根据所述多个欺诈主体被标记的欺诈金额的大小,进行权重分配,获得多个金额权重值;步骤s630:根据所述多个次数权重值和多个金额权重值,进行分配计算,获得多个权值;步骤s640:采用所述多个权值,对所述距离关联值集合和关系关联值集合内的多个距离关联值和多个关系关联值进行加权计算,获得所述综合距离关联值和综合关系关联值。
30.在本技术的一个实施例中,在获得距离关联值集合和关系关联值集合后,根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,结合多个欺诈主体与距离关联值集合和关系关联值集合之间的对应关系进行加权计算,获得综合距离关联值和综合关系关联值。其中,所述综合距离关联值从距离的维度反映了待进行车险欺诈分析的车险数据存在欺诈行为的可能程度。所述综合关系关联值从关系关联的维度反映了待进行车险欺诈分析的车险数据存在欺诈行为的可能程度。
31.具体而言,通过根据所述多个欺诈主体被标记的欺诈行为次数的大小,进行权重分配,优选的,将任意一个欺诈主体被标记的欺诈行为次数比上多个欺诈主体被标记的欺诈行为次数总值获得的结果作为次数权重值,从而获得多个次数权重值。将欺诈主体被标记的欺诈金额的大小比上多个欺诈主体被标记的欺诈金额的总值,将计算结果作为金额权重值,从而根据多个欺诈主体被标记的欺诈金额的大小获得多个金额权重值。根据所述多个次数权重值和多个金额权重值,进行分配计算,获得多个权值,然后对距离关联值集合和关系关联值集合内的多个距离关联值和多个关系关联值进行加权计算,获得所述综合距离关联值和综合关系关联值。达到了提升分析数据可靠性的效果。
32.步骤s700:构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。
33.进一步的,构建嵌入于所述欺诈关联数据库的欺诈评价通道,本技术实施例步骤s700还包括:步骤s710:对历史时间内的历史车险数据网络图谱进行数据提取和处理,获取多个样本综合距离关联值、多个样本综合关系关联值;步骤s720:根据所述多个样本综合距离关联值、多个样本综合关系关联值在历史车险数据网络图谱进行检索,计算获取多个样本欺诈概率值;步骤s730:基于综合距离关联值和综合关系关联值,构建欺诈评价坐标空间;
步骤s740:将所述多个样本综合距离关联值、多个样本综合关系关联值进行组合,输入所述欺诈评价坐标空间,获得多个评价坐标点;步骤s750:采用所述多个样本欺诈概率值,对所述多个评价坐标点进行标记,获得所述欺诈评价通道;步骤s760:将所述综合距离关联值和综合关系关联值输入所述欺诈评价坐标空间内,获得实时评价坐标点;步骤s770:获取与所述实时评价坐标点距离最小的k个评价坐标点的k个样本欺诈概率值,计算均值,获得所述欺诈概率值,k为大于等于3的整数。
34.在一个实施例中,所述欺诈评价通道用于对待进行车险欺诈分析的车险数据进行智能化的欺诈概率分析,输入数据为综合距离值和综合关系值,输出数据为欺诈概率值。其中,所述欺诈概率阈值是对应的车险数据存在欺诈行为时的最低欺诈概率值。当欺诈概率值大于欺诈概率阈值时,对待进行车险欺诈行为分析的车险数据进行预警和车险欺诈处理。
35.具体而言,通过对历史时间内的历史车险数据网络图谱进行数据提取和处理,获取多个样本综合距离关联值、多个样本综合关系关联值,获得多个样本欺诈概率值。然后,以综合距离关联值作为欺诈评价坐标空间的第一坐标轴,以综合关系关联值作为欺诈评价坐标空间的第二坐标轴,将所述多个样本综合距离关联值、多个样本综合关系关联值进行组合,输入所述欺诈评价坐标空间,获得多个评价坐标点。并利用所述多个样本欺诈概率值对所述多个评价坐标点进行标记,从而根据第一坐标轴、第二坐标轴和标记后的多个评价坐标点构建所述欺诈评价通道。
36.具体的,将所述综合距离关联值和综合关系关联值输入所述欺诈评价坐标空间内,获得实时评价坐标点,然后获取与实时评价坐标点距离最小的k个评价坐标点的k个样本欺诈概率值,对k个样本欺诈概率值进行均值计算,获得欺诈概率值。达到了对待进行车险欺诈分析的车险数据存在欺诈的可能性进行量化计算,从而提升车险数据处理的准确率和效率的技术效果。
37.综上所述,本技术实施例至少具有如下技术效果:本技术通过对历史时间范围内的车险处理数据进行分析处理,提取主体信息,构建方便检索和直观展示车险数据网络图谱,然后对当前待进行车险欺诈分析的车险数据进行主体信息提取,然后输入车险数据网络图谱中进行检索,获得关联距离集合和多个关联关系集合,通过利用欺诈关联数据库对关联值进行量化分析,获得距离关联值集合和关系关联值集合,经过加权计算后获得综合距离关联值和综合关系关联值,进而,利用智能化的欺诈评价通道,在欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。达到了提升车险欺诈分析准确性和效率的技术效果。
38.实施例二基于与前述实施例中一种基于图网络的车险数据处理方法相同的发明构思,如图4所示,本技术提供了一种基于图网络的车险数据处理装置,本技术实施例中的装置与方法实施例基于同样的发明构思。其中,所述装置包括:主体信息获得模块11,所述主体信息获得模块11用于采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合
以及主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;网络图谱构建模块12,所述网络图谱构建模块12用于根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;实时单位获得模块13,所述实时单位获得模块13用于获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;关联关系获得模块14,所述关联关系获得模块14用于将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;关联值获得模块15,所述关联值获得模块15用于构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;加权计算模块16,所述加权计算模块16用于根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;预警处理模块17,所述预警处理模块17用于构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。
39.进一步的,所述主体信息获得模块11用于执行如下方法:对所述预设历史时间范围内的车险处理数据进行提取和分类,获得正常车险数据集合和出现欺诈行为的异常车险数据集合;提取所述异常车险数据集合内每个异常车险数据的欺诈金额,获得欺诈金额集合;对所述正常车险数据集合和异常车险数据集合内的车辆、人员、修理公司、单位以及主体之间的关联关系进行提取和梳理,获得所述四个主体信息集合和所述主体关系信息集合;根据异常车险数据集合内多个欺诈主体的出现次数,以及所述欺诈金额集合,对所述四个主体信息集合内的欺诈主体进行标记。
40.进一步的,所述网络图谱构建模块12用于执行如下方法:基于所述四个主体信息集合,构建多个图节点;基于所述主体关系信息集合,构建多个关系线,并连接所述多个图节点,构建所述四个主体信息集合内多个主体的拓扑结构,获得所述车险数据网络图谱。
41.进一步的,所述关联关系获得模块14用于执行如下方法:判断所述实时车辆、实时人员、实时修理公司和实时单位是否存在于所述车险数据网络图谱,若是,则获取四个实时节点信息,若否,则将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱内,并获得四个实时节点信息;在所述车险数据网络图谱内,获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的数量,获得所述关联距离集合;
获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的关联关系,获得所述多个关联关系集合。
42.进一步的,所述关联值获得模块15用于执行如下方法:对历史时间内的历史车险数据网络图谱进行数据提取,获取样本关联距离集合和样本关联关系集合;根据所述样本关联距离集合和样本关联关系集合内样本关联距离的大小以及样本关联关系的关系信息,进行欺诈关联值分析,获得样本距离关联值集合和样本关系关联值集合;构建所述样本关联距离集合和所述样本距离关联值集合的映射关系,获得所述距离关联对照表;构建所述样本关联关系集合和所述样本关系关联值集合的映射关系,获得所述关系关联对照表;将所述关联距离集合输入所述距离关联对照表,获得所述距离关联值集合;将所述多个关联关系集合输入所述关系关联对照表,获得多个关系关联值集合,计算所述多个关系关联值集合的多个均值,获得所述关系关联值集合。
43.进一步的,所述加权计算模块16用于执行如下方法:根据所述多个欺诈主体被标记的欺诈行为次数的大小,进行权重分配,获得多个次数权重值;根据所述多个欺诈主体被标记的欺诈金额的大小,进行权重分配,获得多个金额权重值;根据所述多个次数权重值和多个金额权重值,进行分配计算,获得多个权值;采用所述多个权值,对所述距离关联值集合和关系关联值集合内的多个距离关联值和多个关系关联值进行加权计算,获得所述综合距离关联值和综合关系关联值。
44.进一步的,所述预警处理模块17用于执行如下方法:对历史时间内的历史车险数据网络图谱进行数据提取和处理,获取多个样本综合距离关联值、多个样本综合关系关联值;根据所述多个样本综合距离关联值、多个样本综合关系关联值在历史车险数据网络图谱进行检索,计算获取多个样本欺诈概率值;基于综合距离关联值和综合关系关联值,构建欺诈评价坐标空间;将所述多个样本综合距离关联值、多个样本综合关系关联值进行组合,输入所述欺诈评价坐标空间,获得多个评价坐标点;采用所述多个样本欺诈概率值,对所述多个评价坐标点进行标记,获得所述欺诈评价通道;将所述综合距离关联值和综合关系关联值输入所述欺诈评价坐标空间内,获得实时评价坐标点;获取与所述实时评价坐标点距离最小的k个评价坐标点的k个样本欺诈概率值,计算均值,获得所述欺诈概率值,k为大于等于3的整数。
45.需要说明的是,上述本技术实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一
些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
46.以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
47.本说明书和附图仅仅是本技术的示例性说明,且视为已覆盖本技术范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围。这样,倘若本技术的这些修改和变型属于本技术及其等同技术的范围之内,则本技术意图包括这些改动和变型在内。
技术特征:
1.一种基于图网络的车险数据处理方法,其特征在于,所述方法包括:采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。2.根据权利要求1所述的方法,其特征在于,采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,包括:对所述预设历史时间范围内的车险处理数据进行提取和分类,获得正常车险数据集合和出现欺诈行为的异常车险数据集合;提取所述异常车险数据集合内每个异常车险数据的欺诈金额,获得欺诈金额集合;对所述正常车险数据集合和异常车险数据集合内的车辆、人员、修理公司、单位以及主体之间的关联关系进行提取和梳理,获得所述四个主体信息集合和所述主体关系信息集合;根据异常车险数据集合内多个欺诈主体的出现次数,以及所述欺诈金额集合,对所述四个主体信息集合内的欺诈主体进行标记。3.根据权利要求1所述的方法,其特征在于,根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱,包括:基于所述四个主体信息集合,构建多个图节点;基于所述主体关系信息集合,构建多个关系线,并连接所述多个图节点,构建所述四个主体信息集合内多个主体的拓扑结构,获得所述车险数据网络图谱。4.根据权利要求3所述的方法,其特征在于,将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,包括:判断所述实时车辆、实时人员、实时修理公司和实时单位是否存在于所述车险数据网
络图谱,若是,则获取四个实时节点信息,若否,则将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱内,并获得四个实时节点信息;在所述车险数据网络图谱内,获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的数量,获得所述关联距离集合;获取根据所述四个实时节点信息,以最少数量关系线索引至所述多个欺诈主体的关系线的关联关系,获得所述多个关联关系集合。5.根据权利要求1所述的方法,其特征在于,构建欺诈关联数据库,包括:对历史时间内的历史车险数据网络图谱进行数据提取,获取样本关联距离集合和样本关联关系集合;根据所述样本关联距离集合和样本关联关系集合内样本关联距离的大小以及样本关联关系的关系信息,进行欺诈关联值分析,获得样本距离关联值集合和样本关系关联值集合;构建所述样本关联距离集合和所述样本距离关联值集合的映射关系,获得所述距离关联对照表;构建所述样本关联关系集合和所述样本关系关联值集合的映射关系,获得所述关系关联对照表;将所述关联距离集合输入所述距离关联对照表,获得所述距离关联值集合;将所述多个关联关系集合输入所述关系关联对照表,获得多个关系关联值集合,计算所述多个关系关联值集合的多个均值,获得所述关系关联值集合。6.根据权利要求1所述的方法,其特征在于,根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,包括:根据所述多个欺诈主体被标记的欺诈行为次数的大小,进行权重分配,获得多个次数权重值;根据所述多个欺诈主体被标记的欺诈金额的大小,进行权重分配,获得多个金额权重值;根据所述多个次数权重值和多个金额权重值,进行分配计算,获得多个权值;采用所述多个权值,对所述距离关联值集合和关系关联值集合内的多个距离关联值和多个关系关联值进行加权计算,获得所述综合距离关联值和综合关系关联值。7.根据权利要求1所述的方法,其特征在于,构建嵌入于所述欺诈关联数据库的欺诈评价通道,包括:对历史时间内的历史车险数据网络图谱进行数据提取和处理,获取多个样本综合距离关联值、多个样本综合关系关联值;根据所述多个样本综合距离关联值、多个样本综合关系关联值在历史车险数据网络图谱进行检索,计算获取多个样本欺诈概率值;基于综合距离关联值和综合关系关联值,构建欺诈评价坐标空间;将所述多个样本综合距离关联值、多个样本综合关系关联值进行组合,输入所述欺诈评价坐标空间,获得多个评价坐标点;采用所述多个样本欺诈概率值,对所述多个评价坐标点进行标记,获得所述欺诈评价通道;
将所述综合距离关联值和综合关系关联值输入所述欺诈评价坐标空间内,获得实时评价坐标点;获取与所述实时评价坐标点距离最小的k个评价坐标点的k个样本欺诈概率值,计算均值,获得所述欺诈概率值,k为大于等于3的整数。8.一种基于图网络的车险数据处理装置,其特征在于,所述装置包括:主体信息获得模块,所述主体信息获得模块用于采集预设历史时间范围内的车险处理数据,并按照车辆、人员、修理公司和单位进行提取梳理,获得四个主体信息集合以及主体关系信息集合,所述四个主体信息集合内包括进行欺诈行为次数和欺诈金额标记的多个欺诈主体;网络图谱构建模块,所述网络图谱构建模块用于根据所述四个主体信息集合,基于图网络,构建车险数据网络图谱;实时单位获得模块,所述实时单位获得模块用于获取当前待进行车险欺诈分析的车险数据内的主体信息,获得实时车辆、实时人员、实时修理公司和实时单位;关联关系获得模块,所述关联关系获得模块用于将所述实时车辆、实时人员、实时修理公司和实时单位更新至所述车险数据网络图谱,并进行检索,获取所述实时车辆、实时人员、实时修理公司和实时单位与所述车险数据网络图谱内欺诈主体的关联距离和关联关系,获得关联距离集合和多个关联关系集合;关联值获得模块,所述关联值获得模块用于构建欺诈关联数据库,所述欺诈关联数据库内包括距离关联对照表和关系关联对照表,将所述关联距离集合和多个关联关系集合输入所述欺诈关联数据库内,获得距离关联值集合和关系关联值集合;加权计算模块,所述加权计算模块用于根据所述多个欺诈主体被标记的欺诈行为次数和欺诈金额的大小,对所述距离关联值集合和关系关联值集合进行加权计算,获得综合距离关联值和综合关系关联值;预警处理模块,所述预警处理模块用于构建嵌入于所述欺诈关联数据库的欺诈评价通道,将所述综合距离关联值和综合关系关联值输入所述欺诈评价通道内,获得欺诈概率值,在所述欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。
技术总结
本发明公开了一种基于图网络的车险数据处理方法及装置,涉及数据处理技术领域,该方法包括:采集预设历史时间范围内的车险处理数据,获得四个主体信息集合以及主体关系信息集合;构建车险数据网络图谱;获得实时车辆、实时人员、实时修理公司和实时单位;获得关联距离集合和多个关联关系集合;输入构建完成的欺诈关联数据库中,获得距离关联值集合和关系关联值集合;加权计算后获得综合距离关联值和综合关系关联值;获得欺诈概率值,在欺诈概率值大于欺诈概率阈值时,进行预警和车险欺诈处理。本发明解决了现有技术中车险欺诈存在漏检、误检,检测准确性低的技术问题,达到了提升车险欺诈行为识别的效率和准确性的技术效果。欺诈行为识别的效率和准确性的技术效果。欺诈行为识别的效率和准确性的技术效果。
技术研发人员:王辉 王桂元 刘立禹
受保护的技术使用者:凯泰铭科技(北京)有限公司
技术研发日:2023.07.06
技术公布日:2023/8/5
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
