异常对象检测方法、装置、设备、介质和计算机程序产品与流程
未命名
07-23
阅读:83
评论:0
1.本技术涉及计算机技术,更涉及信息安全技术领域,特别是涉及一种异常对象检测方法、装置、设备、介质和计算机程序产品。
背景技术:
2.随着互联网的发展,网络通讯开发技术的逐步成熟,人们之间的交流逐步从电话移向网络。每天都有相当多的人在使用基于网络实现的各种网络通讯应用进行线上沟通。网络通讯应用是通过通讯技术来实现在线聊天、交流的应用程序。网络通讯应用的普及,给人们的日常生活带来了很多便利,但是,也给很多从事违规违法等行为的主体创造了机会。因此,急需一种有效的异常对象检测方法用于检测异常的对象,以保证网络安全。
3.传统技术中,通常采用基于密度的聚类算法检测异常的对象。然而,基于密度的聚类算法的检测效果并不好,无法准确地检测出异常的对象,从而导致异常对象检测准确率较低。
技术实现要素:
4.基于此,有必要针对上述技术问题,提供一种能够提升异常对象检测准确率的异常对象检测方法、装置、设备、介质和计算机程序产品。
5.第一方面,本技术提供了一种异常对象检测方法,所述方法包括:
6.构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;
7.基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
8.获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;
9.从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
10.从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
11.第二方面,本技术还提供了一种异常对象检测装置,所述装置包括:
12.构建模块,用于构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;
13.划分模块,用于基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
14.获取模块,用于获取各所述对象集群的集群特征数据,并基于所述集群特征数据
从划分出的对象集群中,识别异常对象集群;
15.确定模块,用于从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
16.检测模块,用于从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
17.在一个实施例中,所述边连接的对象节点所对应的对象之间具有多约束关系;所述多约束关系是指在预设的多个约束条件下皆具有约束关系;所述约束相似度,包括具有所述多约束关系的对象之间的多约束相似度;所述装置还包括:
18.融合模块,用于针对具有多约束关系的任意两个对象,对所述任意两个对象分别对应的行为数据进行相似度计算,以分别确定所述任意两个对象在每个所述约束条件下的单约束相似度;确定多个所述约束条件各自对应的重要度系数;根据多个所述约束条件各自对应的重要度系数,对所述任意两个对象分别在各个所述约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。
19.在一个实施例中,在每个约束条件下具有约束关系的任意两个对象属于关系对;所述融合模块还用于针对每个约束条件,确定在所述约束条件下的关系对的第一数量;基于所述第一数量,确定在多个所述约束条件下的关系对的第二数量;基于所述第一数量与所述第二数量的比值,确定每个所述约束条件对应的数量占比;基于多个所述约束条件分别对应的数量占比,确定多个所述约束条件各自对应的重要度系数。
20.在一个实施例中,所述对象集群为表征集群的对象约束关系子图;所述划分模块还用于将所述对象约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值;解除约束相似度小于所述划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图;将下一轮作为本轮,并将对象节点数量大于预设节点数量的所述对象约束关系子图作为本轮目标图,返回所述确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。
21.在一个实施例中,通过迭代划分得到的各对象约束关系子图为候选的对象约束关系子图;所述划分模块还用于从各所述候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图。
22.在一个实施例中,所述获取模块还用于获取各所述对象集群在多个特征维度下分别对应的集群特征数据;针对多个所述特征维度中的每一个特征维度,根据所述特征维度对应的集群特征数据,确定所述对象集群在所述特征维度下的异常概率值;针对每一个对象集群,将所述对象集群在多个所述特征维度分别对应的异常概率值进行融合,得到所述对象集群对应的融合异常概率值;将所述融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。
23.在一个实施例中,所述检测模块还用于针对每一个种子对象节点,从所述对象约束关系图中,查找与所述种子对象节点相连的预设阶数的对象节点;基于所述种子对象节点和查找的各对象节点,构建与所述种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图;所述有向边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述有向边的方向,是从存储时间在前的对象节点指向存储时间在后的对象节点;
针对所述有向局部关联图中各对象节点,基于指向各所述对象节点的目标邻居对象节点与所述对象节点的之间的约束相似度、以及所述目标邻居对象节点的出边数目,确定所述有向局部关联图中各对象节点的目标异常系数;基于各有向局部关联图中各个对象节点的目标异常系数,从所述有向局部关联图中选择部分对象节点,得到异常对象节点;选择的对象节点的目标异常系数大于所述有向局部关联图中未被选择的对象节点的目标异常系数。
24.在一个实施例中,所述有向边连接的对象节点所对应的对象之间的约束相似度为所述有向边的初始化有向边权重;所述检测模块还用于将第一轮作为本轮,将所述初始化有向边权重作为本轮有向边权重,并将所述有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将所述有向局部关联图中的每一个对象节点作为当前对象节点,确定指向所述当前对象节点的各目标邻居对象节点;分别确定各所述目标邻居对象节点的出边数目;基于所述目标邻居对象节点对应的出边数目、所述目标邻居对象节点对应的本轮异常系数、以及从所述目标邻居对象节点指向所述当前对象节点的有向边的本轮有向边权重,确定从所述目标邻居对象节点指向所述当前对象节点的有向边的中间态有向边权重;基于各所述目标邻居对象节点分别对应的中间态有向边权重,确定所述当前对象节点的中间态异常系数;将下一轮作为本轮,将所述中间态有向边权重作为本轮有向边权重,将所述中间态异常系数作为本轮异常系数,返回所述在本轮检测过程中,分别将所述有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件,得到所述有向局部关联图中各个对象节点的目标异常系数。
25.在一个实施例中,所述有向局部关联图中各对象节点包括种子对象节点和非种子对象节点;所述检测模块还用于将第一预设异常系数,作为所述有向局部关联图中种子对象节点对应的初始化异常系数;将第二预设异常系数,作为所述有向局部关联图中非种子对象节点对应的初始化异常系数;其中,所述第一预设异常系数和所述第二预设异常系数,用于表征所述有向局部关联图中各对象节点对应的对象属于异常对象的概率;所述第一预设异常系数大于所述第二预设异常系数。
26.在一个实施例中,所述检测模块还用于针对每一个目标邻居对象节点,确定所述目标邻居对象节点对应的本轮异常系数与所述目标邻居对象节点对应的出边数目的比值;将所述比值与从所述目标邻居对象节点指向所述当前对象节点的有向边的本轮有向边权重的乘积,作为从所述目标邻居对象节点指向所述当前对象节点的有向边的中间态有向边权重;针对每一个当前对象节点,将所述当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,得到所述当前对象节点的中间态异常系数。
27.第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
28.构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;
29.基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
30.获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;
31.从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
32.从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
33.第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
34.构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;
35.基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
36.获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;
37.从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
38.从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
39.第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现以下步骤:
40.构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;
41.基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
42.获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;
43.从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
44.从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
45.上述异常对象检测方法、装置、设备、介质和计算机程序产品,通过构建包括多个对象节点和边的对象约束关系图,其中,边连接的对象节点所对应的对象在预设的约束条件下具有约束关系,边的权重用于表征具有约束关系的对象之间的约束相似度。基于约束相似度可对对象约束关系图进行集群划分,得到各个对象集群,其中,每个对象集群中包括至少一个对象节点。通过获取各对象集群的集群特征数据,从而可基于集群特征数据从划分出的对象集群中,识别异常对象集群,并可从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点。进而,从对象约束关系图中,可检测与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。本技术通过构建对象约束关系图,先对对象约束关系图进行集群划分,以检测出异常对象
集群,进而进阶地再从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的种子对象节点,以进一步基于种子对象节点,从对象约束关系图中检测出表征异常对象的异常对象节点,可以准确地检测出异常的对象,从而提升异常对象检测准确率。
附图说明
46.图1为一个实施例中异常对象检测方法的应用环境图;
47.图2为一个实施例中异常对象检测方法的流程示意图;
48.图3为一个实施例中对象约束关系图的示意图;
49.图4为一个实施例中对象约束关系图进行集群划分,得到各个对象集群的过程示意图;
50.图5为一个实施例中检测与种子对象节点之间满足强关联条件的异常对象节点的过程示意图;
51.图6为一个实施例中异常对象检测方法的原理示意图;
52.图7为另一个实施例中异常对象检测方法的流程示意图;
53.图8为一个实施例中异常对象检测装置的结构框图;
54.图9为另一个实施例中异常对象检测装置的结构框图;
55.图10为一个实施例中计算机设备的内部结构图。
具体实施方式
56.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
57.本技术提供的异常对象检测方法,可以应用于如图1所示的应用环境中。终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。终端102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。
58.服务器104可构建包括多个对象节点和边的对象约束关系图;边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;边的权重,用于表征具有约束关系的对象之间的约束相似度。服务器104可基于约束相似度对对象约束关系图进行集群划分,得到各个对象集群,每个对象集群中包括至少一个对象节点。服务器104可获取各对象集群的集群特征数据,并基于集群特征数据从划分出的对象集群中,识别异常对象集群,从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点。服务器104可从对象约束关系图中,检测与种子对象节点之间满足强关联条件的对象节点,得到
异常对象节点;异常对象节点用于表征异常对象。
59.可以理解,终端102可以提供各对象集群的集群特征数据,服务器104可获取终端102提供的各对象集群的集群特征数据。服务器104本地可存储有各对象集群的集群特征数据,服务器104也可以直接从本地获取各对象集群的集群特征数据。本实施例对此不做限定,可以理解,图1中的应用场景仅为示意说明,并不限定于此。
60.在一个实施例中,如图2所示,提供了一种异常对象检测方法,该方法可应用于计算机设备,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。本实施例可包括以下步骤:
61.步骤202,构建包括多个对象节点和边的对象约束关系图;边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;边的权重,用于表征具有约束关系的对象之间的约束相似度。
62.其中,对象节点,是由对象抽象得到的节点。对象是指具备主动行为能力的主体,比如,对象可以是各种网络通讯应用的账号。可以理解,网络通讯应用即可以是即时通讯应用,也可以是非即时通讯应用。对象约束关系图,是用于表征各对象在预设约束条件下的约束关系的连通图。约束条件,是一种基于对象的属性信息,对各对象施加限制范围的过滤条件。对象的属性信息,是用于描述对象自身属性的信息。约束关系,是用于描述在约束条件下的两个对象之间所具备的关系。约束相似度,是指具有约束关系的两个对象之间的行为相似度。
63.在一个实施例中,约束条件可以是各对象的属性信息相同,比如,各对象的ip(internet protocol,网际互连协议)地址相同、对象的昵称相同、对象的头像相同、以及对象的个性签名相同等中的至少一种。
64.具体地,计算机设备可确定在预设的约束条件下具有约束关系的各个对象,并将各个对象分别抽象为各个对象节点。计算机设备可确定具有约束关系的对象之间的约束相似度,并可将约束关系抽象为连接相应两个对象节点的边。计算机设备可将这两个对象节点对应的对象之间的约束相似度,抽象为连接的这两个对象节点的边的权重,从而构建得到包括多个对象节点和边的对象约束关系图。
65.如图3所示,对象约束关系图包括多个对象节点301和多条连接对象节点的边302。可以理解,对象节点301用于表征各个待检测的对象,连接两个对象节点的边302,用于表征对象节点对应的对象在预设的约束条件下具有约束关系。比如,对象节点i和对象节点j由边302相连,则表明对象节点i对应的对象与对象节点j对应的对象在预设的约束条件下具有约束关系。可以理解,在预设的约束条件下不具有约束关系的对象所对应的对象节点之间不建边。
66.步骤204,基于约束相似度对对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点。
67.其中,集群划分,是指基于约束相似度将对象约束关系图划分为多个对象集群的处理操作。对象集群,是指包括至少一个对象节点的集合。
68.具体地,计算机设备可基于具有约束关系的两个对象之间的约束相似度的大小,确定是否需要解除这两个对象在预设的约束条件下的约束关系,从而实现对对象约束关系图的集群划分,得到各个对象集群。可以理解,每个对象集群中可以只包括一个对象节点,
也可以包括多个对象节点。
69.在一个实施例中,计算机设备可通过迭代集群划分的方式实现对对象约束关系图的集群划分。针对每一轮的集群划分,计算机设备可设定一个划分相似度阈值,并通过将该划分相似度阈值与两个对象之间的约束相似度进行比较,以确定在本轮的集群划分过程中,是否需要解除这两个对象在预设的约束条件下的约束关系,从而实现对对象约束关系图的集群划分,得到各个对象集群。
70.步骤206,获取各对象集群的集群特征数据,并基于集群特征数据从划分出的对象集群中,识别异常对象集群。
71.其中,集群特征数据,是用于表征对象集群的特征的数据。异常对象集群,是行为表现异常的对象对应的对象节点所构成的对象集群。
72.具体地,一个对象集群的集群特征数据,可用于判断该对象集群是否表现异常。计算机设备可获取各对象集群的集群特征数据。针对每一个对象集群,计算机设备可基于该对象集群的集群特征数据,判断该对象集群是否表现异常。从而,计算机设备可将表现异常的各对象集群,确定为异常对象集群。
73.在一个实施例中,针对每一个对象集群,计算机设备可基于该对象集群的集群特征数据,计算该对象集群的异常概率值。进而,计算机设备可基于异常概率值判断该对象集群是否表现异常。其中,对象集群的异常概率值,是表征对象集群属于异常对象集群的概率值。
74.步骤208,从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点。
75.其中,剩余对象集群,是划分得到的各个对象集群中除异常对象集群外的那部分对象集群。也可以理解,剩余对象集群,是行为表现正常的对象对应的对象节点所构成的对象集群。种子对象节点,是在剩余对象集群中行为表现异常的对象所对应的对象节点。
76.具体地,计算机设备可确定未识别为异常对象集群的剩余对象集群中的各个对象节点,并获取剩余对象集群中各个对象节点对应的对象的行为数据。计算机设备可基于剩余对象集群中各个对象节点对应的对象的行为数据,确定表征异常对象的对象节点,得到种子对象节点。
77.在一个实施例中,计算机设备可确定未识别为异常对象集群的剩余对象集群中的各个对象节点,并获取剩余对象集群中各个对象节点对应的对象的行为数据。基于剩余对象集群中各个对象节点对应的对象的行为数据,通过人工审核的方式,筛选出表征异常对象的对象节点。进而,计算机设备可获取筛选的表征异常对象的对象节点,得到种子对象节点。
78.在一个实施例中,计算机设备可基于剩余对象集群中各个对象节点对应的对象的行为数据,分别计算剩余对象集群中各个对象节点对应的节点异常值。进而,计算机设备可将节点异常值大于预设节点异常值的对象节点,确定为表征异常对象的对象节点,得到种子对象节点。其中,节点异常值,是表征剩余对象集群中对象节点对应的对象属于异常对象的概率值。
79.步骤210,从对象约束关系图中,检测与种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;异常对象节点用于表征异常对象。
80.其中,强关联条件,是一种基于种子对象节点的异常信息,对对象约束关系图中各对象施加限制范围的过滤条件。种子对象节点的异常信息,是表征种子对象节点对应的对象行为异常的信息。可以理解,强关联条件,可用于从对象约束关系图中,筛选出与种子对象节点具有高相似度的对象节点。
81.具体地,对象约束关系图中可包括很多的对象节点,计算机设备可将种子对象节点作为查询条件,从对象约束关系图中,查询出与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。
82.在一个实施例中,对象约束关系图中包括至少一个种子对象节点,针对每一个种子对象节点,计算机设备可将该种子对象节点作为查询条件,从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点,并从与种子对象节点相连的预设阶数的对象节点中,检测出与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。
83.在一个实施例中,对象约束关系图中包括至少一个种子对象节点,针对每一个种子对象节点,计算机设备可将该种子对象节点作为查询条件,从对象约束关系图中,查找与种子对象节点相连的所有的对象节点,并从与种子对象节点相连的所有的对象节点中,检测出与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。可以理解,计算机设备可直接从对象约束关系图的所有对象节点中,检测与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。
84.上述异常对象检测方法中,通过构建包括多个对象节点和边的对象约束关系图,其中,边连接的对象节点所对应的对象在预设的约束条件下具有约束关系,边的权重用于表征具有约束关系的对象之间的约束相似度。基于约束相似度可对对象约束关系图进行集群划分,得到各个对象集群,其中,每个对象集群中包括至少一个对象节点。通过获取各对象集群的集群特征数据,从而可基于集群特征数据从划分出的对象集群中,识别异常对象集群,并可从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点。进而,从对象约束关系图中,可检测与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。本技术通过构建对象约束关系图,先对对象约束关系图进行集群划分,以检测出异常对象集群,进而进阶地再从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的种子对象节点,以进一步基于种子对象节点,从对象约束关系图中检测出表征异常对象的异常对象节点,可以准确地检测出异常的对象,从而提升异常对象检测准确率。
85.同时,本技术的异常对象检测方法对人为设定的超参数的敏感度,低于传统的基于密度的聚类算法对人为设定的超参数的敏感度,进一步提升了异常对象检测准确率。此外,相较于传统的基于模块度的社区检测算法,本技术的异常对象检测方法通过约束相似度实现对对象约束关系图进行集群划分,可以得到各个满足预设数量规模的对象集群,可避免迭代出超大数量的对象集群,提升了异常检测的结果可解释性。
86.在一个实施例中,边连接的对象节点所对应的对象之间具有多约束关系;多约束关系是指在预设的多个约束条件下皆具有约束关系;约束相似度,包括具有多约束关系的对象之间的多约束相似度;方法还包括:针对具有多约束关系的任意两个对象,对任意两个对象分别对应的行为数据进行相似度计算,以分别确定任意两个对象在每个约束条件下的
单约束相似度;确定多个约束条件各自对应的重要度系数;根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。
87.其中,多约束相似度,是在多个约束条件下所确定得到的两个对象之间的相似度。行为数据,是用于表征对象行为活动的数据。单约束相似度,是在一个约束条件下所确定得到的两个对象之间的相似度。重要度系数,是表征约束条件的重要程度的系数。
88.具体地,计算机设备可获取各个对象对应的行为数据。针对具有多约束关系的任意两个对象,计算机设备可对任意两个对象分别对应的行为数据进行相似度计算,以分别确定任意两个对象在每个约束条件下的单约束相似度。进而,计算机设备可确定多个约束条件各自对应的重要度系数,并将多个约束条件各自对应的重要度系数,分别作为各个约束条件下的单约束相似度的融合权重,以对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。
89.在一个实施例中,若得到的多约束相似度大于1,则计算机设备可对大于1的多约束相似度进行规范化处理,可以理解,计算机设备可将大于1的多约束相似度规范化至[0,1]之间。
[0090]
在一个实施例中,各个约束条件在对象对应的行为数据的获取过滤条件可以不同,可以理解,各个约束条件下对象对应的行为数据也可以不同。计算机设备可分别获取各个约束条件下对象的行为数据,并分别对各个约束条件下两个对象的行为数据进行相似度计算,以分别确定任意两个对象在各个约束条件下的单约束相似度。
[0091]
在一个实施例中,各个约束条件下对象对应的行为数据的获取过滤条件可以相同,可以理解,各个约束条件下对象对应的行为数据也可以相同。
[0092]
上述实施例中,在多个约束条件下,通过根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,可以得到具有多约束关系的对象之间的多约束相似度,使得基于多约束相似度构建的对象约束关系图更加准确,进一步提升了异常对象检测准确率。
[0093]
在一个实施例中,在每个约束条件下具有约束关系的任意两个对象属于关系对;确定多个约束条件各自对应的重要度系数,包括:针对每个约束条件,确定在约束条件下的关系对的第一数量;基于第一数量,确定在多个约束条件下的关系对的第二数量;基于第一数量与第二数量的比值,确定每个约束条件对应的数量占比;基于多个约束条件分别对应的数量占比,确定多个约束条件各自对应的重要度系数。
[0094]
其中,第一数量,是在单个约束条件下的关系对的数量。第二数量,是在多约束条件下的关系对的数量。数量占比,是在单个约束条件下的关系对的数量与在多约束条件下的关系对的数量的比值。
[0095]
具体地,针对每个约束条件,计算机设备可确定在该约束条件下的关系对的第一数量。进而,计算机设备可基于第一数量,确定在多个约束条件下的关系对的第二数量。计算机设备可确定第一数量与第二数量的比值,并基于第一数量与第二数量的比值,计算每个约束条件对应的数量占比。进而,计算机设备可基于多个约束条件分别对应的数量占比,分别确定多个约束条件各自对应的重要度系数。
[0096]
在一个实施例中,计算机设备可获取预设重要度上限值。针对每一个约束条件,计
算机设备可将预设重要度上限值与该约束条件对应的数量占比之差,作为该约束条件对应的重要度系数。
[0097]
在一个实施例中,一个约束条件对应的重要度系数可通过以下公式计算得到:
[0098]
θm=1-nm/
[0099]
其中,θm表示约束条件m对应的重要度系数,nm表示在单个约束条件m下的关系对的数目,n表示在多个约束条件下的关系对的总数目。
[0100]
上述实施例中,在多个约束条件下,通过基于多个约束条件分别对应的数量占比,可以分别确定多个约束条件各自对应的重要度系数,进而使得在根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合时,可以得到更加准确的多约束相似度,从而进一步提升异常对象检测准确率。
[0101]
在一个实施例中,计算机设备可将多个约束条件各自对应的重要度系数,分别作为各个约束条件下的单约束相似度的融合权重与单约束相似度相乘,并对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,即将相乘后的结果进行累加,得到具有多约束关系的对象之间的多约束相似度。
[0102]
在一个实施例中,具有多约束关系的两个对象之间的多约束相似度可通过以下公式计算得到:
[0103][0104]
其中,w
ij
表示具有多约束关系的对象i与对象j之间的多约束相似度,l表示多个约束条件的集合,sim
ij
表示对象i与对象j分别在各个约束条件下的单约束相似度。
[0105]
在一个实施例中,对象集群为表征集群的对象约束关系子图;基于约束相似度对对象约束关系图进行集群划分,得到各个对象集群,包括:将对象约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值;解除约束相似度小于划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图;将下一轮作为本轮,并将对象节点数量大于预设节点数量的对象约束关系子图作为本轮目标图,返回确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。
[0106]
其中,本轮目标图,是在本轮进行集群划分过程中作为划分目标的图。划分相似度阈值,是用于判断是否解除对象节点所对应的对象之间的约束关系的相似度值。对象约束关系子图,是基于对象约束关系图进行集群划分得到的图。集群划分停止条件,是用于控制停止集群迭代划分过程的条件。
[0107]
具体地,计算机设备可将对象约束关系图作为待在本轮进行集群划分的本轮目标图,并确定本轮的划分相似度阈值。计算机设备可将对象节点所对应的对象之间的约束相似度与划分相似度阈值进行比对,并解除约束相似度小于划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图。计算机设备可确定本轮划分后的对象约束关系子图中各对象节点的数量,并将下一轮作为本轮,将对象节点数量大于预设节点数量的对象约束关系子图作为本轮目标图,返回确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;其中,后一轮
的划分相似度阈值大于前一轮的划分相似度阈值。
[0108]
在一个实施例中,集群划分停止条件可以是集群划分的迭代次数达到预设集群划分迭代次数阈值,也可以是得到的各对象约束关系子图均满足预设对象节点数量区间。
[0109]
在一个实施例中,对象约束关系图中的各边的权重均大于预设连接相似度阈值。在对对象约束关系图进行迭代集群划分过程中,每一轮的划分相似度阈值均大于预设连接相似度阈值,且后一轮的划分相似度阈值与前一轮的划分相似度阈值之差为固定不变的预设相似度常量。可以理解,预设相似度常量为集群迭代划分的步长,在集群迭代划分过程中,本轮对应的划分相似度阈值,总比前一轮集群划分时所确定的划分相似度阈值大预设相似度常量。
[0110]
上述实施例中,通过迭代划分的方式对对象约束关系图进行集群划分,在每一轮的集群划分过程中,确定本轮的划分相似度阈值,解除约束相似度小于划分相似度阈值的对象节点所对应的对象之间的约束关系。由于在迭代集群划分过程中,后一轮的划分相似度阈值总是大于前一轮的划分相似度阈值,可以将对象节点之间约束相似度较高对象节点聚类为一个对象约束关系子图,进而可以进一步提升后续异常对象检测的准确率。
[0111]
在一个实施例中,通过迭代划分得到的各对象约束关系子图为候选的对象约束关系子图;方法还包括:从各候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图。
[0112]
具体地,计算机设备可将通过迭代划分得到的各对象约束关系子图,作为候选的对象约束关系子图。计算机设备可确定各候选的对象约束关系子图中对象节点的数量,并从各候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图。
[0113]
上述实施例中,通过从各候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图,这样,可以避免出现超大数量规模的对象集群,从而提升异常对象检测结果的可解释性。
[0114]
在一个实施例中,若对某个对象约束关系子图进行集群划分,其划分得到的各对象约束关系子图中,仅存在一个节点数量落在预设节点数量区间内的对象约束关系子图,则计算机设备可将被进行集群划分的对象约束关系子图本身,也作为对象集群输出。
[0115]
如图4所示,401表示构建得到的对象约束关系图,计算机设备可基于约束相似度对对象约束关系图401进行迭代的集群划分,当满足集群划分停止条件时,比如,划分得到的各个对象约束关系子图中对象节点数量均小于或等于4个,输出各候选的对象约束关系子图403。计算机设备可从各候选的对象约束关系子图403中,筛选节点数量在预设节点数量区间,比如节点数量在[2,4]区间内的对象约束关系子图,得到表征集群的对象约束关系子图404。需要注意的是,图4中的对象约束关系子图405进行集群划分,其划分得到的各对象约束关系子图406中,仅存在一个节点数量落在预设节点数量区间内的对象约束关系子图407,则计算机设备可将被进行集群划分的对象约束关系子图405本身,也作为对象集群输出。进而,计算机设备可对划分得到的对象集群进行异常识别,得到异常对象集群,并将识别的异常对象集群发送至处理平台进行处理,比如,若对象为即时通讯账号,则处理平台可对各个异常即时通讯账号进行处理。针对未识别出异常的非异常对象集群,计算机设备可将非异常对象集群发送至审核平台,以选择表征异常对象的种子对象节点。
[0116]
在一个实施例中,获取各对象集群的集群特征数据,并基于集群特征数据从划分出的对象集群中,识别异常对象集群,包括:获取各对象集群在多个特征维度下分别对应的集群特征数据;针对多个特征维度中的每一个特征维度,根据特征维度对应的集群特征数据,确定对象集群在特征维度下的异常概率值;针对每一个对象集群,将对象集群在多个特征维度分别对应的异常概率值进行融合,得到对象集群对应的融合异常概率值;将融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。
[0117]
其中,特征维度,是对象集群的集群特征数据所归属的数据维度。融合异常概率值,是将对象集群在多个特征维度分别对应的异常概率值进行融合后所得到的综合的异常概率值。
[0118]
举例说明,特征维度具体可以包括对象对应的年龄、对象对应的性别、以及对象对应的被投诉次数等中的至少一种。
[0119]
具体地,计算机设备可获取各对象集群在多个特征维度下分别对应的集群特征数据。针对多个特征维度中的每一个特征维度,计算机设备可根据特征维度对应的集群特征数据,分别计算各个对象集群在该特征维度下的异常概率值。针对每一个对象集群,计算机设备可将该对象集群在多个特征维度分别对应的异常概率值进行融合,得到对象集群对应的融合异常概率值。计算机设备可将融合异常概率值与预设异常概率值进行比对,并将融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。
[0120]
举例说明,若特征维度为对象对应的年龄,则在该特征维度下的异常概率值,具体可以是对象集群对应的青少年占比或老年人占比等中的至少一种。可以理解,青少年占比和/或老年人占比较高的对象集群,其为异常对象集群的概率越大。若特征维度为对象对应的被投诉次数,则在该特征维度下的异常概率值,具体可以是对象集群对应的被投诉率。可以理解,被投诉率较高的对象集群,其为异常对象集群的概率越大。
[0121]
在一个实施例中,计算机设备可将该对象集群在多个特征维度分别对应的异常概率值进行融合,具体可以将该对象集群在多个特征维度分别对应的异常概率值进行加权融合,也可直接对该对象集群在多个特征维度分别对应的异常概率值取平均,得到对象集群对应的融合异常概率值。
[0122]
上述实施例中,通过将对象集群在多个特征维度分别对应的异常概率值进行融合,可以得到更加准确的对象集群对应的融合异常概率值,进而通过更加准确的融合异常概率值进行异常对象集群识别,可以提升异常对象集群识别准确率。
[0123]
在一个实施例中,从对象约束关系图中,检测与种子对象节点之间满足强关联条件的对象节点,得到异常对象节点,包括:针对每一个种子对象节点,从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点;基于种子对象节点和查找的各对象节点,构建与种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图;有向边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;有向边的方向,是从存储时间在前的对象节点指向存储时间在后的对象节点;针对有向局部关联图中各对象节点,基于指向各对象节点的目标邻居对象节点与对象节点的之间的约束相似度、以及目标邻居对象节点的出边数目,确定有向局部关联图中各对象节点的目标异常系数;基于各有向局部关联图中各个对象节点的目标异常系数,从有向局部关联图中选择部分对象节点,得到异常对象节点;选择的对象节点的目标异常系数大于有向局部关联图中未被选择的对
象节点的目标异常系数。
[0124]
其中,预设阶数,是指预先设定的阶数。可以理解,针对一个指定的对象节点,与该指定的对象节点直接有边相连的对象节点,称为一阶邻居对象节点。即,跨过n-1个对象节点与该指定的对象节点间接连通的对象节点,称为n阶邻居对象节点。其中,n为自然数。可以理解,邻居对象节点,是与一个对象节点直接或间接相连通的其他的对象节点。有向局部关联图,是用于表征各对象在预设约束条件下的约束关系的有向连通图。有向边是指有方向的边。目标邻居对象节点,是有向局部关联图中,与一个对象节点存在有向边直接相连、且有向边方向为指向该对象节点的相邻的对象节点。目标邻居对象节点的出边数目,是指从目标邻居对象节点出发的有向边的数目。异常系数,用于表征有向局部关联图中各对象节点对应的对象属于异常对象的概率。目标异常系数,是作为目标的异常系数。
[0125]
具体地,针对每一个种子对象节点,计算机设备可将种子节点作为查询开始的对象节点,从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点。计算机设备可基于种子对象节点和查找的各对象节点,构建与种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图。针对有向局部关联图中的每一个对象节点,计算机设备可确定指向该对象节点的目标邻居对象节点,并计算指向该对象节点的目标邻居对象节点与该对象节点的之间的约束相似度。进而,计算机设备可基于指向各对象节点的目标邻居对象节点与对象节点的之间的约束相似度、以及目标邻居对象节点的出边数目,确定有向局部关联图中各对象节点的目标异常系数。计算机设备可基于各有向局部关联图中各个对象节点的目标异常系数,从有向局部关联图中选择目标异常系数较大的部分对象节点,作为异常对象节点。
[0126]
在一个实施例中,计算机设备可通过迭代检测的方式,不断更新有向局部关联图中各对象节点的目标异常系数。在满足检测停止条件时,计算机设备可确定有向局部关联图中各对象节点的目标异常系数,并基于有向局部关联图中各对象节点的目标异常系数,从有向局部关联图中检测出异常对象节点。
[0127]
上述实施例中,通过从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点,并基于查找的对象节点构建有向局部关联图,从而基于有向局部关联图进行异常对象节点检测,可以提升异常对象节点的检测效率。同时,在基于有向局部关联图进行异常对象节点检测时,同时考虑了指向各对象节点的目标邻居对象节点与对象节点的之间的约束相似度、以及目标邻居对象节点的出边数目,可以进一步提升异常对象检测的准确率。
[0128]
在一个实施例中,有向边连接的对象节点所对应的对象之间的约束相似度为有向边的初始化有向边权重;基于指向各对象节点的目标邻居对象节点与对象节点的之间的约束相似度、以及目标邻居对象节点的出边数目,确定有向局部关联图中各对象节点的目标异常系数,包括:将第一轮作为本轮,将初始化有向边权重作为本轮有向边权重,并将有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点,确定指向当前对象节点的各目标邻居对象节点;分别确定各目标邻居对象节点的出边数目;基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,确定从目标邻居对象节点指向当前对象节点的
有向边的中间态有向边权重;基于各目标邻居对象节点分别对应的中间态有向边权重,确定当前对象节点的中间态异常系数;将下一轮作为本轮,将中间态有向边权重作为本轮有向边权重,将中间态异常系数作为本轮异常系数,返回在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件,得到有向局部关联图中各个对象节点的目标异常系数。
[0129]
其中,初始化有向边权重,是在迭代检测异常对象节点过程中,作为第一轮迭代检测的有向边的有向边权重。初始化异常系数,是预先设定的、且在迭代检测异常对象节点过程中,作为第一轮迭代检测的对象节点的异常系数。本轮有向边权重,是在本轮迭代检测的有向边的有向边权重。本轮异常系数,是在本轮迭代检测的对象节点的异常系数。当前对象节点,是在本轮迭代检测的有向局部关联图中的每一个对象节点。中间态有向边权重,是迭代检测异常对象节点过程中,处于中间状态的有向边权重。中间态异常系数,是迭代检测异常对象节点过程中,处于中间状态的异常系数。中间状态,是指在迭代检测异常对象节点过程中暂时存在的状态,可以理解,中间态有向边权重,是不作为最后结果输出的有向边权重。中间态异常系数,是不作为最后结果输出的异常系数。检测停止条件,是控制迭代检测异常对象节点过程停止的条件。
[0130]
具体地,计算机设备可将有向边连接的对象节点所对应的对象之间的约束相似度,作为有向边的初始化有向边权重。计算机设备可将第一轮作为本轮,将初始化有向边权重作为本轮有向边权重,并将有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数。在本轮检测过程中,计算机设备可分别将有向局部关联图中的每一个对象节点作为当前对象节点,从当前对象节点的各邻居对象节点中,筛选出指向当前对象节点的各目标邻居对象节点。计算机设备可分别确定各目标邻居对象节点的出边数目,基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,确定从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重。计算机设备可基于各目标邻居对象节点分别对应的中间态有向边权重,计算当前对象节点的中间态异常系数。计算机设备可将下一轮作为本轮,将中间态有向边权重作为本轮有向边权重,将中间态异常系数作为本轮异常系数,返回在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件时,停止迭代检测异常对象节点,并得到有向局部关联图中各个对象节点的目标异常系数。
[0131]
上述实施例中,通过迭代检测的方式实现对有向局部关联图中各对象节点的异常检测,在首轮迭代检测过程中,通过将初始化有向边权重作为本轮有向边权重,并将有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,以使得后续检测出的异常对象节点与表征异常对象的种子对象节点具有较高的相似度。同时,在每一轮迭代检测过程中,同时考虑了基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,以此来确定从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重,进而,基于各目标邻居对象节点分别对应的中间态有向边权重,确定当前对象节点的中间态异常系数,进一步提升了异常对象节点的检测准确率。
[0132]
在一个实施例中,有向局部关联图中各对象节点包括种子对象节点和非种子对象
节点;方法还包括:将第一预设异常系数,作为有向局部关联图中种子对象节点对应的初始化异常系数;将第二预设异常系数,作为有向局部关联图中非种子对象节点对应的初始化异常系数;其中,第一预设异常系数和第二预设异常系数,用于表征有向局部关联图中各对象节点对应的对象属于异常对象的概率;第一预设异常系数大于第二预设异常系数。
[0133]
其中,非种子对象节点,是有向局部关联图中除种子对象节点之外的对象节点。第一预设异常系数,是针对有向局部关联图中的种子对象节点预先设置的异常系数。第二预设异常系数,是针对有向局部关联图中的非种子对象节点预先设置的异常系数。
[0134]
具体地,计算机设备可获取第一预设异常系数和第二预设异常系数,并将第一预设异常系数,作为有向局部关联图中种子对象节点对应的初始化异常系数,将第二预设异常系数,作为有向局部关联图中非种子对象节点对应的初始化异常系数。其中,第一预设异常系数和第二预设异常系数,用于表征有向局部关联图中各对象节点对应的对象属于异常对象的概率;第一预设异常系数大于第二预设异常系数。
[0135]
上述实施例中,通过将较大的第一预设异常系数,作为有向局部关联图中种子对象节点对应的初始化异常系数,并将较小的第二预设异常系数,作为有向局部关联图中非种子对象节点对应的初始化异常系数,可以使得在后续异常检测过程中,准确检测出与表征异常对象的种子对象节点相似度较高的对象节点,进一步提升异常对象检测准确率。
[0136]
在一个实施例中,基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,确定从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重,包括:针对每一个目标邻居对象节点,确定目标邻居对象节点对应的本轮异常系数与目标邻居对象节点对应的出边数目的比值;将该比值与从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重的乘积,作为从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重。基于各目标邻居对象节点分别对应的中间态有向边权重,确定当前对象节点的中间态异常系数,包括:针对每一个当前对象节点,将当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,得到当前对象节点的中间态异常系数。
[0137]
具体地,针对每一个目标邻居对象节点,计算机设备可计算目标邻居对象节点对应的本轮异常系数与目标邻居对象节点对应的出边数目的比值。计算机设备可确定该比值与从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重的乘积,并将该比值与从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重的乘积,直接作为从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重。针对每一个当前对象节点,计算机设备可将当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,并将相加得到的结果。直接作为当前对象节点的中间态异常系数。
[0138]
在一个实施例中,当前对象节点的中间态异常系数可通过以下公式计算得到:
[0139][0140]
其中,pr
pi
表示当前对象节点pi的中间态异常系数,pj表示当前对象节点pi的一个目标邻居对象节点,pr()是目标邻居对象节点pj的本轮异常系数,m(pi)表示当前对象节点pi的所有目标邻居对象节点的集合,l(pj)表示目标邻居对象节点pj对应的出边数目。
[0141]
上述实施例中,通过确定目标邻居对象节点对应的本轮异常系数与目标邻居对象节点对应的出边数目的比值,并将该比值与从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重的乘积,直接作为从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重,以及通过将当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,得到当前对象节点的中间态异常系数,可以进一步提升异常对象检测准确率。
[0142]
如图5所示,对象节点用圆形节点来示意,其中,白色的圆形节点表示种子对象节点。针对501中示出的每一个种子对象节点,计算机设备可从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点,可以理解,502中的各灰色的圆形节点即为查找出的预设阶数的对象节点。计算机设备可以基于种子对象节点和查找的各对象节点,构建与种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图,可以理解,图5中所示意的503中包括两个有向局部关联图,且503仅为示意图,不对本技术的有向局部关联图作具体限定。现以其中一个有向局部关联图5031示意说明,通过504所示意的迭代检测过程,确定有向局部关联图5031中各对象节点的目标异常系数。进而,参见图5中的505,计算机设备可基于各有向局部关联图中各个对象节点的目标异常系数从大到小的顺序,对各对象节点进行排序,从排序后的对象节点中选择部分对象节点,得到异常对象节点。
[0143]
举例说明,图5中的504所示意的迭代检测过程,若当前对象节点为对象节点i,则对象节点i的目标邻居对象节点为指向对象节点i的对象节点j1和j2,其中,对象节点j1为种子对象节点,对象节点i和j2为非种子节点。第一次迭代时,计算机设备可将1作为对象节点j1对应的初始化异常系数,将0作为对象节点i和j2对应的初始化异常系数,以及有向边连接的对象节点所对应的对象之间的约束相似度为有向边的初始化有向边权重,比如,从对象节点j1指向对象节点i的有向边的初始化有向边权重为1,从对象节点j2指向对象节点i的有向边的初始化有向边权重为0.5。可以理解,在迭代检测过程中,计算机设备可对各个有向边的有向边权重进行更新,得到检测过程中各有向边的中间态有向边权重,比如,第一次迭代时,计算机设备可将从对象节点j1指向对象节点i的有向边的初始化有向边权重1,更新为中间态有向边权重0.5,将从对象节点j2指向对象节点i的有向边的初始化有向边权重0.5,更新为中间态有向边权重0。进而,计算机设备可将对象节点j1对应的中间态有向边权重0.5与对象节点j2对应的中间态有向边权重0相加,得到对象节点i的中间态异常系数0.5。通过迭代检测过程,可对有向局部关联图5031中各对象节点的异常系数进行更新,直至满足检测停止条件,比如,有向局部关联图5031中各对象节点的异常系数不再更新时,得到有向局部关联图5031中各对象节点的目标异常系数。
[0144]
如图6所示,601中为由各个对象抽象得到的对象节点,针对601中具有多约束关系的任意两个对象节点,对这两个对象节点的对象分别对应的行为数据进行相似度计算,参照图6中的602,可分别确定任意两个对象在每个单约束条件,比如,分别确定在约束条件1和约束条件2下的单约束相似度。进而,计算机设备可确定多个约束条件各自对应的重要度系数,根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度,并基于多约束相似度构建得到对象约束关系图603。计算机设备可将对象约束关系图603存储至图数据库604中。参照图6中的605,计算机设备可对对象约束关系图603进行集群划分,并从划
分得到的对象集群中识别出异常对象集群,并将未识别为异常对象集群的剩余对象集群6051发送至审核平台,以筛选出表征异常对象的对象节点,得到种子对象节点606。参照图6中的607,针对每一个种子对象节点(即,白色的对象节点),从在图数据库604存储的对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点(即灰色的对象节点),并基于查找的对象节点,检测与种子对象节点之间满足强关联条件的对象节点,得到异常对象节点。
[0145]
如图7所示,在一个实施例中,提供了一种异常对象检测方法,该方法具体包括以下步骤:
[0146]
步骤702,针对具有多约束关系的任意两个对象,对任意两个对象分别对应的行为数据进行相似度计算,以分别确定任意两个对象在每个约束条件下的单约束相似度。
[0147]
步骤704,确定多个约束条件各自对应的重要度系数;根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。
[0148]
步骤706,构建包括多个对象节点和边的对象约束关系图;边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;边的权重,用于表征具有约束关系的对象之间的多约束相似度。
[0149]
步骤708,将对象约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值。
[0150]
步骤710,解除多约束相似度小于划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图。
[0151]
步骤712,将下一轮作为本轮,并将对象节点数量大于预设节点数量的对象约束关系子图作为本轮目标图,返回确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;将对象约束关系子图作为对象集群;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。
[0152]
步骤714,获取各对象集群在多个特征维度下分别对应的集群特征数据;针对多个特征维度中的每一个特征维度,根据特征维度对应的集群特征数据,确定对象集群在特征维度下的异常概率值。
[0153]
步骤716,针对每一个对象集群,将对象集群在多个特征维度分别对应的异常概率值进行融合,得到对象集群对应的融合异常概率值;将融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。
[0154]
步骤718,从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;针对每一个种子对象节点,从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点。
[0155]
步骤720,基于种子对象节点和查找的各对象节点,构建与种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图;有向边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;有向边的方向,是从存储时间在前的对象节点指向存储时间在后的对象节点。
[0156]
步骤722,将有向边连接的对象节点所对应的对象之间的多约束相似度作为有向边的初始化有向边权重;针对有向局部关联图中各对象节点,将第一轮作为本轮,将初始化
有向边权重作为本轮有向边权重,并将有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点,确定指向当前对象节点的各目标邻居对象节点。
[0157]
步骤724,分别确定各目标邻居对象节点的出边数目;基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,确定从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重。
[0158]
步骤726,基于各目标邻居对象节点分别对应的中间态有向边权重,确定当前对象节点的中间态异常系数。
[0159]
步骤728,将下一轮作为本轮,将中间态有向边权重作为本轮有向边权重,将中间态异常系数作为本轮异常系数,返回在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件,得到有向局部关联图中各个对象节点的目标异常系数。
[0160]
步骤730,基于各有向局部关联图中各个对象节点的目标异常系数,从有向局部关联图中选择部分对象节点,得到异常对象节点;选择的对象节点的目标异常系数大于有向局部关联图中未被选择的对象节点的目标异常系数;异常对象节点用于表征异常对象。
[0161]
需要说明的是,步骤708至步骤712描述的是进行集群划分过程中涉及的迭代处理。步骤722至步骤728描述的是检测与种子对象节点相关的异常对象节点的过程中涉及的迭代处理,二者的迭代处理过程是相互独立的,可以理解,步骤708至步骤712进行集群划分的迭代处理过程,并不影响步骤722至步骤728检测与种子对象节点相关的异常对象节点的迭代处理过程。
[0162]
本技术还提供一种应用场景,该应用场景应用上述的异常对象检测方法。具体地,该异常对象检测方法可应用于即时通讯账号异常检测的场景,可以理解,对象为即时通讯账号。针对具有多约束关系的任意两个即时通讯账号,计算机设备可对任意两个即时通讯账号分别对应的行为数据进行相似度计算,以分别确定任意两个即时通讯账号在每个约束条件下的单约束相似度。确定多个约束条件各自对应的重要度系数;根据多个约束条件各自对应的重要度系数,对任意两个即时通讯账号分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的即时通讯账号之间的多约束相似度。构建包括多个即时通讯账号节点和边的即时通讯账号约束关系图;边连接的即时通讯账号节点所对应的即时通讯账号在预设的约束条件下具有约束关系;边的权重,用于表征具有约束关系的即时通讯账号之间的多约束相似度。
[0163]
计算机设备可将即时通讯账号约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值。解除多约束相似度小于划分相似度阈值的即时通讯账号节点所对应的即时通讯账号之间的约束关系,得到本轮划分后的即时通讯账号约束关系子图。将下一轮作为本轮,并将即时通讯账号节点数量大于预设节点数量的即时通讯账号约束关系子图作为本轮目标图,返回确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各即时通讯账号约束关系子图;即时通讯账号集群为表征集群的将即时通讯账号约束关系子图作为即时通讯账号集群;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。获取各即时通讯账号集群在多个特征维度下分别对应的
集群特征数据;针对多个特征维度中的每一个特征维度,根据特征维度对应的集群特征数据,确定即时通讯账号集群在特征维度下的异常概率值。针对每一个即时通讯账号集群,将即时通讯账号集群在多个特征维度分别对应的异常概率值进行融合,得到即时通讯账号集群对应的融合异常概率值;将融合异常概率值大于预设异常概率值的即时通讯账号集群识别为异常即时通讯账号集群。
[0164]
计算机设备可从未识别为异常即时通讯账号集群的剩余即时通讯账号集群中,确定表征异常即时通讯账号的即时通讯账号节点,得到种子即时通讯账号节点;针对每一个种子即时通讯账号节点,从即时通讯账号约束关系图中,查找与种子即时通讯账号节点相连的预设阶数的即时通讯账号节点。基于种子即时通讯账号节点和查找的各即时通讯账号节点,构建与种子即时通讯账号节点对应的、且包括多个即时通讯账号节点和有向边的有向局部关联图;有向边连接的即时通讯账号节点所对应的即时通讯账号在预设的约束条件下具有约束关系;有向边的方向,是从存储时间在前的即时通讯账号节点指向存储时间在后的即时通讯账号节点。
[0165]
计算机设备可将有向边连接的即时通讯账号节点所对应的即时通讯账号之间的多约束相似度作为有向边的初始化有向边权重;针对有向局部关联图中各即时通讯账号节点,将第一轮作为本轮,将初始化有向边权重作为本轮有向边权重,并将有向局部关联图中各即时通讯账号节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将有向局部关联图中的每一个即时通讯账号节点作为当前即时通讯账号节点,确定指向当前即时通讯账号节点的各目标邻居即时通讯账号节点。分别确定各目标邻居即时通讯账号节点的出边数目;基于目标邻居即时通讯账号节点对应的出边数目、目标邻居即时通讯账号节点对应的本轮异常系数、以及从目标邻居即时通讯账号节点指向当前即时通讯账号节点的有向边的本轮有向边权重,确定从目标邻居即时通讯账号节点指向当前即时通讯账号节点的有向边的中间态有向边权重。基于各目标邻居即时通讯账号节点分别对应的中间态有向边权重,确定当前即时通讯账号节点的中间态异常系数。将下一轮作为本轮,将中间态有向边权重作为本轮有向边权重,将中间态异常系数作为本轮异常系数,返回在本轮检测过程中,分别将有向局部关联图中的每一个即时通讯账号节点作为当前即时通讯账号节点的步骤以迭代执行,直至满足检测停止条件,得到有向局部关联图中各个即时通讯账号节点的目标异常系数。基于各有向局部关联图中各个即时通讯账号节点的目标异常系数,从有向局部关联图中选择部分即时通讯账号节点,得到异常即时通讯账号节点;选择的即时通讯账号节点的目标异常系数大于有向局部关联图中未被选择的即时通讯账号节点的目标异常系数;异常即时通讯账号节点用于表征异常即时通讯账号。
[0166]
本技术还另外提供一种应用场景,该应用场景应用上述的异常对象检测方法。具体地,该异常对象检测方法可应用于非即时通讯账号异常检测的场景,可以理解,对象为非即时通讯账号,比如邮箱账号。计算机设备可通过本技术的异常对象检测方法对各个邮箱账号进行异常检测,得到异常邮箱账号。
[0167]
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照顺序依次显示,但是这些步骤并不是必然按照顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执
行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0168]
在一个实施例中,如图8所示,提供了一种异常对象检测装置800该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:
[0169]
构建模块801,用于构建包括多个对象节点和边的对象约束关系图;边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;边的权重,用于表征具有约束关系的对象之间的约束相似度;
[0170]
划分模块802,用于基于约束相似度对对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;
[0171]
获取模块803,用于获取各对象集群的集群特征数据,并基于集群特征数据从划分出的对象集群中,识别异常对象集群;
[0172]
确定模块804,用于从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;
[0173]
检测模块805,用于从对象约束关系图中,检测与种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;异常对象节点用于表征异常对象。
[0174]
参考图9,在一个实施例中,边连接的对象节点所对应的对象之间具有多约束关系;多约束关系是指在预设的多个约束条件下皆具有约束关系;约束相似度,包括具有多约束关系的对象之间的多约束相似度;异常对象检测装置800还包括:
[0175]
融合模块806,用于针对具有多约束关系的任意两个对象,对任意两个对象分别对应的行为数据进行相似度计算,以分别确定任意两个对象在每个约束条件下的单约束相似度;确定多个约束条件各自对应的重要度系数;根据多个约束条件各自对应的重要度系数,对任意两个对象分别在各个约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。
[0176]
在一个实施例中,在每个约束条件下具有约束关系的任意两个对象属于关系对;融合模块806还用于针对每个约束条件,确定在约束条件下的关系对的第一数量;基于第一数量,确定在多个约束条件下的关系对的第二数量;基于第一数量与第二数量的比值,确定每个约束条件对应的数量占比;基于多个约束条件分别对应的数量占比,确定多个约束条件各自对应的重要度系数。
[0177]
在一个实施例中,对象集群为表征集群的对象约束关系子图;划分模块802还用于将对象约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值;解除约束相似度小于划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图;将下一轮作为本轮,并将对象节点数量大于预设节点数量的对象约束关系子图作为本轮目标图,返回确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。
[0178]
在一个实施例中,通过迭代划分得到的各对象约束关系子图为候选的对象约束关系子图;划分模块802还用于从各候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图。
[0179]
在一个实施例中,获取模块803还用于获取各对象集群在多个特征维度下分别对应的集群特征数据;针对多个特征维度中的每一个特征维度,根据特征维度对应的集群特征数据,确定对象集群在特征维度下的异常概率值;针对每一个对象集群,将对象集群在多个特征维度分别对应的异常概率值进行融合,得到对象集群对应的融合异常概率值;将融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。
[0180]
在一个实施例中,检测模块805还用于针对每一个种子对象节点,从对象约束关系图中,查找与种子对象节点相连的预设阶数的对象节点;基于种子对象节点和查找的各对象节点,构建与种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图;有向边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;有向边的方向,是从存储时间在前的对象节点指向存储时间在后的对象节点;针对有向局部关联图中各对象节点,基于指向各对象节点的目标邻居对象节点与对象节点的之间的约束相似度、以及目标邻居对象节点的出边数目,确定有向局部关联图中各对象节点的目标异常系数;基于各有向局部关联图中各个对象节点的目标异常系数,从有向局部关联图中选择部分对象节点,得到异常对象节点;选择的对象节点的目标异常系数大于有向局部关联图中未被选择的对象节点的目标异常系数。
[0181]
在一个实施例中,有向边连接的对象节点所对应的对象之间的约束相似度为有向边的初始化有向边权重;检测模块805还用于将第一轮作为本轮,将初始化有向边权重作为本轮有向边权重,并将有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点,确定指向当前对象节点的各目标邻居对象节点;分别确定各目标邻居对象节点的出边数目;基于目标邻居对象节点对应的出边数目、目标邻居对象节点对应的本轮异常系数、以及从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重,确定从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重;基于各目标邻居对象节点分别对应的中间态有向边权重,确定当前对象节点的中间态异常系数;将下一轮作为本轮,将中间态有向边权重作为本轮有向边权重,将中间态异常系数作为本轮异常系数,返回在本轮检测过程中,分别将有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件,得到有向局部关联图中各个对象节点的目标异常系数。
[0182]
在一个实施例中,有向局部关联图中各对象节点包括种子对象节点和非种子对象节点;检测模块805还用于将第一预设异常系数,作为有向局部关联图中种子对象节点对应的初始化异常系数;将第二预设异常系数,作为有向局部关联图中非种子对象节点对应的初始化异常系数;其中,第一预设异常系数和第二预设异常系数,用于表征有向局部关联图中各对象节点对应的对象属于异常对象的概率;第一预设异常系数大于第二预设异常系数。
[0183]
在一个实施例中,检测模块805还用于针对每一个目标邻居对象节点,确定目标邻居对象节点对应的本轮异常系数与目标邻居对象节点对应的出边数目的比值;将比值与从目标邻居对象节点指向当前对象节点的有向边的本轮有向边权重的乘积,作为从目标邻居对象节点指向当前对象节点的有向边的中间态有向边权重;针对每一个当前对象节点,将当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,得到当前对象节点的中间态异常系数。
[0184]
上述异常对象检测装置,通过构建包括多个对象节点和边的对象约束关系图,其中,边连接的对象节点所对应的对象在预设的约束条件下具有约束关系,边的权重用于表征具有约束关系的对象之间的约束相似度。基于约束相似度可对对象约束关系图进行集群划分,得到各个对象集群,其中,每个对象集群中包括至少一个对象节点。通过获取各对象集群的集群特征数据,从而可基于集群特征数据从划分出的对象集群中,识别异常对象集群,并可从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点。进而,从对象约束关系图中,可检测与种子对象节点之间满足强关联条件的对象节点,得到用于表征异常对象的异常对象节点。本技术通过构建对象约束关系图,先对对象约束关系图进行集群划分,以检测出异常对象集群,进而进阶地再从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的种子对象节点,以进一步基于种子对象节点,从对象约束关系图中检测出表征异常对象的异常对象节点,可以准确地检测出异常的对象,从而提升异常对象检测准确率。
[0185]
关于异常对象检测装置的具体限定可以参见上文中对于异常对象检测方法的限定,在此不再赘述。上述异常对象检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0186]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,也可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常对象检测方法。
[0187]
本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0188]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0189]
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0190]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0191]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0192]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0193]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0194]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
技术特征:
1.一种异常对象检测方法,其特征在于,所述方法包括:构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。2.根据权利要求1所述的方法,其特征在于,所述边连接的对象节点所对应的对象之间具有多约束关系;所述多约束关系是指在预设的多个约束条件下皆具有约束关系;所述约束相似度,包括具有所述多约束关系的对象之间的多约束相似度;所述方法还包括:针对具有多约束关系的任意两个对象,对所述任意两个对象分别对应的行为数据进行相似度计算,以分别确定所述任意两个对象在每个所述约束条件下的单约束相似度;确定多个所述约束条件各自对应的重要度系数;根据多个所述约束条件各自对应的重要度系数,对所述任意两个对象分别在各个所述约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。3.根据权利要求2所述的方法,其特征在于,在每个约束条件下具有约束关系的任意两个对象属于关系对;所述确定多个所述约束条件各自对应的重要度系数,包括:针对每个约束条件,确定在所述约束条件下的关系对的第一数量;基于所述第一数量,确定在多个所述约束条件下的关系对的第二数量;基于所述第一数量与所述第二数量的比值,确定每个所述约束条件对应的数量占比;基于多个所述约束条件分别对应的数量占比,确定多个所述约束条件各自对应的重要度系数。4.根据权利要求1所述的方法,其特征在于,所述对象集群为表征集群的对象约束关系子图;所述基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群,包括:将所述对象约束关系图作为待在本轮进行集群划分的本轮目标图,确定本轮的划分相似度阈值;解除约束相似度小于所述划分相似度阈值的对象节点所对应的对象之间的约束关系,得到本轮划分后的对象约束关系子图;将下一轮作为本轮,并将对象节点数量大于预设节点数量的所述对象约束关系子图作为本轮目标图,返回所述确定本轮的划分相似度阈值的步骤以迭代执行,直至满足集群划分停止条件,得到各对象约束关系子图;其中,后一轮的划分相似度阈值大于前一轮的划分相似度阈值。
5.根据权利要求4所述的方法,其特征在于,通过迭代划分得到的各对象约束关系子图为候选的对象约束关系子图;所述方法还包括:从各所述候选的对象约束关系子图中,筛选节点数量在预设节点数量区间内的对象约束关系子图,得到表征集群的对象约束关系子图。6.根据权利要求1所述的方法,其特征在于,所述获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群,包括:获取各所述对象集群在多个特征维度下分别对应的集群特征数据;针对多个所述特征维度中的每一个特征维度,根据所述特征维度对应的集群特征数据,确定所述对象集群在所述特征维度下的异常概率值;针对每一个对象集群,将所述对象集群在多个所述特征维度分别对应的异常概率值进行融合,得到所述对象集群对应的融合异常概率值;将所述融合异常概率值大于预设异常概率值的对象集群识别为异常对象集群。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点,包括:针对每一个种子对象节点,从所述对象约束关系图中,查找与所述种子对象节点相连的预设阶数的对象节点;基于所述种子对象节点和查找的各对象节点,构建与所述种子对象节点对应的、且包括多个对象节点和有向边的有向局部关联图;所述有向边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述有向边的方向,是从存储时间在前的对象节点指向存储时间在后的对象节点;针对所述有向局部关联图中各对象节点,基于指向各所述对象节点的目标邻居对象节点与所述对象节点的之间的约束相似度、以及所述目标邻居对象节点的出边数目,确定所述有向局部关联图中各对象节点的目标异常系数;基于各有向局部关联图中各个对象节点的目标异常系数,从所述有向局部关联图中选择部分对象节点,得到异常对象节点;选择的对象节点的目标异常系数大于所述有向局部关联图中未被选择的对象节点的目标异常系数。8.根据权利要求7所述的方法,其特征在于,所述有向边连接的对象节点所对应的对象之间的约束相似度为所述有向边的初始化有向边权重;所述基于指向各所述对象节点的目标邻居对象节点与所述对象节点的之间的约束相似度、以及所述目标邻居对象节点的出边数目,确定所述有向局部关联图中各对象节点的目标异常系数,包括:将第一轮作为本轮,将所述初始化有向边权重作为本轮有向边权重,并将所述有向局部关联图中各对象节点对应的初始化异常系数作为本轮异常系数,在本轮检测过程中,分别将所述有向局部关联图中的每一个对象节点作为当前对象节点,确定指向所述当前对象节点的各目标邻居对象节点;分别确定各所述目标邻居对象节点的出边数目;基于所述目标邻居对象节点对应的出边数目、所述目标邻居对象节点对应的本轮异常系数、以及从所述目标邻居对象节点指向所述当前对象节点的有向边的本轮有向边权重,确定从所述目标邻居对象节点指向所述当前对象节点的有向边的中间态有向边权重;基于各所述目标邻居对象节点分别对应的中间态有向边权重,确定所述当前对象节点
的中间态异常系数;将下一轮作为本轮,将所述中间态有向边权重作为本轮有向边权重,将所述中间态异常系数作为本轮异常系数,返回所述在本轮检测过程中,分别将所述有向局部关联图中的每一个对象节点作为当前对象节点的步骤以迭代执行,直至满足检测停止条件,得到所述有向局部关联图中各个对象节点的目标异常系数。9.根据权利要求8所述的方法,其特征在于,所述有向局部关联图中各对象节点包括种子对象节点和非种子对象节点;所述方法还包括:将第一预设异常系数,作为所述有向局部关联图中种子对象节点对应的初始化异常系数;将第二预设异常系数,作为所述有向局部关联图中非种子对象节点对应的初始化异常系数;其中,所述第一预设异常系数和所述第二预设异常系数,用于表征所述有向局部关联图中各对象节点对应的对象属于异常对象的概率;所述第一预设异常系数大于所述第二预设异常系数。10.根据权利要求8所述的方法,其特征在于,所述基于所述目标邻居对象节点对应的出边数目、所述目标邻居对象节点对应的本轮异常系数、以及从所述目标邻居对象节点指向所述当前对象节点的有向边的本轮有向边权重,确定从所述目标邻居对象节点指向所述当前对象节点的有向边的中间态有向边权重,包括:针对每一个目标邻居对象节点,确定所述目标邻居对象节点对应的本轮异常系数与所述目标邻居对象节点对应的出边数目的比值;将所述比值与从所述目标邻居对象节点指向所述当前对象节点的有向边的本轮有向边权重的乘积,作为从所述目标邻居对象节点指向所述当前对象节点的有向边的中间态有向边权重;所述基于各所述目标邻居对象节点分别对应的中间态有向边权重,确定所述当前对象节点的中间态异常系数,包括:针对每一个当前对象节点,将所述当前对象节点的各目标邻居对象节点分别对应的中间态有向边权重相加,得到所述当前对象节点的中间态异常系数。11.一种异常对象检测装置,其特征在于,所述装置包括:构建模块,用于构建包括多个对象节点和边的对象约束关系图;所述边连接的对象节点所对应的对象在预设的约束条件下具有约束关系;所述边的权重,用于表征具有约束关系的对象之间的约束相似度;划分模块,用于基于所述约束相似度对所述对象约束关系图进行集群划分,得到各个对象集群;每个对象集群中包括至少一个对象节点;获取模块,用于获取各所述对象集群的集群特征数据,并基于所述集群特征数据从划分出的对象集群中,识别异常对象集群;确定模块,用于从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点,得到种子对象节点;检测模块,用于从所述对象约束关系图中,检测与所述种子对象节点之间满足强关联条件的对象节点,得到异常对象节点;所述异常对象节点用于表征异常对象。
12.根据权利要求11所述的装置,其特征在于,所述边连接的对象节点所对应的对象之间具有多约束关系;所述多约束关系是指在预设的多个约束条件下皆具有约束关系;所述约束相似度,包括具有所述多约束关系的对象之间的多约束相似度;所述装置还包括:融合模块,用于针对具有多约束关系的任意两个对象,对所述任意两个对象分别对应的行为数据进行相似度计算,以分别确定所述任意两个对象在每个所述约束条件下的单约束相似度;确定多个所述约束条件各自对应的重要度系数;根据多个所述约束条件各自对应的重要度系数,对所述任意两个对象分别在各个所述约束条件下的单约束相似度进行加权融合,得到具有多约束关系的对象之间的多约束相似度。13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
技术总结
本申请涉及一种异常对象检测方法、装置、设备、介质和计算机程序产品,属于信息安全技术领域。方法包括:构建包括对象节点和边的对象约束关系图;边连接的对象节点对应的对象在约束条件下具有约束关系;边的权重用于表征具有约束关系的对象之间的约束相似度;基于约束相似度对对象约束关系图进行集群划分得到各个对象集群;基于对象集群的集群特征数据从划分出的对象集群中识别异常对象集群;从未识别为异常对象集群的剩余对象集群中,确定表征异常对象的对象节点得到种子对象节点;从对象约束关系图中检测与种子对象节点之间满足强关联条件的对象节点,得到表征异常对象的异常对象节点。采用本方法可提升异常对象检测准确率。率。率。
技术研发人员:刘浩 蔡岳 卢煌 马骉 祁麟
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.01.04
技术公布日:2023/7/22
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
