非正常号码识别方法、装置、服务器和存储介质与流程
未命名
07-14
阅读:94
评论:0
1.本技术涉及数据处理技术领域,尤其涉及一种非正常号码识别方法、装置、服务器和存储介质。
背景技术:
2.为了有效遏制电信犯罪行为,运营商工作人员常需要在多个电话号码中识别出非正常号码(如诈骗电话号码)。然后由司法工作人员基于该非正常号码,寻找到对应的犯罪行为源头,并对其进行相应的处理。
3.目前,识别非正常号码的方法主要为:识别装置从大数据平台获得预设时间段多个用户识别码的终端信令数据,其中用户识别码具体如电话号码。接着,识别装置对各电话号码的信令数据进行特征聚类处理,获得电话号码对应的非正常通信特征。基于非正常通信特征,识别装置采用训练好的识别模型,对各电话号码进行非正常识别,从多个电话号码中确定出非正常号码。其中,识别模型为基于多维度的非正常通信特征,如非正常通信类别、号码行为特征、号码特征、号码活跃特征、号码社交网络、行为事件流、地域等,搭建训练的大数据分析模型。
4.采用现有技术对非正常号码进行识别时,存在非正常号码识别不精准的问题。
技术实现要素:
5.本技术提供一种非正常号码识别方法、装置、服务器和存储介质,以解决采用现有技术对非正常号码进行识别时,存在非正常号码识别不精准的问题问题。
6.第一方面,本技术提供一种非正常号码识别方法,包括:
7.获取用户识别码对应的终端信令数据;
8.基于所述终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码;
9.对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据;
10.基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码。
11.可选的,所述回访通话数据包括被叫用户的语音数据,所述可疑关键词包括各非正常通信类别对应的各可疑关键词;
12.所述基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,包括:
13.基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定所述被叫用户的语音数据中含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码;
14.相应地,基于所识别出的可疑关键词所属的非正常通信类别,对应确定所述非正常号码所属的非正常通信的类别。
15.可选的,所述基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,包括:
16.基于预设的可疑关键词,采用预先训练好的语音识别模型,对所述回访通话数据进行可疑关键词识别,确定所述被叫用户的语音数据中含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及确定所述非正常号码所属的非正常通信的类别。
17.可选的,所述对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据,包括:
18.基于所述可疑号码对应的终端信令数据中的话单数据,确定所述可疑号码相关联的各被叫用户识别码,所述话单数据为通话或收发短信触发的信令数据;
19.对所述各被叫用户识别码对应的各被叫用户进行语音回访,获得各回访通话数据。
20.可选的,所述方法还包括:
21.对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行短信回访,获得各短信回访结果,所述短信回访结果包括曾收到非正常通信的被叫用户识别码;
22.基于所述短信回访结果,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码。
23.可选的,所述方法还包括:
24.采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对所述号码识别模型进行训练更新。
25.第二方面,本技术提供一种非正常号码识别装置,所述装置包括:
26.处理单元、模型单元、回访单元,其中,所述处理单元分别与所述模型单元、回访单元连接,所述模型单元与所述回访单元连接;
27.所述处理单元,用于从大数据平台获取用户识别码对应的终端信令数据,并将所述终端信令数据发送到所述模型单元;
28.所述模型单元,用于基于所述终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码,并将所述可疑号码发送到所述处理单元;
29.所述处理单元,还用于基于所述可疑号码对应的终端信令数据中的话单数据,确定所述可疑号码所关联的各被叫用户识别码,并将所述被叫用户识别码发送到所述回访单元;其中,所述话单数据为通话或收发短信触发的信令数据;
30.所述回访单元,用于对各被叫用户识别码对应的被叫用户进行语音回访和/或短信回访,对应获得各回访通话数据和/或各短信回访结果,并将所述回访通话数据和/或短信回访结果发送到所述模型单元;其中,所述回访通话数据包括被叫用户的语音数据,所述短信回访结果包括曾收到非正常通信的被叫用户识别码;
31.所述模型单元,还用于基于预设的可疑关键词,采用预先训练好的语音识别模型,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及基于所识别出的可疑关键词所属的非正常通信类别,对应确定所述非正常号码所属的非正常通信的类别;和/或,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码;并对所述非正常号码进行非正常通信类别标识的标记,将带有类别标识的非正常号码发送到所述处理单元。
32.可选的,所述装置还包括:存储单元,所述存储单元与所述处理单元连接;
33.所述处理单元,还用于将带有类别标识的非正常号码和对应的终端信令数据发送到存储单元进行存储;并周期性地将存储单元中存储的多个带有类别标识的非正常号码和对应的终端信令数据发送到所述模型单元;
34.所述模型单元,还用于采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对所述号码识别模型进行训练更新。
35.第三方面,本技术提供一种服务器,包括:
36.处理器和存储器;
37.所述存储器存储所述处理器可执行的可执行指令;
38.其中,所述处理器执行所述存储器存储的可执行指令,使得所述处理器执行如上所述的方法。
39.第四方面,本技术提供一种存储介质,所述存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上所述的方法。
40.本技术提供的非正常号码识别方法、装置、服务器和存储介质,通过号码识别模型对用户识别码进行可疑识别,当通过模型识别确定用户识别码为可疑号码后,对该可疑号码所关联的各被叫用户进行语音回访,通过语音回访对可疑号码进行进一步的实际应用确认,以确定出可疑号码是否为实际的非正常号码。因此,本技术提供的非正常号码识别方法解决了现有技术仅通过模型识别的方法对非正常号码进行识别,存在非正常号码识别不精准的问题,实现了对非正常号码的精准识别。
附图说明
41.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
42.图1为现有技术的号码识别架构图;
43.图2为本技术实施例提供的非正常号码识别架构图;
44.图3为本技术实施例提供的非正常号码识别方法流程图;
45.图4为本技术实施例提供的非正常号码识别装置结构图;
46.图5为本技术实施例提供的服务器结构图。
47.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
48.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
49.图1为现有技术的号码识别架构图。在现有技术中,对非正常号码的识别,尤其是类似诈骗电话号码之类的非正常号码的识别,采用的架构如图1所示。现有的号码识别架构
包括:运营商的大数据平台11和识别装置12,以及司法部门的违规处置平台13。其中,识别装置12分别与大数据平台11和违规处置平台13连接,识别装置12包括模型模块121。具体地,识别装置12从大数据平台11获得预设时间段多个用户识别码(如电话号码)的终端信令数据。接着,识别装置12通过模型模块121中预先训练好的识别模型,对各电话号码进行非正常识别,从多个电话号码中确定出非正常号码。然后,识别装置12将识别模型识别出的非正常号码发送到司法部门的违规处置平台13,以便于司法工作人员进行相应的处理。
50.现有技术中,对非正常号码的识别主要依赖于识别装置12中预先训练好的识别模型的模型计算结果,无法验证该识别模型识别出的非正常号码,在实际应用中确定其是非正常号码。因此,现有技术仅通过模型识别的方法对非正常号码进行识别,存在非正常号码识别不精准的问题,进而不但造成司法工作人员的工作负荷,还可能会为用户带来不好的体验感。
51.对此,本技术提出一种非正常号码识别方法,通过模型识别和语音回访相结合的方式,对模型识别出的可能是非正常号码的可疑号码进行语音回访确认,实现对非正常号码的精准识别。本技术解决了现有技术仅通过模型识别的方法对非正常号码进行识别,存在非正常号码识别不精准的问题。下面结合部分实施例对本技术提出的非正常号码识别方法进行说明。
52.图2为本技术实施例提供的非正常号码识别架构图。如图2所示,本技术提出的非正常号码识别架构包括:运营商的大数据平台11和号码识别设备14,以及司法部门的违规处置平台13。其中,号码识别设备14分别与大数据平台11和违规处置平台13连接,号码识别设备14包括模型单元141和回访单元142。
53.示例性地,号码识别设备14从大数据平台11获得用户识别码对应的终端信令数据。接着,基于终端信令数据,号码识别设备14采用模型单元141中预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码。其中,号码识别模型为基于多维度的非正常通信特征,如非正常通信类别、号码行为特征、号码特征、号码活跃特征、号码社交网络、行为事件流、地域等,搭建训练的大数据分析模型。然后,号码识别设备14通过回访单元142对模型识别出的可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据。基于预设的可疑关键词,号码识别设备14对回访通话数据进行可疑关键词识别,确定含有可疑关键词的回访通话数据对应的可疑号码为非正常号码。最后,号码识别设备14将非正常号码发送到司法部门的违规处置平台13,以便于司法工作人员进行相应的处理。
54.本技术提供的非正常号码识别方法,通过号码识别模型对用户识别码进行可疑识别,当通过模型识别确定用户识别码为可疑号码后,对该可疑号码所关联的各被叫用户进行语音回访,通过语音回访对可疑号码进行进一步的实际应用确认,确定出可疑号码是否为实际的非正常号码。因此,本技术提供的非正常号码识别方法解决了现有技术仅通过模型识别的方法对非正常号码进行识别,存在非正常号码识别不精准的问题,实现了对非正常号码的精准识别,例如实现对诈骗电话号码的精准识别。
55.下面结合图3所示实施例对本技术提供的非正常号码识别方法进行进一步说明。图3为本技术实施例提供的非正常号码识别方法流程图。图3所示实施例的执行主体为图2所示实施例中的号码识别设备14。如图3所示,该方法包括:
56.s301、获取用户识别码对应的终端信令数据。
57.具体而言,号码识别设备14从大数据平台11获取用户识别码对应的终端信令数据。
58.示例性地,号码识别设备14可以从大数据平台11获取一段时间内一用户识别码对应的终端信令数据。
59.可选地,号码识别设备14也可以从大数据平台11获取一段时间内一地区各用户识别码对应的终端信令数据。
60.s302、基于终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码。
61.具体而言,号码识别设备14基于步骤s301获得的终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码。
62.示例性地,号码识别设备14采用预先训练好的号码识别模型通过如下步骤s3021-s3024对用户识别码进行可疑识别:
63.s3021、数据预处理。
64.示例性的,号码识别设备14对从大数据平台11获取的用户识别码对应的终端信令数据进行预处理。具体地,号码识别设备14从终端信令数据中筛选出各用户识别码对应含有开关机、拨打电话、发短信、上网及更换终端等交互类别的终端信令数据,并按照时间先后进行排序,以形成各用户识别码对应的信令清单表。
65.用户识别码对应的信令清单表如表1所示:
66.表1
[0067][0068]
其中,用户识别码具体可以是各用户的移动用户识别码(international mobile subscriber identification number,简称:imsi)。该信令清单表可以包括,各用户的imsi、基站位置区域码(location area code,简称:lac)、基站编号(cell identity,简称:cid)、交互类别、信令触发的时刻、用户使用的移动设备国际身份码(international mobile equipment identity,简称:imei)、以及用户编号(如移动台国际isdn号码)等数据。
[0069]
s3022、特征聚类。
[0070]
示例性地,号码识别设备14基于各用户识别码对应的信令清单表中的数据,进行聚类分析,获得各用户识别码对应的号码特征和行为特征对应的特征指标值。
[0071]
其中,号码特征包括特征数据(如黑名单号码、公检法号码、客服号码等)、非正常通信类别(如仿冒公检法、仿冒领导熟人、仿冒电商客服、仿冒银行、仿冒运营商、仿冒社保、仿冒助学金等诈骗类型),行为特征包括号码行为特征、号码活跃特征、号码社交网络、行为事件流、地域等维度的行为特征。在本步骤中,用户识别码的非正常通信类别是基于用户识别码的行为特征,并根据预设的行为特征与非正常通信类别的对应关系而确定的。
[0072]
s3023、特征值整合。
[0073]
示例性地,号码识别设备14采用embedding神经网络算法对s3022获得的各用户识别码对应的各号码特征和行为特征对应的特征指标值进行降维整合,获得各用户识别码对应的降维后的多个目标特征值。其中,embedding神经网络算法是一种基于机器学习的分布式嵌入算法,能够对特征指标值进行变换,并挖掘其中的潜在关联。embedding算法处理后的数据由于信息漏损较少,进而具有更好的建模效果。
[0074]
s3024、模型识别与结果判定。
[0075]
示例性地,号码识别设备14将步骤s3023获得的各用户识别码对应的多个目标特征值,采用轻量梯度提升机(light gradient boosting machine,简称:lightgbm)算法进行模型计算,对应获得各用户识别码对应的各计算值。将用户识别码对应的计算值与预设阈值进行对比,并按如下方式确定模型识别结果:
[0076]
若计算值大于或等于预设阈值,则计算值对应的用户识别码为可疑号码;
[0077]
相应地,若计算值小于预设阈值,则计算值对应的用户识别码为正常号码。
[0078]
进一步地,号码识别设备14对可疑号码进行可疑标识的标记,对正常号码进行正常标识的标记。
[0079]
s303、对可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据。
[0080]
具体而言,号码识别设备14对步骤s302确定的可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据。
[0081]
示例性地,号码识别设备14基于可疑号码对应的终端信令数据中的话单数据,确定可疑号码相关联的各被叫用户识别码,其中,话单数据为通话或收发短信触发的信令数据。然后,号码识别设备14对各被叫用户识别码对应的各被叫用户进行语音回访,获得各回访通话数据。
[0082]
可选地,号码识别设备14采用智能机器人方式对各被叫用户识别码对应的各被叫用户进行语音回访,获得各回访通话数据。
[0083]
s304、基于预设的可疑关键词,对回访通话数据进行可疑关键词识别,确定含有可疑关键词的回访通话数据对应的可疑号码为非正常号码。
[0084]
具体而言,号码识别设备14基于预设的可疑关键词,对步骤s303获得的回访通话数据进行可疑关键词识别,确定含有可疑关键词的回访通话数据对应的可疑号码为非正常号码。其中,回访通话数据包括被叫用户的语音数据,还包括主叫用户的语音数据;可疑关键词包括各非正常通信类别对应的各可疑关键词。
[0085]
示例性地,号码识别设备14基于预设的可疑关键词,对回访通话数据进行可疑关键词识别,确定被叫用户的语音数据中含有可疑关键词的回访通话数据对应的可疑号码为非正常号码;
[0086]
相应地,号码识别设备14根据可疑关键词与非正常通信类别对应关系,可以确定所识别的可疑关键词所属的非正常通信类别。号码识别设备14基于所识别出的可疑关键词所属的非正常通信类别,对应确定非正常号码所属的非正常通信的类别。通过对非正常号码所属的非正常通信的类别的确定,可便于后续司法工作人员根据非正常通信的类别进行针对性高效处理。
[0087]
示例性地,号码识别设备14识别出的可疑关键词,以及可疑关键词与非正常通信类别对应关系,如表2所示:
[0088]
表2
[0089][0090]
可选地,号码识别设备14基于预设的可疑关键词,采用预先训练好的语音识别模型,对回访通话数据进行可疑关键词识别,确定被叫用户的语音数据中含有可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及确定非正常号码所属的非正常通信的类别。
[0091]
可选地,号码识别设备14识别出可疑号码所关联的被叫用户识别码对应的被叫用户中的一个被叫用户的语音数据中含有可疑关键词时,确定该回访通话数据的被叫用户对应的可疑号码为非正常号码。号码识别设备14还可以在识别出至少两个被叫用户的语音数据中含有可疑关键词时,才确定该至少两个回访通话数据的被叫用户对应的同一个可疑号码为非正常号码。
[0092]
相应地,号码识别设备14基于被叫用户的语音数据中所识别出的可疑关键词所属的非正常通信类别,确定出非正常号码所属的非正常通行类别。
[0093]
示例性地,当号码识别设备14识别出被叫用户的语音数据中含有“公/检法”,则确定该语音数据对应的非正常号码所属的非正常通行类别为“仿冒公检法”类;
[0094]
当号码识别设备14识别出被叫用户的语音数据中含有“银行”,则确定该语音数据对应的非正常号码所属的非正常通行类别为“仿冒银行”类;
[0095]
…
[0096]
当号码识别设备14识别出被叫用户的语音数据中只含有“是/收到/接听/曾/诈骗/仿冒
…”
等无法确定非正常通信类别的可疑关键词时,则号码识别设备14结合主叫用户的语音数据中所识别的可疑关键词和被叫用户的语音数据中所识别的可疑关键词,对该回访通话数据对应的非正常号码所属的非正常通行类别进行确定。例如,号码识别设备14识
别出的某一回访通话数据中的关键词如表3所示:
[0097]
表3 某一回访通话数据中的关键词
[0098][0099]
表3中“——”表示语音停顿。由表3可知,被叫用户的语音数据中的第2个可疑关键词“是”,是在主叫用户的语音数据的第3个可疑关键词“领导/熟人”后面出现的,说明被叫用户是对可疑关键词“领导/熟人”对应的非正常通信类别进行了确认,因此,号码识别设备14结合主叫用户的语音数据中所识别的第3个可疑关键词和被叫用户的语音数据中所识别的第2个可疑关键词,并结合表2所示的可疑关键词与非正常通信类别的对应关系,可以确定表3所示的回访通话数据对应的非正常号码所属的非正常通信类别为“仿冒领导熟人”类。
[0100]
可选地,号码识别设备14还可以在步骤s302确定可疑号码后,对可疑号码所关联的各被叫用户识别码对应的被叫用户进行短信回访,获得各短信回访结果;其中,短信回访结果包括曾收到非正常通信的被叫用户识别码。然后,号码识别设备14基于短信回访结果,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码。
[0101]
进一步地,号码识别设备14可以基于短信回访结果,确定曾收到非正常通信的任一个被叫用户识别码对应的可疑号码为非正常号码。号码识别设备14也可以基于短信回访结果,确定曾收到非正常通信的至少两个被叫用户识别码对应的同一个可疑号码为非正常号码。
[0102]
号码识别设备14可以只采用语音回访与短信回访中的任一种方式进行非正常号码的回访确认;在无法收到被叫用户的回访结果时,采用另一种方式进行补充回访确认。号码识别设备14也可以同时采用语音回访与短信回访两种方式进行非正常号码的回访确认,确保每一个可疑号码均能被回访确认,实现对非正常号码的精准识别。
[0103]
进一步地,在获得非正常号码及其所属的非正常通信类别的类别数据后,号码识别设备14可以采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周
期性地对号码识别设备14中的号码识别模型进行训练更新。在现有技术中,非正常号码所属的非正常通信类别,只有在司法工作人员完成相关的处理工作后,才可能确定;或从被举报的非正常号码的举报信息中确定非正常号码所属的非正常通信类别。因此,现有技术中用于识别模型训练的数据训练样本多数是无法确定非正常号码所属的非正常通信类别的,所以,现有技术中的识别模型无法精准的识别出非正常号码所属的非正常通信类别。而号码识别设备14采用本技术提出的非正常号码识别方法,不但精准识别获得了非正常号码,还精准识别获得了非正常号码所属的非正常通信类别的类别数据。号码识别设备14可以采用本技术方法获得的多个非正常号码对应的终端信令数据和非正常通信类别的类别数据组成更新的训练样本,对本技术的号码识别设备14中的号码识别模型进行学习训练、以及周期性地更新。号码识别设备14采用该更新的训练样本进行号码识别模型的训练和更新,不但可以随着市场发展、通信行为特征变更而适应性地提高号码识别模型的精准性,还可以通过号码识别模型识别出可疑号码所属的非正常通信类别,可作为可疑号码的非正常通信类别的确认方法的补充。
[0104]
本技术提供的非正常号码识别方法,通过号码识别模型确定可疑号码,然后对可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访和/或短信回访,进一步确定可疑号码为非正常号码,并且通过语音回访或语音回访结合短信回访的方式确定出非正常号码所属的非正常通信类别,不但实现了对非正常号码的精准识别,还方便了司法工作人员根据非正常通信类别进行针对性的高效处理。此外,本技术还采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对号码识别模型进行训练更新,进一步提高了号码识别模型对可疑号码的识别精准性以及与市场和通信行为特征变化的适应性。
[0105]
本技术实施例还提供一种非正常号码识别装置。图4为本技术实施例提供的非正常号码识别装置结构图。如图4所示,该装置包括:
[0106]
处理单元143、模型单元141、回访单元142,其中,处理单元143分别与模型单元141、回访单元142连接,模型单元141与回访单元142连接;
[0107]
处理单元143,用于从大数据平台11获取用户识别码对应的终端信令数据,并将终端信令数据发送到模型单元141;
[0108]
模型单元141,用于基于终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码,并将可疑号码发送到处理单元143;
[0109]
处理单元143,还用于基于可疑号码对应的终端信令数据中的话单数据,确定可疑号码所关联的各被叫用户识别码,并将被叫用户识别码发送到回访单元142;其中,话单数据为通话或收发短信触发的信令数据;
[0110]
回访单元142,用于对各被叫用户识别码对应的被叫用户进行语音回访和/或短信回访,对应获得各回访通话数据和/或各短信回访结果,并将回访通话数据和/或短信回访结果发送到模型单元141;其中,回访通话数据包括被叫用户的语音数据,短信回访结果包括曾收到非正常通信的被叫用户识别码;
[0111]
模型单元141,还用于基于预设的可疑关键词,采用预先训练好的语音识别模型,对回访通话数据进行可疑关键词识别,确定含有可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及基于所识别出的可疑关键词所属的非正常通信类别,对应确定非正
常号码所属的非正常通信的类别;和/或,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码;并对非正常号码进行非正常通信类别标识的标记,将带有类别标识的非正常号码发送到处理单元143。
[0112]
进一步地,该装置还包括:存储单元144,存储单元144与处理单元143连接;
[0113]
处理单元143,还用于将带有类别标识的非正常号码和对应的终端信令数据发送到存储单元144进行存储;并周期性地将存储单元144中存储的多个带有类别标识的非正常号码和对应的终端信令数据发送到模型单元141;
[0114]
模型单元141,还用于采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对号码识别模型进行训练更新。
[0115]
进一步地,存储单元144,还用于对模型单元识别出的非正常号码以及收到的该非正常号码对应的被叫用户的语音数据进行存储,以便于后续处理时的随时调用。
[0116]
本技术提供的非正常号码识别装置的实现的技术原理和技术效果与图3所示实施例的具体实现的技术原理和技术效果类似,本实施例此处不再赘述。
[0117]
本技术实施例还提供一种服务器。图5为本技术实施例提供的服务器结构图。如图5所示,该服务器包括处理器51和存储器52,存储器52存储有处理器51可执行指令,使得该处理器51可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。应理解,上述处理器51可以是中央处理单元(英文:central processing unit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digital signal processor,简称:dsp)、专用集成电路(英文:application specific integrated circuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。存储器52可能包含高速随机存取存储器(英文:random access memory,简称:ram),也可能还包括非易失性存储器(英文:non-volatile memory,简称:nvm),例如至少一个磁盘存储器,还可以为u盘、移动硬盘、只读存储器、磁盘或光盘等。
[0118]
本技术实施例还提供一种存储介质,该存储介质中存储有计算机执行指令,这些计算机执行指令被处理器执行时,实现上述的非正常号码识别方法。存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(英文:static random-access memory,简称:sram),电可擦除可编程只读存储器(英文:electrically-erasable programmable read-only memory,简称:eeprom),可擦除可编程只读存储器(英文:erasable programmable read-only memory,简称:eprom),可编程只读存储器(英文:programmable read-only memory,简称:prom),只读存储器(英文:read-only memory,简称:rom),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0119]
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(英文:application specific integrated circuits,简称:asic)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
[0120]
本技术实施例还提供一种程序产品,如计算机程序,该计算机程序被处理器执行
时实现本技术所涵盖的非正常号码识别方法。
[0121]
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0122]
最后应说明的是:以上实施方式仅用以说明本发明的技术方案,而非对其进行限制;尽管参照前述实施方式对本发明已经进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述实施方式所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施方式技术方案的范围。
技术特征:
1.一种非正常号码识别方法,其特征在于,包括:获取用户识别码对应的终端信令数据;基于所述终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码;对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据;基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码。2.根据权利要求1所述的方法,其特征在于,所述回访通话数据包括被叫用户的语音数据,所述可疑关键词包括各非正常通信类别对应的各可疑关键词;所述基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,包括:基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定所述被叫用户的语音数据中含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码;相应地,基于所识别出的可疑关键词所属的非正常通信类别,对应确定所述非正常号码所属的非正常通信的类别。3.根据权利要求2所述的方法,其特征在于,所述基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,包括:基于预设的可疑关键词,采用预先训练好的语音识别模型,对所述回访通话数据进行可疑关键词识别,确定所述被叫用户的语音数据中含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及确定所述非正常号码所属的非正常通信的类别。4.根据权利要求1所述的方法,其特征在于,所述对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据,包括:基于所述可疑号码对应的终端信令数据中的话单数据,确定所述可疑号码相关联的各被叫用户识别码,所述话单数据为通话或收发短信触发的信令数据;对所述各被叫用户识别码对应的各被叫用户进行语音回访,获得各回访通话数据。5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行短信回访,获得各短信回访结果,所述短信回访结果包括曾收到非正常通信的被叫用户识别码;基于所述短信回访结果,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码。6.根据权利要求2-4任一项所述的方法,其特征在于,所述方法还包括:采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对所述号码识别模型进行训练更新。7.一种非正常号码识别装置,其特征在于,所述装置包括:处理单元、模型单元、回访单元,其中,所述处理单元分别与所述模型单元、回访单元连接,所述模型单元与所述回访单元连接;所述处理单元,用于从大数据平台获取用户识别码对应的终端信令数据,并将所述终
端信令数据发送到所述模型单元;所述模型单元,用于基于所述终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码,并将所述可疑号码发送到所述处理单元;所述处理单元,还用于基于所述可疑号码对应的终端信令数据中的话单数据,确定所述可疑号码所关联的各被叫用户识别码,并将所述被叫用户识别码发送到所述回访单元;其中,所述话单数据为通话或收发短信触发的信令数据;所述回访单元,用于对各被叫用户识别码对应的被叫用户进行语音回访和/或短信回访,对应获得各回访通话数据和/或各短信回访结果,并将所述回访通话数据和/或短信回访结果发送到所述模型单元;其中,所述回访通话数据包括被叫用户的语音数据,所述短信回访结果包括曾收到非正常通信的被叫用户识别码;所述模型单元,还用于基于预设的可疑关键词,采用预先训练好的语音识别模型,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码,以及基于所识别出的可疑关键词所属的非正常通信类别,对应确定所述非正常号码所属的非正常通信的类别;和/或,确定曾收到非正常通信的被叫用户识别码对应的可疑号码为非正常号码;并对所述非正常号码进行非正常通信类别标识的标记,将带有类别标识的非正常号码发送到所述处理单元。8.根据权利要求7所述的装置,其特征在于,所述装置还包括:存储单元,所述存储单元与所述处理单元连接;所述处理单元,还用于将带有类别标识的非正常号码和对应的终端信令数据发送到存储单元进行存储;并周期性地将存储单元中存储的多个带有类别标识的非正常号码和对应的终端信令数据发送到所述模型单元;所述模型单元,还用于采用多个非正常号码对应的终端信令数据和非正常通信类别的类别数据,周期性地对所述号码识别模型进行训练更新。9.一种服务器,其特征在于,包括:处理器和存储器;所述存储器存储所述处理器可执行的可执行指令;其中,所述处理器执行所述存储器存储的可执行指令,使得所述处理器执行如权利要求1-6任一项所述的方法。10.一种存储介质,其特征在于,所述存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6任一项所述的方法。
技术总结
本申请提供一种非正常号码识别方法、装置、服务器和存储介质,可以用于数据处理技术领域,其中,方法包括:获取用户识别码对应的终端信令数据;基于所述终端信令数据,采用预先训练好的号码识别模型对用户识别码进行可疑识别,确定可疑号码;对所述可疑号码所关联的各被叫用户识别码对应的被叫用户进行语音回访,获得各回访通话数据;基于预设的可疑关键词,对所述回访通话数据进行可疑关键词识别,确定含有所述可疑关键词的回访通话数据对应的可疑号码为非正常号码。本申请的方法,解决了现有技术仅通过模型识别的方法对非正常号码进行识别,存在非正常号码识别不精准的问题,实现了对非正常号码的精准识别,如实现对诈骗电话号码的精准识别。诈骗电话号码的精准识别。诈骗电话号码的精准识别。
技术研发人员:张鹤立 陈锦智 杨炼钢 王健 罗健 沈松伟 王泽源
受保护的技术使用者:中国联合网络通信集团有限公司
技术研发日:2021.12.28
技术公布日:2023/7/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
