对象识别方法、装置和存储介质与流程

未命名 10-18 阅读:106 评论:0


1.本技术属于通信技术领域,尤其涉及一种对象识别方法、装置和存储介质。


背景技术:

2.随着大数据技术的不断发展,通信运营商已将数据挖掘等技术应用在通信业务中进行数据分析,以识别潜在客户。
3.目前,通常可以采用基于规则的方法进行数据分析,以识别潜在客户。这种方法实现时,一般是通过判断客户数据是否符合年龄段、收入情况和居住位置等维度的预制规则,识别客户是否为潜在客户。由于规则依赖于人工进行大量调查而制定,且所参考的维度局限性较强。因此,这种方法往往效率较低,且难以准确地识别潜在客户。


技术实现要素:

4.本技术提供一种对象识别方法、装置和存储介质,用于改善通用技术中存在的效率较低且准确性较低的技术问题。
5.为达到上述目的,本技术采用如下技术方案:
6.第一方面,提供一种对象识别方法,包括:获取第一对象的业务数据;业务数据包括业务使用数据和业务信令数据;将业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果;分类结果包括服务类型或普通类型;在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
7.可选地,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象的方法,具体包括:
8.将多个第二对象中符合第一预设条件的第二对象,确定为潜在对象;第一预设条件包括第一预设时长内与第一对象的通话次数大于预设次数阈值、第一预设时长内与第一对象的平均通话时长小于第一时长阈值、与第一对象归属于不同的通信网络。
9.可选地,该对象识别方法,还包括:获取多个第一样本数据和多个第二样本数据;第一样本数据用于表示服务类型的对象的业务数据;第二样本数据用于表示普通类型的对象的业务数据;基于多个第一样本数据和多个第二样本数据,对初始分类模型进行训练,得到目标分类模型。
10.可选地,第一样本数据符合第二预设条件;第二预设条件包括:第二预设时长内对应的被叫对象的数量大于预设对象数量阈值、第二预设时长内平均外呼时长小于或等于第二时长阈值、第二预设时长内向外呼叫时所基于的接入网设备的数量小于或等于预设设备数量阈值,和/或通话对象数量、被叫对象的数量、平均外呼时长和接入网设备的数量的加权分值大于预设分值阈值;获取多个第一样本数据的方法,具体包括:
11.获取多个第一候选数据;第一候选数据包括服务类型的类型标签;
12.将符合第二预设条件的第一候选数据确定为第一样本数据,得到多个第一样本数
据。
13.可选地,服务类型包括物流服务类型或客服服务类型或培训服务类型。
14.第二方面,提供一种对象识别装置,包括:获取单元、处理单元和确定单元;
15.获取单元,用于获取第一对象的业务数据;业务数据包括业务使用数据和业务信令数据;
16.处理单元,用于将获取单元获取到的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果;分类结果包括服务类型或普通类型;
17.确定单元,用于在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
18.可选地,确定单元,具体用于:
19.将多个第二对象中符合第一预设条件的第二对象,确定为潜在对象;第一预设条件包括第一预设时长内与第一对象的通话次数大于预设次数阈值、第一预设时长内与第一对象的平均通话时长小于第一时长阈值、与第一对象归属于不同的通信网络。
20.可选地,获取单元,还用于获取多个第一样本数据和多个第二样本数据;第一样本数据用于表示服务类型的对象的业务数据;第二样本数据用于表示普通类型的对象的业务数据;
21.处理单元,还用于基于多个第一样本数据和多个第二样本数据,对初始分类模型进行训练,得到目标分类模型。
22.可选地,第一样本数据符合第二预设条件;第二预设条件包括:第二预设时长内对应的被叫对象的数量大于预设对象数量阈值、第二预设时长内平均外呼时长小于或等于第二时长阈值、第二预设时长内向外呼叫时所基于的接入网设备的数量小于或等于预设设备数量阈值,和/或通话对象数量、被叫对象的数量、平均外呼时长和接入网设备的数量的加权分值大于预设分值阈值;获取单元,具体用于:
23.获取多个第一候选数据;第一候选数据包括服务类型的类型标签;
24.将符合第二预设条件的第一候选数据确定为第一样本数据,得到多个第一样本数据。
25.可选地,服务类型包括物流服务类型或客服服务类型或培训服务类型。
26.第三方面,提供一种对象识别装置,包括存储器和处理器;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当对象识别装置运行时,处理器执行存储器存储的计算机执行指令,以使对象识别装置执行如第一方面的对象识别方法。
27.该对象识别装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,接收、确定、分流上述对象识别方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。
28.第四方面,提供一种计算机可读存储介质,包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如第一方面的对象识别方法。
29.需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与对象识别装置的处理器封装在一起的,也可以与对象识别装置的处理器单独封装,本技术对此不作限定。
30.在本技术中,上述对象识别装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本技术类似,属于本技术权利要求及其等同技术的范围之内。
31.本技术的这些方面或其他方面在以下的描述中会更加简明易懂。
32.本技术提供的技术方案至少带来以下有益效果:
33.基于上述任一方面,本技术中,可以获取第一对象的业务数据,并将第一对象的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果,以进一步在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
34.由于业务数据包括业务使用数据和业务信令数据,因此,目标分类模型可以依据第一对象在多个维度的信息,准确地确定第一对象的分类结果。并且,基于目标分类模型进行类型判定可以具备较高的处理效率。
35.进一步地,若第一对象为服务类型,则可以表明第一对象更可能会与存在业务需求的用户进行通话,从与第一对象存在通话记录的多个第二对象中更可能识别到潜在对象。基于此,本技术可以支持高效且准确地识别潜在对象。因此,本技术可以用于改善通用技术中存在的效率较低且准确性较低的技术问题。
附图说明
36.图1为本技术实施例提供的一种对象识别系统的结构示意图;
37.图2为本技术实施例提供的一种电子设备的硬件结构示意图;
38.图3为本技术实施例提供的一种对象识别方法的流程示意图;
39.图4为本技术实施例提供的另一种对象识别方法的流程示意图;
40.图5为本技术实施例提供的一种对象识别装置的结构示意图。
具体实施方式
41.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
42.需要说明的是,本技术实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
43.为了便于清楚描述本技术实施例的技术方案,在本技术实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
44.此外,本技术实施例和权利要求书及附图中的术语“包括”和“具有”不是排他的。例如,包括了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,还可以包括没有列出的步骤或模块。
45.为了便于理解本技术,现对本技术涉及到的相关要素进行描述。
46.潜在客户识别是一种非常重要的业务拓展技术,可以帮助企业识别潜在客户,以及预测客户的需求和业务购买行为,从而更好地制定业务发展策略。
47.随着大数据技术的不断发展,越来越多的企业开始使用聚类、分类和关联规则挖掘等机器学习和数据挖掘技术,实现关于客户数据的分析和建模,以识别潜在客户。例如,通信运营商已将机器学习和数据挖掘等技术,应用在通信业务中进行数据分析,以识别潜在客户。
48.目前,通常可以采用基于规则的方法和基于统计的方法进行数据分析,以识别潜在客户。这种方法实现时,一般是通过判断客户数据是否符合年龄段、收入情况和居住位置等维度的预制规则,识别客户是否为潜在客户。例如,若一个客户的年龄在25岁至40岁之间、收入在10万元以上和居住在特定地区,则认为该一个客户是潜在客户。由于规则依赖于人工进行大量调查而制定,且所参考的维度局限性较强,因此,这种方法往往难以准确地识别潜在客户。
49.基于统计的方法是指根据客户数据的统计规律,识别客户是否为潜在客户。例如,可以通过分析客户数据中的历史交易信息,将存在与特定商品对应的交易记录的客户识别为潜在客户。
50.然而,基于规则的方法依赖于人工进行大量的调查以制定规则,且随着时间和客户消费水平等的变化,规则也需要不断更新。基于统计的方法往往参考平均数和众数等基本统计数据,容易忽略如业务内容和接入基站位置等其他方面的因素,导致识别的准确度较低。
51.针对上述问题,本技术实施例提供了一种对象识别方法,可以获取第一对象的业务数据,并将第一对象的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果,以进一步在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
52.由于业务数据包括业务使用数据和业务信令数据,因此,目标分类模型可以依据第一对象在多个维度的信息,准确地确定第一对象的分类结果。并且,基于目标分类模型进行类型判定可以具备较高的处理效率。
53.进一步地,若第一对象为服务类型,则可以表明第一对象更可能会与存在业务需求的用户进行通话,从与第一对象存在通话记录的多个第二对象中更可能识别到潜在对象。基于此,本技术可以支持高效且准确地识别潜在对象。因此,本技术可以用于改善通用技术中存在的效率较低且准确性较低的技术问题。
54.该对象识别方法适用于对象识别系统。图1示出了该对象识别系统100的一种结构。如图1所示,该对象识别系统100可以包括:数据配置装置101和对象识别装置102。数据配置装置101和对象识别装置102之间可以通信连接。
55.在实际应用中,对象识别装置102也可以同时和多个数据配置装置101之间通信连接。为了便于理解,本技术以对象识别装置102和一个数据配置装置101之间通信连接为例进行说明。
56.可选的,图1中的对象识别装置102可以是集成于数据配置装置101内部的功能模块,也可以是与数据配置装置101相互独立设置的设备。本公开实施例对此不作限制。
57.容易理解的是,当对象识别装置102是集成于数据配置装置101内部的功能模块时,数据配置装置101和对象识别装置102之间的通信方式为设备内部模块之间的通信。这种情况下,二者之间的通信流程与“数据配置装置101和对象识别装置102相互独立设置的情况下,二者之间的通信流程”相同。
58.为了便于理解,本技术主要以数据配置装置101和对象识别装置102相互独立设置为例进行说明。
59.一种可能的方式中,数据配置装置101可以用于提供数据配置服务。数据配置服务可以用于支持配置对象(例如第一对象)的业务数据,以及初始分类模型的参数和算法等数据。
60.一种可能的方式中,图1中的数据配置装置101可以是终端。图1中所示为数据配置装置101的一种设备形态示例,不用于限制数据配置装置101的具体形态。
61.一种可能的方式中,对象识别装置102可以配置有目标分类模型、第一预设条件和第二预设条件等,以便于提供对象识别服务。
62.可选地,图1中的对象识别装置102可以是终端,也可以是服务器,还可以是其他具备对象识别功能的电子设备。图1中所示为对象识别装置102的一种设备形态示例,不用于限制对象识别装置102的具体形态。
63.可选地,数据配置装置101和对象识别装置102是终端时,该终端可以是为指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(radio access network,ran)与一个或多个核心网进行通信。无线终端可以是移动终端,如具有移动终端的计算机,也可以是便携式、袖珍式、手持式、计算机内置的移动装置,它们与无线接入网交换语言和/或数据,例如,手机、平板电脑、笔记本电脑、上网本、个人数字助理(personal digital assistant,pda)。本技术实施例对此不作任何限制。
64.对象识别装置102是服务器时,该服务器可以是单独的一个服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。本技术实施例对此不作任何限制。
65.如图2所示,为本技术实施例提供的电子设备的一种硬件结构示意图。该电子设备可以是数据配置装置101,也可以是对象识别装置102。该电子设备包括处理器21,存储器22、通信接口23、总线24。处理器21,存储器22以及通信接口23之间可以通过总线24连接。
66.处理器21是电子设备的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器21可以是一个cpu,也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
67.作为一种实施例,处理器21可以包括一个或多个cpu,例如图2中所示的cpu0和cpu1。
68.存储器22可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机
存取的任何其他介质,但不限于此。
69.一种可能的实现方式中,存储器22可以独立于处理器21存在,存储器22可以通过总线24与处理器21相连接,用于存储指令或者程序代码。处理器21调用并执行存储器22中存储的指令或程序代码时,能够实现本技术下述实施例提供的对象识别方法。
70.另一种可能的实现方式中,存储器22也可以和处理器21集成在一起。
71.通信接口23,用于电子设备与其他设备通过通信网络连接,通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,wlan)等。通信接口23可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
72.总线24,可以是工业标准体系结构(industry standard architecture,isa)总线、外部设备互连(peripheral component interconnect,pci)总线或扩展工业标准体系结构(extended industry standard architecture,eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
73.需要指出的是,图2中示出的结构并不构成对电子设备的限定,除图2所示部件之外,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
74.如图3所示,为本技术实施例提供的一种对象识别方法的流程示意图。该对象识别方法可以应用于图1所示的对象识别系统100中的对象识别装置102。该对象识别方法包括:s301-s303。
75.s301、对象识别装置获取第一对象的业务数据。
76.其中,业务数据可以包括业务使用数据和业务信令数据。
77.一种可能的方式中,第一对象可以是用户在通信网络中的身份标识。例如,第一对象可以是手机号码、国际移动用户识别码(international mobile subscriber identity,imsi)等。
78.可选地,业务使用数据可以包括业务套餐信息、业务使用时长(也可以称为入网时长)和业务签约类型等。业务签约类型可以是个人类型和企业类型。企业类型可以进一步划分为物流类型、外卖类型、司机类型和客服类型等。业务套餐信息可以包括用户在运营商网络中订购的可用通话时长信息和可用网络流量信息等。
79.可选地,业务信令数据可以包括第一对象所进行通话的建立时间、呼叫类型、本端接入网设备、对端号码、对端接入网设备、通话时长和通信网络类型等。
80.一种可能的方式中,结合图1,工作人员可以预先通过数据配置装置将第一对象的业务数据配置在对象识别装置内,并配置与第一对象的业务数据对应的触发指令。触发指令可以是条件触发类型或定时触发类型等。基于此,对象识别装置可以在触发指令触发的情况下,读取第一对象的业务数据,以便于进行对象识别。
81.或者,工作人员也可以实时地通过数据配置装置,向对象识别装置发送携带有第一对象的业务数据的对象识别请求。相应的,对象识别装置可以接收到对象识别请求,并解析对象识别请求得到第一对象的业务数据,以及响应于对象识别请求,进行对象识别。
82.具体而言,数据配置装置可以配置有输入模块。工作人员可以通过数据配置装置配置的输入模块执行数据编辑操作、指令编辑操作和请求发送操作等。数据配置装置可以
响应于工作人员执行的数据编辑操作,获取到与数据编辑操作对应的第一对象的业务数据,并向对象识别装置发送第一对象的业务数据。数据配置装置也可以响应于工作人员执行的指令编辑操作,生成与指令编辑操作对应的触发指令,并向对象识别装置发送触发指令。数据配置装置还可以响应于工作人员执行的请求发送操作,生成与请求发送操作对应的对象识别请求,并向对象识别装置发送第一对象的对象识别请求。相应的,对象识别装置可以接收到来自于数据配置装置的第一对象的业务数据、触发指令和对象识别请求。
83.s302、对象识别装置将业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果。
84.其中,分类结果可以包括服务类型或普通类型。服务类型可以用于表示第一对象归属于特定服务场景中的用户。特定服务场景可以是物流服务场景、培训服务场景、游戏客服服务场景和视频客服服务场景等。普通类型可以用于表示第一对象归属于普通用户。普通用户即通信网络中满足个人通话需求和个人上网需求等的个人用户。
85.需要说明的是,与普通类型相比,在第一对象为服务类型的情况下,则可以表明第一对象更可能会与特定类型的用户进行通话,从与第一对象存在通话记录的对象中更可能识别到潜在对象。例如,在服务类型用于表示第一对象归属于特定服务场景中的用户时,则第一对象通常会与存在网络购物需求的用户进行通话,而存在网络购物需求的用户往往对网络流量存在较大需求,则从与第一对象存在通话记录的对象中更可能识别到存在网络流量需求的潜在对象。在服务类型用于表示第一对象归属于游戏客服服务场景中的用户时,则第一对象通常会与游戏玩家进行通话,而游戏玩家往往对网络流量存在较大需求,则从与第一对象存在通话记录的对象中更可能识别到存在网络流量需求的潜在对象。
86.基于此,为了高效且准确地识别到潜在对象,对象识别装置可以将第一对象的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果。若第一对象的分类结果为普通类型,则可以表明难以从与第一对象存在通话记录的对象中识别到潜在对象,对象识别装置可以结束本次识别流程。若第一对象的分类结果为服务类型,则可以表明从与第一对象存在通话记录的对象中识别到潜在对象的可能性较大,对象识别装置可以继续执行下述s303。
87.一种可能的方式中,目标分类模型可以确定对于服务类型的置信度(也可以称为预测概率)和普通类型的置信度,并将置信度的值较大的作为第一对象的分类结果。
88.一种可能的示例中,预设将第一对象输入至目标分类模型后,目标分类模型得到普通类型的置信度为0.4,服务类型的置信度为0.6,则目标分类模型确定第一对象的分类结果为服务类型。
89.一种可能的方式中,目标分类模型可以基于多个样本数据,预先训练初始分类模型得到。关于训练得到目标分类模型的具体流程,可以参考下述s501-s502进行理解,在此不再赘述。
90.一种可能的方式中,服务类型可以包括物流服务类型或客服服务类型或培训服务类型。考虑到不同类型的用户对于业务的需求程度不同,服务类型可以细分为物流服务类型、培训服务类型和客服服务类型(例如游戏客服服务类型和视频客服服务类型)等。这种情况下,目标分类模型可以是基于不同场景下的不同样本数据训练得到的,是一个多分类模型,即输出的分类结果为物流服务类型或客服服务类型或培训服务类型或普通类型。基
于此,可以准确地识别第一对象的类型,以便于准确地确定基于第一对象识别到的潜在对象对于业务的需求程度,从而便于准确地进行业务套餐推荐等。
91.一种可能的方式中,为了提高目标分类模型的分类精度,目标分类模型也可以是一个二分类模型,即输出的分类结果为服务类型或普通类型。并且,可以基于物流服务场景、培训服务场景、游戏客服服务场景和视频客服服务场景等不同场景下的样本数据,训练得到与各个场景对应的目标分类模型。例如,与物流服务场景对应的目标分类模型,与游戏客服服务场景对应的目标分类模型等。
92.这种情况下,第一对象可以是与不同场景对应的企业类型的对象。例如,与物流服务场景对应的企业类型可以是物流类型,与游戏客服服务场景对应的企业类型可以是游戏服务类型等。考虑到归属于同一企业类型的对象在企业中的职能可能不同,导致归属于同一企业类型的对象可能是服务类型,也可能是普通类型。基于此,对象识别装置可以通过与第一对象的企业类型对应的目标分类模型,确定第一对象的分类结果,以进行对象识别。
93.s303、对象识别装置在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
94.一种可能的方式中,若第一对象的分类结果为服务类型,则可以表明从与第一对象存在通话记录的对象中识别到潜在对象的可能性较大,则对象识别装置可以从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
95.可选地,对象识别装置可以从第一对象的业务信令数据中,获取到第一对象所进行通话的建立时间和对端号码(即第二对象),并基于通话的建立时间,统计第一预设时长(例如1个小时或者24个小时等)内各对端号码的出现次数,即特定时长内各第二对象与第一对象之间的通话次数,以进一步将通话次数大于预设次数阈值的第二对象,确定为潜在对象。
96.或者,对象识别装置可以从第一对象的业务信令数据中,获取到第一对象所进行通话的对端号码(即第二对象)和通信网络类型,即确定各第二对象的通信网络类型,以进一步将通信网络类型与第一对象的通信网络类型不同的第二对象,确定为潜在对象。
97.一种可能的方式中,潜在对象可以用于表示订购与服务类型对应的通信业务的可能性较大的第二对象,即潜在对象归属的用户更可能存在对与服务类型对应的通信业务的使用需求。后续,运营商可以针对该潜在对象归属的用户,准确地进行业务推广。
98.一种可能的方式中,在服务类型用于表示第一对象归属于物流服务场景中的用户时,则第二对象可能归属于频繁使用网络购物应用服务的用户,且该用户对网络流量使用的需求度为一般。这种情况下,与服务类型对应的通信业务可以是提供第一数量的网络流量的业务。在服务类型用于表示第一对象归属于游戏客服服务场景中的用户时,则第二对象可能归属于频繁使用游戏应用服务的用户,且该用户对网络流量使用的需求度为较高。这种情况下,与服务类型对应的通信业务可以是提供第二数量的网络流量的业务。第二数量可以大于第一数量。
99.一种实施例中,在上述s303中,即对象识别装置从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象时,本技术提供一种可选的实现方式,包括:s401。
100.s401、对象识别装置将多个第二对象中符合第一预设条件的第二对象,确定为潜
在对象。
101.其中,第一预设条件可以包括第一预设时长内与第一对象的通话次数大于预设次数阈值、第一预设时长内与第一对象的平均通话时长小于第一时长阈值、与第一对象归属于不同的通信网络。
102.一种可能的方式中,对象识别装置可以基于第一对象的业务信令数据,统计第一预设时长内各个第二对象(即对端号码)与第一对象的通话次数、平均通话时长和通信网络类型,并进一步判断各个第二对象是否符合第一预设条件。
103.需要说明的是,考虑到对于一个网络运营商来说,归属于其他网络运营商、且对于网络的需求度较高的对象往往被视为潜在对象。而第一预设条件可以支持筛选到归属于其他网络运营商、且通话次数较多、且存在网络流量使用需求的对象。因此,本技术可以支持高效且准确地识别潜在对象,从而加速网络运营商的业务发展。
104.一种可能的方式中,第一预设时长、预设次数阈值和第一时长阈值可以由工作人员根据不同场景进行合理设置。
105.一种实施例中,为了训练得到目标分类模型,如图4所示,本技术实施例提供的对象识别方法,还包括:s501-s502。
106.s501、对象识别装置获取多个第一样本数据和多个第二样本数据。
107.其中,第一样本数据可以用于表示服务类型的对象的业务数据。第二样本数据可以用于表示普通类型的对象的业务数据。多个第一样本数据的数量和多个第二样本数据的数量可以相同或相近,以避免模型过拟合问题,提供模型的分类精度。
108.一种可能的方式中,结合图1,工作人员可以通过数据配置装置,向对象识别装置发送多个第一样本数据和多个第二样本数据。相应的,对象识别装置可以接收到多个第一样本数据和多个第二样本数据。
109.一种可能的方式中,在服务类型细分为物流服务类型、客服服务类型和培训服务类型等时,样本数据也可以分为物流服务类型、客服服务类型、培训服务类型和普通类型等,以便于训练得到多分类模型。这种情况下,各类型的样本数据的数量可以相同或相近,以避免模型过拟合问题,提供模型的分类精度。
110.s502、对象识别装置基于多个第一样本数据和多个第二样本数据,对初始分类模型进行训练,得到目标分类模型。
111.一种可能的方式中,第一样本数据和第二样本数据的类型标签不同外,可以包括相同维度的数据。即样本对象的业务使用信息和业务信令数据中每一项的信息。例如,手机号码、入网时长、业务套餐类型、月消费额度、通话总次数、呼出次数、呼入次数、通话总时长、平均通话时长、通话时长小于第三时长阈值的次数、接入网设备、接入网设备对应的通话次数、去重后的对端号码数量和累计呼出次数大于呼出次数阈值的对端号码数量等。在样本数据的数据维度较多样的情况下,可以改善初始分类模型的训练效果,提高分类精度。
112.一种可能的方式中,对象识别装置可以将多个第一样本数据和多个第二样本数据,随机划分为多个子集合,并依次将各子集合中的第一样本数据和第二样本数据输入至初始分类模型进行分类处理得到处理结果,以及基于处理结果、各第一样本数据的类型标签和各第二样本数据的类型标签确定损失值。若损失值大于预设损失阈值,则可以调整初始分类模型的参数,直至损失值小于或等于预设损失阈值时,对象识别装置可以得到目标
分类模型。
113.一种可能的方式中,初始分类模型可以是基于极端梯度提升(extreme gradient boosting,xgboost)、轻量级梯度提升(light gradient boosting machine,lightgbm)或梯度提升(gradient boosting,catboost)等树模型生成的。
114.一种实施例中,在获取多个第一样本数据时,本技术提供一种可选的实现方式,包括:s601-s602。
115.s601、对象识别装置获取多个第一候选数据。
116.其中,第一候选数据可以包括服务类型的类型标签。
117.一种可能的方式中,结合图1,工作人员可以通过数据配置装置执行标签编辑操作,以编辑与多个样本对象一一对应的多个类型标签。响应于该数据配置装置,数据配置装置可以生成与多个样本对象一一对应的多个类型标签,并与各样本对象的业务数据进行对应组合,得到多个第一候选数据,并进一步向对象识别装置发送多个第一候选数据。相应的,对象识别装置可以接收到多个第一候选数据。
118.可选地,样本对象为手机号码时,数据配置装置可以用于提供号码类型识别服务和类型信息编辑服务。号码类型识别服务可以基于相关应用服务实现。该相关应用服务可以基于大数据显示手机号码的类型标签。例如,类型标签可以是诈骗电话、快递和外卖等。类型信息编辑服务可以支持用户手动标记手机号码的类型标签。例如,对于一个企业的号段下的所有手机号码,可以由工作人员手动标记成与该企业类型对应的类型标签。例如,对于物流服务类型的企业,则可以将该企业申请的号段下的所有手机号码手动标记为物流服务类型。
119.s602、对象识别装置将符合第二预设条件的第一候选数据确定为第一样本数据,得到多个第一样本数据。
120.其中,第一样本数据可以符合第二预设条件。第二预设条件可以包括:第二预设时长内对应的被叫对象的数量大于预设对象数量阈值、第二预设时长内平均外呼时长小于或等于第二时长阈值、第二预设时长内向外呼叫时所基于的接入网设备的数量小于或等于预设设备数量阈值,和/或通话对象数量、被叫对象的数量、平均外呼时长和接入网设备的数量的加权分值大于预设分值阈值。
121.一种可能的方式中,第二预设条件还可以包括不同时间段内向外呼加次数大于第一次数阈值。即不定期的向外进行多次呼叫。
122.一种可能的方式中,对象识别装置可以统计各第一候选数据的业务信令数据中第二预设时长内对应的被叫对象的数量、平均外呼时长和向外呼叫时所基于的接入网设备的数量,并进一步确定各第一候选数据在第二预设时长内对应的被叫对象的数量是否大于预设对象数量阈值,以及第二预设时长内平均外呼时长是否小于或等于第二时长阈值,以及第二预设时长内向外呼叫时所基于的接入网设备的数量是否小于或等于预设设备数量阈值,以确定第一候选数据是否符合第二预设条件。
123.一种可能的方式中,对象识别装置可以基于第一公式、通话对象数量(也可以称为对端号码数量)、被叫对象的数量、平均外呼时长和接入网设备的数量,确定各第一候选数据对应的加权分值,并确定各第一候选数据对应的加权分值是否大于预设分值阈值,以确定第一候选数据是否符合第二预设条件,从而选择得分高于预设分值阈值的第一候选数据
作为第一样本数据。第一公式为:
[0124][0125]
其中,si为第i个第一候选数据的加权分值,i为正整数。ci为第i个第一候选数据中的通话对象数量。c
min
为与通话对象数量对应的预设阈值。通话对象数量大于该对应的预设阈值时,得分越高。为第i个第一候选数据中的被叫对象的数量,即呼出的对端号码数量。ti为第i个第一候选数据中的平均外呼时长。t
max
为单次外呼时长对应的预设阈值。celli为接入网设备的数量。cell
max
为与接入网设备的数量对应的预设阈值。
[0126]
一种可能的方式中,第二预设时长、预设对象数量阈值、第二时长阈值和预设设备数量阈值可以由工作人员根据不同场景进行合理设置。例如,在培训服务场景下,第二预设时长可以是1个小时,预设对象数量阈值可以是10,第二时长阈值可以是3分钟,预设设备数量阈值可以是1。
[0127]
一种可能的方式中,对象识别装置可以在得到多个第一样本数据后,基于多个第一样本数据的数量,对其他的样本对象的业务数据中进行随机采样,并为采样得到的样本对象的业务数据分配普通类型的类型标签,得到多个第二样本数据,以使得多个第一样本数据的数量和多个第二样本数据的数量相同。
[0128]
本技术实施例中,对象识别装置可以获取第一对象的业务数据,并将第一对象的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果,以进一步在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。
[0129]
由于业务数据包括业务使用数据和业务信令数据,因此,目标分类模型可以依据第一对象在多个维度的信息,准确地确定第一对象的分类结果。并且,基于目标分类模型进行类型判定可以具备较高的处理效率。
[0130]
进一步地,若第一对象为服务类型,则可以表明第一对象更可能会与存在业务需求的用户进行通话,从与第一对象存在通话记录的多个第二对象中更可能识别到潜在对象。基于此,本技术可以支持高效且准确地识别潜在对象。因此,本技术可以用于改善通用技术中存在的效率较低且准确性较低的技术问题。
[0131]
针对于通用技术存在的较多缺陷,本技术提出了一种更加全面、高效和实用的潜在对象识别方法,包括了样本数据的筛选、类型标签的定义、业务数据的分类处理和分类模型的训练等步骤。这些新颖的步骤使得本技术具有更高的准确性和更广泛的适用范围。
[0132]
上述主要从方法的角度对本技术实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0133]
本技术实施例可以根据上述方法示例对对象识别装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式
实现。可选地,本技术实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0134]
如图5所示,为本技术实施例提供的一种对象识别装置的结构示意图。该对象识别装置可以用于执行如图3和图4所示的对象识别方法,以及上述未体现在附图中的相关实现方式。该对象识别装置包括:获取单元701、处理单元702和确定单元703;
[0135]
获取单元701,用于获取第一对象的业务数据;业务数据包括业务使用数据和业务信令数据;例如,结合图3,获取单元701可以用于执行s301。
[0136]
处理单元702,用于将获取单元701获取到的业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果;分类结果包括服务类型或普通类型;例如,结合图3,处理单元702可以用于执行s302。
[0137]
确定单元703,用于在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。例如,结合图3,确定单元703可以用于执行s303。
[0138]
可选地,确定单元703,具体用于:
[0139]
将多个第二对象中符合第一预设条件的第二对象,确定为潜在对象;第一预设条件包括第一预设时长内与第一对象的通话次数大于预设次数阈值、第一预设时长内与第一对象的平均通话时长小于第一时长阈值、与第一对象归属于不同的通信网络。例如,确定单元703可以用于执行s401。
[0140]
可选地,获取单元701,还用于获取多个第一样本数据和多个第二样本数据;第一样本数据用于表示服务类型的对象的业务数据;第二样本数据用于表示普通类型的对象的业务数据;例如,结合图4,获取单元701可以用于执行s501。
[0141]
处理单元702,还用于基于多个第一样本数据和多个第二样本数据,对初始分类模型进行训练,得到目标分类模型。例如,结合图4,处理单元702可以用于执行s502。
[0142]
可选地,第一样本数据符合第二预设条件;第二预设条件包括:第二预设时长内对应的被叫对象的数量大于预设对象数量阈值、第二预设时长内平均外呼时长小于或等于第二时长阈值、第二预设时长内向外呼叫时所基于的接入网设备的数量小于或等于预设设备数量阈值,和/或通话对象数量、被叫对象的数量、平均外呼时长和接入网设备的数量的加权分值大于预设分值阈值;获取单元701,具体用于:
[0143]
获取多个第一候选数据;第一候选数据包括服务类型的类型标签;例如,获取单元701可以用于执行s601。
[0144]
将符合第二预设条件的第一候选数据确定为第一样本数据,得到多个第一样本数据。例如,获取单元701可以用于执行s602。
[0145]
可选地,服务类型包括物流服务类型或客服服务类型或培训服务类型。
[0146]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本技术所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机可读存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0147]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
[0148]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0149]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种对象识别方法,其特征在于,包括:获取第一对象的业务数据;所述业务数据包括业务使用数据和业务信令数据;将所述业务数据输入至目标分类模型进行分类处理,得到所述第一对象的分类结果;所述分类结果包括服务类型或普通类型;在所述第一对象为所述服务类型的情况下,从与所述第一对象存在通话记录的多个第二对象中,确定与所述服务类型对应的通信业务的潜在对象。2.根据权利要求1所述的对象识别方法,其特征在于,所述从与所述第一对象存在通话记录的多个第二对象中,确定与所述服务类型对应的通信业务的潜在对象,包括:将所述多个第二对象中符合第一预设条件的第二对象,确定为所述潜在对象;所述第一预设条件包括第一预设时长内与所述第一对象的通话次数大于预设次数阈值、所述第一预设时长内与所述第一对象的平均通话时长小于第一时长阈值、与所述第一对象归属于不同的通信网络。3.根据权利要求1所述的对象识别方法,其特征在于,还包括:获取多个第一样本数据和多个第二样本数据;所述第一样本数据用于表示所述服务类型的对象的业务数据;所述第二样本数据用于表示所述普通类型的对象的业务数据;基于所述多个第一样本数据和所述多个第二样本数据,对初始分类模型进行训练,得到所述目标分类模型。4.根据权利要求3所述的对象识别方法,其特征在于,所述第一样本数据符合第二预设条件;所述第二预设条件包括:第二预设时长内对应的被叫对象的数量大于预设对象数量阈值、所述第二预设时长内平均外呼时长小于或等于第二时长阈值、所述第二预设时长内向外呼叫时所基于的接入网设备的数量小于或等于预设设备数量阈值,和/或通话对象数量、所述被叫对象的数量、所述平均外呼时长和所述接入网设备的数量的加权分值大于预设分值阈值;所述获取多个第一样本数据,包括:获取多个第一候选数据;所述第一候选数据包括所述服务类型的类型标签;将符合所述第二预设条件的所述第一候选数据确定为所述第一样本数据,得到所述多个第一样本数据。5.根据权利要求1所述的对象识别方法,其特征在于,所述服务类型包括物流服务类型或客服服务类型或培训服务类型。6.一种对象识别装置,其特征在于,包括:获取单元、处理单元和确定单元;所述获取单元,用于获取第一对象的业务数据;所述业务数据包括业务使用数据和业务信令数据;所述处理单元,用于将所述获取单元获取到的所述业务数据输入至目标分类模型进行分类处理,得到所述第一对象的分类结果;所述分类结果包括服务类型或普通类型;所述确定单元,用于在所述第一对象为所述服务类型的情况下,从与所述第一对象存在通话记录的多个第二对象中,确定与所述服务类型对应的通信业务的潜在对象。7.根据权利要求6所述的对象识别装置,其特征在于,所述确定单元,具体用于:将所述多个第二对象中符合第一预设条件的第二对象,确定为所述潜在对象;所述第一预设条件包括第一预设时长内与所述第一对象的通话次数大于预设次数阈值、所述第一预设时长内与所述第一对象的平均通话时长小于第一时长阈值、与所述第一对象归属于不
同的通信网络。8.根据权利要求6所述的对象识别方法,其特征在于,所述获取单元,还用于获取多个第一样本数据和多个第二样本数据;所述第一样本数据用于表示所述服务类型的对象的业务数据;所述第二样本数据用于表示所述普通类型的对象的业务数据;所述处理单元,还用于基于所述多个第一样本数据和所述多个第二样本数据,对初始分类模型进行训练,得到所述目标分类模型。9.一种对象识别装置,其特征在于,包括存储器和处理器;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过总线连接;当所述对象识别装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述对象识别装置执行如权利要求1-5任一项所述的对象识别方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行如权利要求1-5任一项所述的对象识别方法。

技术总结
本申请提供一种对象识别方法、装置和存储介质,涉及通信技术领域,用于改善通用技术中存在的效率较低且准确性较低的技术问题。该方法包括:获取第一对象的业务数据;业务数据包括业务使用数据和业务信令数据;将业务数据输入至目标分类模型进行分类处理,得到第一对象的分类结果;分类结果包括服务类型或普通类型;在第一对象为服务类型的情况下,从与第一对象存在通话记录的多个第二对象中,确定与服务类型对应的通信业务的潜在对象。务类型对应的通信业务的潜在对象。务类型对应的通信业务的潜在对象。


技术研发人员:彭家立 郑夏妍 吴争光 石钰
受保护的技术使用者:中国联合网络通信集团有限公司
技术研发日:2023.07.17
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐