数据处理方法、装置、存储介质、终端及产品与流程
未命名
10-19
阅读:94
评论:0
1.本说明书实施例涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、终端、计算机可读存储介质以及计算机程序产品。
背景技术:
2.消费金融(或消费贷)是指以消费为目的的贷款服务,用来满足用户日常消费的借贷需求。根据消费金融事务是否依托于场景、放贷资金是否直接划入消费场景中,又可以将消费金融分为消费贷和现金贷。
3.互联网消费金融公司旨在向各消费者提供消费金融服务。互联网消费金融公司在进行用户借贷、公司投融资等事务的过程中,会产生相关的事务数据、财务数据、征信数据等金融数据,并需要将这些金融数据报送给监管机构。监管机构通过对上述金融数据的分析,实现对互联网消费金融公司的风险监测与评估。
4.然而,互联网消费金融公司上报金融数据以及监管机构对金融数据进行分析的过程,还需要进一步的改进。
5.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本说明书的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现要素:
6.本说明书实施例提供了一种数据处理方法、装置、终端、计算机可读存储介质以及计算机程序产品,能够提高对数据进行处理时的准确性和高效性。
7.本说明书实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本说明书的实践而习得。
8.根据本说明书实施例的第一个方面,提供一种数据处理方法,该方法应用于第一服务器,该方法包括:建立目标联盟链;接收第二服务器的数据存储请求,并对上述第二服务器进行身份验证;在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认,以使上述第二服务器将待监管数据存储至上述目标联盟链;通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种,上述类别包括异常数据和正常数据;在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
9.在本说明书一个实施例中,在上述待监管数据的类别为异常数据的情况下,上述方法还包括:获取标注后的目标数据,其中,上述标注后的目标数据为根据上述目标数据的类别对上述目标数据进行标注得到的;在上述标注后的目标数据的类别为异常数据的情况下,将上述标注后的目标数据输入至上述分类模型,以使上述分类模型根据上述标注后的目标数据进行对抗学习;在上述标注后的目标数据的类别为正常数据的情况下,将上述标注后的目标数据输入至上述分类模型,以使上述分类模型根据上述标注后的目标数据进行
在线学习。
10.在本说明书一个实施例中,上述将上述标注后的目标数据输入至上述分类模型,以使上述分类模型根据上述标注后的目标数据进行对抗学习,包括:在上述标注后的目标数据中添加干扰内容,得到对抗数据;将上述对抗数据输入至上述分类模型,以使上述分类模型根据上述对抗数据进行对抗学习。
11.在本说明书一个实施例中,上述方法还包括:在上述待监管数据的类别为正常数据的情况下,通过上述分类模型根据上述待监管数据进行在线学习,以对上述分类模型中的参数进行更新。
12.在本说明书一个实施例中,存储在上述目标联盟链中的待监管数据包含身份标识;上述方法还包括:通过上述目标联盟链中的智能合约,对于包含目标身份标识的待监管数据进行分析处理,其中,上述分析处理包括下探处理和/或上卷处理;根据上述分析处理的结果,确定关于上述目标身份标识的信用等级。
13.在本说明书一个实施例中,上述方法还包括:通过已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型;上述通过已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型,包括:通过集成学习的方式,基于上述已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型。
14.根据本说明书实施例的第二个方面,提供一种数据处理方法,该方法应用于第二服务器,该方法包括:获取待监管数据,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种;向第一服务器发送数据存储请求,以使上述第一服务器对上述第二服务器进行身份验证,并在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认;在上述第一服务器确认上述数据存储请求的情况下,将上述待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述类别包括异常数据和正常数据;并且,以使上述第一服务器在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
15.根据本说明书实施例的第三个方面,提供一种数据处理装置,该装置配置于第一服务器,该装置包括:建立模块,用于:建立目标联盟链;接收模块,用于:接收第二服务器的数据存储请求,并对上述第二服务器进行身份验证;确认模块,用于:在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认,以使上述第二服务器将待监管数据存储至上述目标联盟链;分类模块,用于:通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种,上述类别包括异常数据和正常数据;生成模块,用于:在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
16.根据本说明书实施例的第四个方面,提供一种数据处理装置,该装置配置于第二服务器,该装置包括:获取模块,用于:获取待监管数据,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种;发送模块,用于:向第一服务器发送数据存储请求,以使上述第一服务器对上述第二服务器进行身份验证,并在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认;存储模块,用于:在上述第一服务器确认上
述数据存储请求的情况下,将上述待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述类别包括异常数据和正常数据;并且,以使上述第一服务器在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
17.根据本说明书实施例的第五个方面,提供一种终端,包括:存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现上述第一个方面所述的数据处理方法,以及实现上述第二个方面所述的数据处理方法。
18.根据本说明书实施例的第六个方面,提供一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述第一个方面所述的数据处理方法,以及实现上述第二个方面所述的数据处理方法。
19.根据本说明书实施例的第七个方面,提供一种计算机程序产品,当上述计算机程序产品在计算机或处理器上运行时,使得上述计算机或处理器执行时实现上述第一个方面所述的数据处理方法,以及实现上述第二个方面所述的数据处理方法。
20.本说明书的实施例所提供的数据处理方法、装置、终端、计算机可读存储介质以及计算机程序产品,具备以下技术效果:
21.本说明书示例性的实施例提供的方案适用于监管机构通过第一服务器实现对待监管数据的分类以及对异常数据的预警。具体地,上述数据处理方法包括:通过分类模型将目标联盟链中存储的待监管数据进行分类,从而确定待监管数据的类别为异常数据或正常数据。其中,待监管数据包括事务数据、财务数据和征信数据中的一种或多种。在待监管数据的类别为异常数据的情况下,确定待监管数据为目标数据,并生成关于目标数据的预警信息。从而提高对待监管数据进行处理时的准确性和高效性。
22.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
23.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1是本说明书一示例性的实施例提供的数据处理方法的交互图;
25.图2是本说明书一示例性的实施例提供的对目标数据进行处理的流程图;
26.图3是本说明书一示例性的实施例提供的数据处理方法的场景图;
27.图4是本说明书一示例性的实施例提供的数据处理装置的结构图;
28.图5是本说明书另一示例性的实施例提供的数据处理装置的结构图;
29.图6是本说明书再一示例性的实施例提供的数据处理装置的结构图;
30.图7是本说明书一示例性的实施例提供的终端的示意性框图。
具体实施方式
31.为使本说明书的目的、技术方案和优点更加清楚,下面将结合附图对本说明书实施例方式作进一步地详细描述。
32.下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
33.在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
34.互联网消费金融公司通常需要对事务数据、财务数据、征信数据等(以下记作,待监管数据)进行加工、抽取,以形成分类报表报送给监管机构,例如中国人民银行、中国银行业监督管理委员会(简称,中国银监会)等部门,以便监管机构及时了解金融公司的事务风险和合规情况。
35.传统的监管报送路径为:互联网消费金融公司建立事务节点-》事务节点产生待监管数据-》建立报送节点-》将待监管数据通过报送节点发送至监管机构。
36.但在上述路径中,若报送节点与事务节点的建立时长相差较大,中间的待监管数据可能会遭到篡改,或是工作人员进行金融舞弊,所报送的待监管数据可能会存在时效性、准确性和权威性不足的问题,而致使最终报送到监管机构的待监管数据难以反映互联网消费金融公司真实的事务情况,进而可能增大互联网消费金融公司的金融风险,并且不利于监管机构精确、及时、高效地对互联网消费金融公司进行监管。
37.本说明书实施例提供了一种数据处理方法、装置、终端、计算机可读存储介质以及计算机程序产品,能够提高对数据进行处理时的准确性和高效性。
38.其中,图1示出了本说明书一实施例提供的数据处理方法的交互图。
39.在示例性的实施例中,如图1所示,第二服务器11为互联网消费金融公司所使用(即第二服务器11对应于互联网消费金融公司),第一服务器10为监管机构所使用(即第一服务器10对应于监管机构)。目标联盟链12可以为联盟链(consortium blockchain)。其中,目标联盟链12可以由第一服务器10(监管机构)建立。
40.区块链是一种安全、共享的去中心化的数据账本。区块链技术支持一组特定的参与方共享数据,是一种将数据区块连接方式组成的数据结构。它通过密码学等方式,保证数据不可篡改、不可伪造。区块链利用分布式共识算法生成数据,利用密码学保证数据的传输及访问安全,并利用智能合约及算法进行条款限制。总体来说,区块链是一种去中心化、难以篡改的数据储存方法。
41.区块链的种类包括公有链(public blockchain)、私有链(private blockchain)和联盟链(consortium blockchain)。其中,联盟链是介于公有链与私有链之间的一种系统形态,它是由若干组织或机构共同参与管理的区块链,每个组织或机构控制一个或多个节
点,共同记录交易数据,并且只有这些组织或机构能够对联盟链中的数据进行读写和发送交易。
42.本说明书实施例中,使用联盟链对待监管数据进行存储,可以避免待监管数据遭到篡改,从而提高数据的安全性和准确性。同时,将待监管数据实时存储至目标联盟链中,也保证了待监管数据上报监管机构的及时性。
43.在目标联盟链12中部署有智能合约(smart contract),该智能合约可以由互联网消费金融公司提供。通过智能合约,不同的互联网消费金融公司可以通过公有密钥将其产生的待监管数据存储至目标联盟链12中;而监管机构可以通过私有密钥从目标联盟链12中获取该待监管数据。也就是说,互联网消费金融公司对于待监管数据具有写入的权限,监管机构对于待监管数据具有读取(查询)的权限。
44.其中,互联网消费金融公司的写入权限可以由监管机构进行授权。也就是说,监管机构可以决定哪一家公司可以将待监管数据存储至目标联盟链12中,而哪一家公司不能存储。
45.在示例性的实施例中,继续参考图1。第二服务器11(互联网消费金融公司)产生待监管数据后,执行s110:获取待监管数据。
46.之后,第二服务器11可向第一服务器10(监管机构)发送数据存储请求,以请求监管机构同意将公司的待监管数据存储至目标联盟链12中,也就是请求将待监管数据写入目标联盟链12的权限。即第二服务器11执行s120:发送数据存储请求。
47.在第一服务器10接收到上述数据存储请求后,可以对第二服务器11进行身份验证,例如:验证第二服务器11的合法性、验证第二服务器11所对应的互联网消费金融公司的相关信息,等等,本实施例中不做限定。即第一服务器10执行s130:对第二服务器进行身份验证。
48.在第二服务器11通过身份验证的情况下,第一服务器10可以对数据存储请求进行确认,从而为第二服务器11授予写入数据的权限。即第一服务器10执行s140:在第二服务器通过身份验证的情况下,对数据存储请求进行确认。
49.在获取到写入数据的权限后,第二服务器11便可以将待监管数据写入目标联盟链12中,即第二服务器11执行s150:在第一服务器确认数据存储请求的情况下,将待监管数据存储至目标联盟链。
50.在示例性的实施例中,继续参考图1。待监管数据上链后,第一服务器10可以对待监管数据进行读取,即第一服务器10执行步骤s160:获取待监管数据。
51.示例性的,第一服务器10在获取到待监管数据后,可以根据智能合约对不同的互联网消费金融公司对应的待监管数据进行分析处理、加工处理等。其中,分析处理可以包括下探处理(drill-down)、上卷处理(roll-up)等等,本实施例中不做限定。
52.在对待监管数据进行分析处理后,确定不同的互联网消费金融公司对应的信用等级。其中,信用等级可以包括风险等级、合规水位等等,本实施例中不做限定。
53.例如,不同的互联网消费金融公司可以对应有不同的身份标识,第一服务器10便可以通过目标联盟链12中的智能合约,对包含有目标身份标识的待监管数据进行分析处理。其中,身份标识可以为字符串或其他形式。
54.例如,假设互联网消费金融公司a的身份标识为fh789,互联网消费金融公司b的身
份标识为bn653。互联网消费金融公司a通过第二服务器11'将待监管数据存储至了目标联盟链12中,互联网消费金融公司b通过第二服务器11”将待监管数据存储至了目标联盟链12中。
55.第一服务器10通过目标联盟链12中的智能合约,对目标身份标识为fh789的待监管数据进行分析处理,也就是对上述互联网消费金融公司a的待监管数据进行分析处理,并得到该公司的信用等级。
56.第一服务器10通过目标联盟链12中的智能合约,对目标身份标识为bn653的待监管数据进行分析处理,也就是对上述互联网消费金融公司b的待监管数据进行分析处理,并得到该公司的信用等级。
57.需要说明的是,上述身份标识仅为示例,本实施例中对身份标识的形式和内容不做限定,能够将不同的互联网消费金融公司进行标识与区分即可。
58.在示例性的实施例中,继续参考图1。第一服务器10获取到待监管数据后,还可以通过分类模型实时地对待监管数据进行分类,从而确定待监管数据的类别。即,第一服务器10执行s170:通过分类模型对待监管数据进行分类,得到待监管数据的类别。
59.其中,所确定的待监管数据的类别可以包括正常数据和异常数据。若待监管数据的类别为正常数据,则表示待监管数据不存在舞弊风险;若待监管数据的类别为异常数据,则表示待监管数据存在舞弊风险。
60.示例性的,上述分类模型可以通过集成学习(ensemble learning)的方式对机器学习模型进行训练而得到。训练时所采用的样本可以为已标注的历史监管数据。
61.机器学习是一门开发算法和统计模型的科学。计算机系统使用机器学习算法对大量的行为数据进行自动分析并从中得到规律。这可以让计算机系统根据给出的输入数据集输出更准确的结果,从而实现对数据的预测、分类、聚类等目的。
62.而传统的机器学习算法(例如:决策树,人工神经网络,支持向量机,朴素贝叶斯等)的目标都是训练出一个较优的分类器。而集成学习的基本思想就是将多个分类器进行组合,从而实现一个分类效果更好的集成分类器。其中,集成学习可以分为减小方差(bagging)、偏差(boosting)或改进预测(stacking)等类型。
63.其中,上述分类模型可以为二分类模型。训练分类器时所采用的算法可以包括k-近邻算法(k-nearest neighbors algorithm,knn)、逻辑回归(logistic regression)、决策树(decision trees)、支持向量机(support vector machine)以及朴素贝叶斯(naive bayes)等等。本实施例中对分类器的训练方法和种类不做限定。训练好多个(一组)分类器后,将这些分类器通过集成学习进行组合,进而得到分类模型。
64.对上述历史监管数据进行标注时,可以将历史监管数据的类别分为正常数据和异常数据,并将正常数据的标签标注为“1”,将异常数据的标签标注为“0”。
65.需要说明的是,上述正常数据和异常数据的标签仅为示例,本实施例中不做限定。
66.在示例性的实施例中,继续参考图1。第一服务器10将待监管数据输入至上述分类模型后,便可确定待监管数据的类别为正常数据,或确定待监管数据的类别为异常数据。
67.在示例性的实施例中,在待监管数据的类别为正常数据的情况下,可以使分类模型根据待监管数据进行在线学习,从而对模型中的参数进行更新,提升模型进行分类时的准确性。
68.其中,在线学习是深度学习中模型的一种训练方法,它可以通过线上的数据在线更新模型,根据实时得到的数据来调整模型参数,并及时的捕获数据的变化,从而提高模型的更新频率。
69.在示例性的实施例中,在待监管数据的类别为异常数据的情况下,第一服务器10可以执行s180:确定待监管数据为目标数据,并生成关于目标数据的预警信息。
70.也就是说,在待监管数据的类别为异常数据的情况下,将被第一服务器10作为目标数据,并由第一服务器10生成对应的预警信息。由此,监管机构接收到上述预警信息后,便可以对目标数据进行针对性的处理。
71.本说明书实施例中,根据以往的历史待监管数据训练得到用于对待监管数据进行异常检测的分类模型,能够将在目标联盟链中获取的待监管数据进行分类,并生成针对于异常数据的预警信息。从而能够提升待监管数据处理的过程的正确性和权威性,减少监管报送时的舞弊现象,降低互联网消费金融公司的金融系统性风险,并提升互联网消费金融公司的合规水位。
72.参考图2所示的对目标数据进行处理的流程图。
73.s210,获取标注后的目标数据,其中,标注后的目标数据为根据目标数据的类别对目标数据进行标注得到的。
74.在示例性的实施例中,监管机构接收到针对上述目标数据的预警信息后,可以进一步地判断分类模型的输出结果是否正确,并重新对该目标数据进行人工标注,得到标注后的目标数据。
75.示例性的,若监管机构进行人工判断后,确定目标数据的实际类别为异常数据,则说明分类模型的输出结果是正确的,并将该目标数据标注为异常数据,例如,标注其标签为“0”。
76.而若监管机构进行人工判断后,确定目标数据的实际类别为正常数据,则说明分类模型的输出结果是错误的,那么监管机构将该目标数据标注为正常数据,例如,标注其标签为“1”。
77.示例性的,监管机构对目标数据进行标注后,由第一服务器10获取该标注后的目标数据。
78.s220,在标注后的目标数据的类别为异常数据的情况下,将标注后的目标数据输入至分类模型,以使分类模型根据标注后的目标数据进行对抗学习。
79.在示例性的实施例中,在标注后的目标数据的类别为异常数据的情况下,第一服务器10可以利用该数据使分类模型进行对抗学习(adversarial training)。
80.对抗学习通常是采用带有干扰内容的数据作为对抗样本(对抗数据),并通过对抗样本对模型进行训练,从而增强模型的稳健性和准确性。
81.因此,可以在标注后的目标数据中添加一些干扰内容(例如,与待监管数据无关的内容),或是将目标数据故意标注为正常数据,等等。本实施例中对分类模型进行对抗学习的方式不做限定。
82.s230,在标注后的目标数据的类别为正常数据的情况下,将标注后的目标数据输入至分类模型,以使分类模型根据标注后的目标数据进行在线学习。
83.在示例性的实施例中,在标注后的目标数据的类别为正常数据的情况下,第一服
务器10可以利用该数据使分类模型进行在线学习(online learning)。
84.本说明书实施例中,在目标数据的类别为异常数据的情况下,监管机构可以对结果进行判断并对目标数据进行标注:若目标数据的实际类别是异常数据,则将其进行标注,并通过分类模型根据标注后的异常数据进行对抗学习,从而提升分类模型对于异常数据的分类能力;若目标数据的实际类别是正常数据,则将其进行标注,并通过分类模型根据标注后的正常数据进行在线学习,并更新模型参数,从而提升分类模型的准确性。
85.参考图3所示的数据处理方法的场景图。以下对上述实施例进行总结。
86.在示例性的实施例中,如图3所示。总体来说,互联网消费金融公司(例如:互联网消费金融公司a、互联网消费金融公司b)将融资、借贷等事务活动中所产生的待监管数据,通过第二服务器11(例如:第二服务器11'、第二服务器11”)实时存储至目标联盟链12中。
87.第一服务器10(对应于监管机构)可以通过其中的处理模块对目标联盟链12中的待监管数据进行分析处理,以确定金融公司的相关风险和合规水位。并且,第一服务器10可以通过历史监管数据训练出分类模型,以通过该分类模型实时地对待监管数据进行分类,从而确定待监管数据为正常数据或异常数据。
88.在待监管数据为异常数据的情况下,还可以通过第一服务器10生成预警信息,从而使得监管机构能够及时对异常数据进行处理。
89.本说明书实施例所提供的数据处理方法中,基于区块链实现监管报送的流程,增强了监管报送的及时性,并增强了待监管数据的权威性,能够使得金融监管的有效度和时效性显著提高。
90.此外,还结合机器学习中的集成学习、对抗学习、在线学习等方法来训练和优化分类模型,能够对待监管数据进行有效的分类,从而减少待监管数据中的舞弊或错误数据所造成的监管不到位的问题,进一步地提升现有监管的监管效力,降低互联网消费金融公司的金融性系统风险。
91.下述为本说明书装置实施例,可以用于执行本说明书方法实施例。对于本说明书装置实施例中未披露的细节,请参照本说明书方法实施例。
92.其中,图4示出了根据本说明书一示例性的实施例提供的数据处理装置的结构图,该装置配置于第一服务器。
93.本说明书实施例中的数据处理装置400包括:建立模块401,接收模块402,确认模块403,分类模块404,以及生成模块405,其中:
94.建立模块401,用于:建立目标联盟链。
95.接收模块402,用于:接收第二服务器的数据存储请求,并对第二服务器进行身份验证。
96.确认模块403,用于:在第二服务器通过身份验证的情况下,对数据存储请求进行确认,以使第二服务器将待监管数据存储至目标联盟链。
97.分类模块404,用于:通过分类模型对存储至目标联盟链中的待监管数据进行分类,得到待监管数据的类别,其中,待监管数据包括事务数据、财务数据和征信数据中的一种或多种,类别包括异常数据和正常数据。
98.生成模块405,用于:在待监管数据的类别为异常数据的情况下,确定待监管数据为目标数据,并生成关于目标数据的预警信息。
99.其中,图5示出了根据本说明书另一示例性的实施例提供的数据处理装置的结构图。
100.可选的,上述装置还包括:第二获取模块406,输入模块407。
101.上述第二获取模块406,用于:获取标注后的目标数据,其中,标注后的目标数据为根据目标数据的类别对目标数据进行标注得到的;上述输入模块407,用于:在标注后的目标数据的类别为异常数据的情况下,将标注后的目标数据输入至分类模型,以使分类模型根据标注后的目标数据进行对抗学习;在标注后的目标数据的类别为正常数据的情况下,将标注后的目标数据输入至分类模型,以使分类模型根据标注后的目标数据进行在线学习。
102.一种可能的实现方式中,上述输入模块407具体用于:在标注后的目标数据中添加干扰内容,得到对抗数据;将对抗数据输入至分类模型,以使分类模型根据对抗数据进行对抗学习。
103.可选的,上述装置还包括:更新模块408。上述更新模块408,用于:在待监管数据的类别为正常数据的情况下,通过分类模型根据待监管数据进行在线学习,以对分类模型中的参数进行更新。
104.在示例性的实施例中,基于前述方案,存储在目标联盟链中的待监管数据包含身份标识。
105.可选的,上述装置还包括:分析处理模块409,确定模块410。上述分析处理模块409,用于:通过目标联盟链中的智能合约,对于包含目标身份标识的待监管数据进行分析处理,其中,分析处理包括下探处理和/或上卷处理;上述确定模块410,用于:根据分析处理的结果,确定关于目标身份标识的信用等级。
106.可选的,上述装置还包括:训练模块411。上述训练模块411,用于:通过已标注的历史监管数据对机器学习模型进行训练,得到分类模型。
107.一种可能的实现方式中,上述训练模块411具体用于:通过集成学习的方式,基于已标注的历史监管数据对机器学习模型进行训练,得到分类模型。
108.需要说明的是,上述实施例提供的数据处理装置在执行数据处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,因此对于本说明书装置实施例中未披露的细节,请参照本说明书上述目标词语检测模型的训练方法的实施例,这里不再赘述。
109.其中,图6示出了根据本说明书再一示例性的实施例提供的数据处理装置的结构图,该装置配置于第二服务器。
110.本说明书实施例中的数据处理装置600包括:获取模块610,发送模块620,以及存储模块630。
111.获取模块610,用于:获取待监管数据,其中,待监管数据包括事务数据、财务数据和征信数据中的一种或多种。
112.发送模块620,用于:向第一服务器发送数据存储请求,以使第一服务器对第二服务器进行身份验证,并在第二服务器通过身份验证的情况下,对数据存储请求进行确认。
113.存储模块630,用于:在第一服务器确认数据存储请求的情况下,将待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至目标联盟链中的待监管数据进行分类,得到待监管数据的类别,其中,类别包括异常数据和正常数据;并且,以使第一服务器在待监管数据的类别为异常数据的情况下,确定待监管数据为目标数据,并生成关于目标数据的预警信息。
114.需要说明的是,上述实施例提供的数据处理装置在执行数据处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,因此对于本说明书装置实施例中未披露的细节,请参照本说明书上述数据处理方法的实施例,这里不再赘述。
115.上述本说明书实施例序号仅仅为了描述,不代表实施例的优劣。
116.本说明书实施例还提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述任一实施例方法的步骤。
117.图7示意性示出了根据本说明书一示例性的实施例中终端的结构图。请参见图7所示,终端700包括有:处理器701和存储器702。
118.本说明书实施例中,处理器701为计算机系统的控制中心,可以是实体机的处理器,也可以是虚拟机的处理器。处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。
119.在本说明书实施例中,上述处理器701具体用于:
120.建立目标联盟链;接收第二服务器的数据存储请求,并对上述第二服务器进行身份验证;在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认,以使上述第二服务器将待监管数据存储至上述目标联盟链;通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种,上述类别包括异常数据和正常数据;在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
121.进一步地,在本说明书一个实施例中,在上述待监管数据的类别为异常数据的情况下,上述处理器701还用于:获取标注后的目标数据,其中,上述标注后的目标数据为根据上述目标数据的类别对上述目标数据进行标注得到的;在上述标注后的目标数据的类别为异常数据的情况下,将上述标注后的目标数据输入至上述分类模型,以使上述分类模型根据上述标注后的目标数据进行对抗学习;在上述标注后的目标数据的类别为正常数据的情况下,将上述标注后的目标数据输入至上述分类模型,以使上述分类模型根据上述标注后的目标数据进行在线学习。
122.可选的,上述处理器701具体用于:在上述标注后的目标数据中添加干扰内容,得到对抗数据;将上述对抗数据输入至上述分类模型,以使上述分类模型根据上述对抗数据进行对抗学习。
123.可选的,上述处理器701还用于:在上述待监管数据的类别为正常数据的情况下,通过上述分类模型根据上述待监管数据进行在线学习,以对上述分类模型中的参数进行更新。
124.在示例性的实施例中,基于前述方案,存储在上述目标联盟链中的待监管数据包含身份标识。
125.可选的,上述处理器701还用于:通过上述目标联盟链中的智能合约,对于包含目标身份标识的待监管数据进行分析处理,其中,上述分析处理包括下探处理和/或上卷处理;根据上述分析处理的结果,确定关于上述目标身份标识的信用等级。
126.可选的,上述处理器701还用于:通过已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型;上述通过已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型,包括:通过集成学习的方式,基于上述已标注的历史监管数据对机器学习模型进行训练,得到上述分类模型。
127.在本说明书实施例中,上述处理器701具体用于:
128.获取待监管数据,其中,上述待监管数据包括事务数据、财务数据和征信数据中的一种或多种;向第一服务器发送数据存储请求,以使上述第一服务器对上述第二服务器进行身份验证,并在上述第二服务器通过身份验证的情况下,对上述数据存储请求进行确认;在上述第一服务器确认上述数据存储请求的情况下,将上述待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至上述目标联盟链中的待监管数据进行分类,得到上述待监管数据的类别,其中,上述类别包括异常数据和正常数据;并且,以使上述第一服务器在上述待监管数据的类别为异常数据的情况下,确定上述待监管数据为目标数据,并生成关于上述目标数据的预警信息。
129.存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储终端、闪存存储终端。在本说明书的一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本说明书实施例中的方法。
130.一些实施例中,终端700还包括有:外围终端接口703和至少一个外围终端。处理器701、存储器702和外围终端接口703之间可以通过总线或信号线相连。各个外围终端可以通过总线、信号线或电路板与外围终端接口703相连。具体地,外围终端包括:显示屏704、摄像头705和音频电路706中的至少一种。
131.外围终端接口703可被用于将输入/输出(input/output,i/o)相关的至少一个外围终端连接到处理器701和存储器702。在本说明书的一些实施例中,处理器701、存储器702和外围终端接口703被集成在同一芯片或电路板上;在本说明书的一些其他实施例中,处理器701、存储器702和外围终端接口703中的任意一个或两个可以在单独的芯片或电路板上实现。本说明书实施例对此不作具体限定。
132.显示屏704用于显示用户界面(user interface,ui)。该ui可以包括图形、文本、图
标、视频及其它们的任意组合。当显示屏704是触摸显示屏时,显示屏704还具有采集在显示屏704的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏704还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在本说明书的一些实施例中,显示屏704可以为一个,设置终端700的前面板;在本说明书的另一些实施例中,显示屏704可以为至少两个,分别设置在终端700的不同表面或呈折叠设计;在本说明书的再一些实施例中,显示屏704可以是柔性显示屏,设置在终端700的弯曲表面上或折叠面上。甚至,显示屏704还可以设置成非矩形的不规则图形,也即异形屏。显示屏704可以采用液晶显示屏(liquid crystal display,lcd)、有机发光二极管(organic light-emitting diode,oled)等材质制备。
133.摄像头705用于采集图像或视频。可选的,摄像头705包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(virtual reality,vr)拍摄功能或者其它融合拍摄功能。在本说明书的一些实施例中,摄像头705还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
134.音频电路706可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。
135.电源707用于为终端700中的各个组件进行供电。电源707可以是交流电、直流电、一次性电池或可充电电池。当电源707包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
136.本说明书实施例中示出的终端结构框图并不构成对终端700的限定,终端700可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
137.在本说明书中,术语“第一”、“第二”等仅用于描述的目的,而不能理解为指示或暗示相对重要性或顺序;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本说明书中的具体含义。
138.本说明书的描述中,需要理解的是,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本说明书和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本说明书的限制。
139.本说明书实施例还提供了计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述实施例中的一个或
多个步骤。上述数据处理装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取存储介质中。
140.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(digital versatile disc,dvd))、或者半导体介质(例如,固态硬盘(solid state disk,ssd))等。
141.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
142.以上所述,仅为本说明书的具体实施方式,但本说明书的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本说明书的保护范围之内。因此,依本说明书权利要求所作的等同变化,仍属本说明书所涵盖的范围。
技术特征:
1.一种数据处理方法,其特征在于,应用于第一服务器,包括:建立目标联盟链;接收第二服务器的数据存储请求,并对所述第二服务器进行身份验证;在所述第二服务器通过身份验证的情况下,对所述数据存储请求进行确认,以使所述第二服务器将待监管数据存储至所述目标联盟链;通过分类模型对存储至所述目标联盟链中的待监管数据进行分类,得到所述待监管数据的类别,其中,所述待监管数据包括事务数据、财务数据和征信数据中的一种或多种,所述类别包括异常数据和正常数据;在所述待监管数据的类别为异常数据的情况下,确定所述待监管数据为目标数据,并生成关于所述目标数据的预警信息。2.根据权利要求1所述的数据处理方法,其特征在于,在所述待监管数据的类别为异常数据的情况下,所述方法还包括:获取标注后的目标数据,其中,所述标注后的目标数据为根据所述目标数据的类别对所述目标数据进行标注得到的;在所述标注后的目标数据的类别为异常数据的情况下,将所述标注后的目标数据输入至所述分类模型,以使所述分类模型根据所述标注后的目标数据进行对抗学习;在所述标注后的目标数据的类别为正常数据的情况下,将所述标注后的目标数据输入至所述分类模型,以使所述分类模型根据所述标注后的目标数据进行在线学习。3.根据权利要求2所述的数据处理方法,其特征在于,所述将所述标注后的目标数据输入至所述分类模型,以使所述分类模型根据所述标注后的目标数据进行对抗学习,包括:在所述标注后的目标数据中添加干扰内容,得到对抗数据;将所述对抗数据输入至所述分类模型,以使所述分类模型根据所述对抗数据进行对抗学习。4.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,所述方法还包括:在所述待监管数据的类别为正常数据的情况下,通过所述分类模型根据所述待监管数据进行在线学习,以对所述分类模型中的参数进行更新。5.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,存储在所述目标联盟链中的待监管数据包含身份标识;所述方法还包括:通过所述目标联盟链中的智能合约,对于包含目标身份标识的待监管数据进行分析处理,其中,所述分析处理包括下探处理和/或上卷处理;根据所述分析处理的结果,确定关于所述目标身份标识的信用等级。6.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,所述方法还包括:通过已标注的历史监管数据对机器学习模型进行训练,得到所述分类模型;所述通过已标注的历史监管数据对机器学习模型进行训练,得到所述分类模型,包括:通过集成学习的方式,基于所述已标注的历史监管数据对机器学习模型进行训练,得到所述分类模型。7.一种数据处理方法,其特征在于,应用于第二服务器,包括:获取待监管数据,其中,所述待监管数据包括事务数据、财务数据和征信数据中的一种或多种;
向第一服务器发送数据存储请求,以使所述第一服务器对所述第二服务器进行身份验证,并在所述第二服务器通过身份验证的情况下,对所述数据存储请求进行确认;在所述第一服务器确认所述数据存储请求的情况下,将所述待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至所述目标联盟链中的待监管数据进行分类,得到所述待监管数据的类别,其中,所述类别包括异常数据和正常数据;并且,以使所述第一服务器在所述待监管数据的类别为异常数据的情况下,确定所述待监管数据为目标数据,并生成关于所述目标数据的预警信息。8.一种数据处理装置,其特征在于,配置于第一服务器,包括:建立模块,用于:建立目标联盟链;接收模块,用于:接收第二服务器的数据存储请求,并对所述第二服务器进行身份验证;确认模块,用于:在所述第二服务器通过身份验证的情况下,对所述数据存储请求进行确认,以使所述第二服务器将待监管数据存储至所述目标联盟链;分类模块,用于:通过分类模型对存储至所述目标联盟链中的待监管数据进行分类,得到所述待监管数据的类别,其中,所述待监管数据包括事务数据、财务数据和征信数据中的一种或多种,所述类别包括异常数据和正常数据;生成模块,用于:在所述待监管数据的类别为异常数据的情况下,确定所述待监管数据为目标数据,并生成关于所述目标数据的预警信息。9.一种数据处理装置,其特征在于,配置于第二服务器,包括:获取模块,用于:获取待监管数据,其中,所述待监管数据包括事务数据、财务数据和征信数据中的一种或多种;发送模块,用于:向第一服务器发送数据存储请求,以使所述第一服务器对所述第二服务器进行身份验证,并在所述第二服务器通过身份验证的情况下,对所述数据存储请求进行确认;存储模块,用于:在所述第一服务器确认所述数据存储请求的情况下,将所述待监管数据存储至目标联盟链,以使第一服务器通过分类模型对存储至所述目标联盟链中的待监管数据进行分类,得到所述待监管数据的类别,其中,所述类别包括异常数据和正常数据;并且,以使所述第一服务器在所述待监管数据的类别为异常数据的情况下,确定所述待监管数据为目标数据,并生成关于所述目标数据的预警信息。10.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的数据处理方法,以及,实现如权利要求7所述的数据处理方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的数据处理方法,以及,实现如权利要求7所述的数据处理方法。12.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1至6中任一项所述的数据处理方法,以及,实现如权利要求7所述的数据处理方法。
技术总结
本说明书实施例提供了一种数据处理方法、装置、终端、计算机可读存储介质以及计算机程序产品。该方法应用于第一服务器,该方法包括:建立目标联盟链。接收第二服务器所发送的数据存储请求,并对第二服务器的身份进行验证,从而使得第二服务器在通过身份验证的情况下,将待管数据存储至目标联盟链中。其中,待监管数据包括事务数据、财务数据和征信数据中的一种或多种。通过分类模型将目标联盟链中存储的待监管数据进行分类,从而确定待监管数据的类别为异常数据或正常数据。在待监管数据的类别为异常数据的情况下,确定待监管数据为目标数据,并生成关于目标数据的预警信息。并生成关于目标数据的预警信息。并生成关于目标数据的预警信息。
技术研发人员:王诏 彭郢 舒满昌 江民钦 郭松鹭 陈森 黎文江 杨俊
受保护的技术使用者:重庆蚂蚁消费金融有限公司
技术研发日:2023.06.19
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
