基于联邦学习的信贷风险评估方法、装置、设备和介质与流程
未命名
07-26
阅读:118
评论:0
1.本技术涉及人工智能技术领域,特别是涉及一种基于联邦学习的信贷风险评估方法、装置、设备和介质。
背景技术:
2.随着人工智能技术的逐渐发展,可以通过构建人工智能模型用于进行信贷风险评估。通过对用户的信贷状况进行风险评估,进而可以根据风险评估结果确定用户的信贷风险。
3.传统的信贷风险评估方法基于数据的安全和隐私性通常只考虑单一银行的数据,基于该银行的数据进行训练得到可以进行信贷风险评估的评估模型。然而,传统的信贷风险评估方法存在数据量少,准确率低,模型质量不好的问题。
技术实现要素:
4.基于此,有必要针对上述技术问题,提供一种能够实现基于联邦学习的信贷风险评估方法、装置、设备和介质。
5.第一方面,本技术提供了一种基于联邦学习的信贷风险评估方法。所述方法包括:
6.分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
7.根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
8.根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
9.在其中一个实施例中,根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,包括:
10.根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;
11.确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
12.在其中一个实施例中,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据,包括:
13.根据第二样本数据的特征参数确定时序特征;
14.确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
15.在其中一个实施例中,确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据之后,包括:
16.对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;
17.基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
18.在其中一个实施例中,根据第一样本数据和更新后的第二样本数据得到评估模型,包括:
19.获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;
20.根据目标特征参数进行模型训练,得到评估模型。
21.在其中一个实施例中,该方法还包括:
22.获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;
23.根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
24.第二方面,本技术还提供了一种基于联邦学习的信贷风险评估装置。所述装置包括:
25.历史数据获取模块,用于分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
26.样本数据确定模块,用于根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
27.评估模型模块,用于根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
28.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
29.分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
30.根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
31.根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
32.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
33.分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
34.根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
35.根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
36.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
37.分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
38.根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
39.根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
40.上述基于联邦学习的信贷风险评估方法、装置、设备和介质,通过分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。本技术的评估方法通过与时间序列相关的特征参数,即通过时序特征对第二样本数据进行更新,得到更新后的第二样本数据,然后基于联邦学习采用第一样本数据和更新后的第二样本数据进行评估模型的训练,可以增加风险评估的数据,有利于提高评估模型对于信贷风险评估的准确率,并提高评估模型的质量。
附图说明
41.图1为一个实施例中信贷风险评估方法的应用环境图;
42.图2为一个实施例中信贷风险评估方法的流程示意图;
43.图3为一个实施例中信贷风险评估方法的判断流程示意图;
44.图4为一个实施例中基于联邦学习的信贷风险评估装置示意图;
45.图5为另一个实施例中样本数据确定模块420的模块示意图;
46.图6为一个实施例中计算机设备为服务器的内部结构图;
47.图7为一个实施例中计算机设备为终端的内部结构图。
具体实施方式
48.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
49.本技术实施例提供的基于联邦学习的信贷风险评估方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于
评估模型对用户标识进行风险评估。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
50.在一个实施例中,如图2所示,提供了一种基于联邦学习的信贷风险评估方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
51.步骤202,分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应。
52.其中,发起方是联邦学习中发起风险评估的一方,发起方建立评估模型,并需要同时通过参与方的历史信贷数据建立评估模型。参与方为联邦学习中提供历史信贷数据的一方,参与方提供的历史信贷数据可用于优化评估模型,以提高评估的准确性。
53.历史信贷数据是分别存储在发起方和参与方本地存储模块的,与信贷风险评估相关的数据集合。例如,历史信贷数据可以是用于对用户还款能力、消费习惯、资产状况等进行评估的数据,如信贷记录表、信贷申请表、用户信息表、企业资产表、用户行为表、还款记录表等。用户标识是用来唯一表示用户的标识信息。
54.用户标识可以是用户id、用户账号、用户的身份证号、用户的护照号等可以用来区分用户的信息。用户标识对应的历史信贷数据可以是通过用户标识索引获取到的。
55.示例性的,金融领域中银行可以对用户进行信贷风险评估,在业务或服务类型不同的银行甲和乙联合进行信贷风险评估的情况下,以发起方为甲银行,参与方为乙银行为例,甲银行发起信贷风险评估,获取到甲银行中关于甲和乙企业的用户信息表、信贷申请表、还款记录表,其中乙银行作为参与方提供了关于甲和乙企业的用户信息表、信贷记录表、企业资产表、用户行为表、还款记录表等。
56.步骤204,根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据。
57.其中,时序特征表示与时间序列有关的特征,本实施例的时序特征可以是与风险评估相关的、根据时间进行操作生成新特征的特征数据。获取样本数据的时序特征可以实现由历史数据预测未来数据。在评估模型还可以通过时序特征增加特征数量,提高评估的准确率。例如,在银行的用户消费记录表中,时序特征可以是根据用户七日内每日消费金额得到的每日平均消费金额,在银行的贷款还款历史记录表中,时序特征可以是贷款金额和还款金额,时序特征根据确定的时间范围可以计算出还款金额和贷款金额之比还款率,也就是根据贷款金额和还款金额可以计算出新的特征还款率。
58.示例性的,根据甲银行中关于甲企业的用户信息表和信贷申请表可以得到甲企业的名称和信贷额度,根据还款记录表还可以得到甲企业在多个时间段的还款金额,通过对甲、乙等企业的信息进行汇总可以得到一张包括企业名称、时间、信贷额度、还款金额等信息的第一样本数据。根据乙银行提供的甲企业的用户信息表可以得到甲企业的名称,根据企业资产表和用户行为表可以得到甲企业的资产情况和收入金额,根据提供的信贷记录表和还款记录表可以得到甲企业的贷款还款历史记录,通过对甲、乙等企业的信息进行汇总可以得到一张具备企业名称、时间、收入金额、资产情况、贷款还款历史记录等信息的第二
样本数据,乙银行确定其第二样本数据中的时序特征为第二样本数据中甲企业的贷款还款历史记录,可以根据甲企业的贷款还款历史记录得到甲企业的逾期还款的天数,将得到的逾期天数作为新的特征加入到第二样本数据中,可以得到更新后的第二样本数据。
59.进一步的,时序特征还可以包含一些非时间序列的信息,比如,企业的行业数据、规模数据、地理位置数据等,从而进一步提高评估的准确性。
60.步骤206,根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
61.其中,评估模型是基于样本数据根据机器学习算法构建的模型,在构建评估模型时,样本数据表示为评估模型的训练数据。例如,可以基于纵向联邦学习对发起方和参与方共同用户的历史信贷数据进行训练得到本实施例的评估模型,训练得到的模型可以用于对该发起方和参与方的共同用户进行信贷风险评估。
62.示例性的,在构建评估模型时,可以通过纵向联邦学习的方式结合第一样本数据和更新后的第二样本数据进行训练。以前述示例为例,结合甲、乙等企业的历史信贷数据进行训练,得到评估模型,并通过评估模型可以对未来甲、乙企业的信贷风险进行风险评估。
63.上述基于联邦学习的信贷风险评估方法中,通过分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。本技术的评估方法通过与时间序列相关的特征参数,即通过时序特征对第二样本数据进行更新,得到更新后的第二样本数据,然后基于联邦学习采用第一样本数据和更新后的第二样本数据进行评估模型的训练,可以增加风险评估的数据,有利于提高评估模型对于信贷风险评估的准确率,并提高评估模型的质量。
64.在一个实施例中,根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,包括:根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
65.其中,时间参数是历史信贷数据中用户标识对应的,产生信贷行为的时间。特征参数可以是历史信贷数据中用户标识对应的用户账户信息或信贷信息,基准参数可以是用于定位历史信贷数据表中基础参数对应的具有相同位置参数的其他数据,例如处于相同行、相同列、相同表格中的数据。
66.示例性的,根据甲银行的历史信贷数据可以得到第一样本数据的特征参数包括信贷额度和还款金额,根据乙银行的历史信贷数据可以得到第二样本数据的特征参数包括收入金额、资产情况和贷款还款历史记录,确定企业名称和时间为第一样本数据和第二样本数据的基准参数。
67.例如,在甲银行的历史信贷数据中记录有甲和乙企业在2022年2月1日和5月1日的数据,在乙银行的历史信贷数据中记录有甲和乙企业在2022年3月15日的数据,丙企业在2022年5月1日的数据,确定甲、乙企业和对应的时间为第一数据样本和第二数据样本的基准参数,进行样本对齐,得到第一数据样本和第二数据样本。
68.本实施例中,针对各方历史信贷数据中复杂的数据集,通过用户标识和时间参数作为基准参数可以快速得到第一样本数据和第二样本数据,实现了原始数据的简单而高效的预处理。
69.在一个实施例中,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据,包括:根据第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
70.其中,时序维度可以是对时序特征进行计算等操作的时间范围。例如,在时序特征为还款金额和贷款金额的情况下,获取到用户标识的该时序特征对应的时间参数集中在近两年,可以对两年内该用户标识对应的还款金额和贷款金额进行计算,两年内的时间范围即为该情况下的时序维度。
71.示例性的,第二数据样本的特征参数包括收入金额、资产情况和贷款还款历史记录,其中收入金额和贷款还款历史记录都是与风险评估相关的特征参数,并且能够根据时间范围计算出收入总金额、贷款和还款的总金额、还款和贷款总金额之比即还款率等新的特征参数,得到时序特征可以是收入金额和贷款还款历史记录,关于贷款还款历史记录,基于对甲企业前一年的贷款和还款记录有利于风险评估效果的考虑,可以确定一整年为该时序特征的时序维度,可以通过对前一年甲企业的贷款和还款金额和时间计算出甲企业的逾期天数,可以根据还款总金额和贷款总金额之比计算出甲企业的还款率,将计算出的逾期天数和还款率作为新的特征参数加入到第二数据样本中,对第二样本数据的特征参数进行更新得到更新后的第二样本数据。
72.在本实施例中的时序特征计算方法中,时序特征能够基于历史数据预测未来的数据趋势,对于信贷风险评估具有重要意义。将时序特征添加到参与方的第二样本数据中进行训练,可以提高信用风险评估的准确率,也可以提高评估模型的质量。
73.在其中一个实施例中,确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据之后,包括:对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
74.示例性的,在联邦学习的过程中,基于对发起方和参与方数据隐私性的考虑,发起方与参与方的数据不会互相流通,可以对第一样本数据和第二样本数据加密,又考虑到联合多方之间共同用户标识的不同特征参数进行联邦学习才有意义,可以基于加密后的第一样本数据和第二样本数据进行对比,确定共同的用户标识然后进行样本对齐,再使用样本对齐后的第一样本数据和第二样本数据进行机器学习建模。
75.本实施例中,实现了第一样本数据和第二样本数据的加密和样本对齐,保护了联邦学习过程中各方的数据隐私性。
76.在其中一个实施例中,根据第一样本数据和更新后的第二样本数据得到评估模型,包括:获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型。
77.示例性的,在不同银行之间可能具有共同企业的不同特征参数,例如在甲银行的第一样本数据中关于甲乙企业的特征参数包括信贷额度、收入金额和还款金额,乙银行更
新后的第二样本数据中关于甲乙企业的特征参数包括收入金额、资产情况、贷款还款历史记录、逾期天数和逾期率,可以得到不同的特征参数包括信贷额度、资产情况、逾期天数和逾期率,可以采用纵向联邦学习的方式进行训练,纵向联邦学习是指联合多方共同样本的不同特征参数进行联邦学习,即各方的训练数据是纵向划分的,根据不同的特征参数确定目标特征参数包括信贷额度、资产情况、逾期天数和逾期率,根据用户标识和时间对应的目标特征参数的数据进行数据训练,可以得到评估模型。
78.由于本实施例中不同银行之间的历史信贷数据的分布情况为纵向分布,在进行联邦学习时主要是根据不同特征参数的数据进行训练。而横向联邦学习的情况下主要是不同银行之间用户重叠不高而特征高度重叠,由于不同类型银行一般具有不同的业务方向,其历史信贷数据之间的主要是特征参数的区别。也就是说,对不同类型的银行进行联邦训练主要获取的是不同特征参数。因此,本实施例采用纵向联邦学习的方式进行数据训练,相比横向联邦学习的方式,本实施例的训练方法更加有利于不同类型银行之间的联邦学习,更加符合训练样本的分布情况,有利于充分利用发起方和参与方之间不同的历史信贷数据的特征,提高信贷风险评估的准确率。
79.在其中一个实施例中,获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;根据相关性系数或重要性系数更新特征参数,得到更新后的第二样本数据。
80.其中,相关性系数表示更新后的第二样本数据的特征参数与信贷风险的相关性,重要性系数表示更新后的第二样本数据的特征参数的重要性。相关性系数和重要性系数是指根据特征相关性分析特征参数与信贷分析的相关性和根据重要性分析判断特征参数的重要性得到的结果。
81.示例性的,获取到更新后的第二样本数据中的逾期天数、还款率、收入总金额、贷款和还款的总金额等特征参数,计算其与信贷风险之间的相关性系数和重要性系数,得到逾期天数和还款率的系数高,而收入总金额、贷款和还款总金额的系数低,说明收入总金额、贷款和还款总金额对于评估模型的效果帮助不大,可以删除收入总金额、贷款和还款总金额这两个特征参数,得到第二次更新后的第二样本数据。
82.本实施例中,通过特征分析,可以获取到对风险评估更相关的特征进行评估模型的训练,有利于提高信贷风险评估的准确率和模型的质量。
83.图3所示为一个实施例中基于联邦学习的信贷风险评估方法的流程示意图,如图3所示,在一个实施例中,以发起方为甲银行,参与方为乙银行为例,信贷风险评估方法包括如下步骤:
84.步骤302,分别获取风险评估的甲银行和乙银行的历史信贷数据,历史信贷数据与用户标识对应。
85.步骤304,根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数,确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
86.示例性的,根据甲银行的历史信贷数据得到甲和乙企业对应信贷行为的时间和特征参数,该特征参数包括信贷额度、还款金额,根据乙银行的历史信贷数据得到甲、乙和丙企业对应信贷行为的时间参数和特征参数,该特征参数包括收入金额、资产情况、贷款还款
历史记录,确定企业名称和时间为第一样本数据和第二样本数据的表格的主键,得到一张具备用户名称、时间、信贷额度、还款金额等信息的甲银行特征宽表和一张具备用户名称、时间、收入金额、资产情况、贷款还款历史记录等信息的乙银行特征宽表。
87.步骤306,对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
88.示例性的,对甲银行和乙银行特征宽表进行加密,得到加密后的甲银行特征宽表和乙银行特征宽表,根据甲银行和乙银行共同的用户和时间进行样本对齐,得到只有甲和乙企业信贷行为的甲银行和乙银行特征宽表。
89.步骤308,根据样本对齐后的第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度得到新特征参数,获取新特征参数与信贷风险的相关性系数,并获取新特征参数的重要性系数;根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
90.示例性的,获取到乙银行特征宽表的特征参数包括收入金额、资产情况、贷款还款历史记录,其中,可以确定收入金额和贷款还款历史记录为时序特征,时序维度为一年,根据时序维度对时序特征进行计算可以得到收入总金额、还款总金额、逾期天数和还款率,计算收入总金额、还款总金额、逾期天数和还款率与风险评估之间的相关性系数以及其重要性系数,得到逾期天数和还款率与风险评估的相关性系数和重要性系数高,而收入总金额和还款总金额的相关性和重要性系数低,将逾期天数和还款率加入乙银行特征宽表中,得到更新后的乙银行特征宽表。
91.步骤310,获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型,基于评估模型对用户标识进行风险评估。
92.获取到甲银行特征宽表中特征参数包括信贷额度和还款金额,乙银行特征宽表中特征参数包括收入金额、资产情况、贷款还款历史记录、逾期天数和还款率,确认不同的特征参数包括信贷额度、收入金额、资产情况、逾期天数和还款率,根据以上特征参数进行模型训练,可以得到评估模型,基于评估模型可以对甲和乙企业进行风险评估。
93.本实施例中,有利于提高评估模型对于信贷风险评估的数据量和准确率,并提高评估模型的质量。
94.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
95.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的基于联邦学习的信贷风险评估方法的基于联邦学习的信贷风险评估装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于联邦学习的信贷风险评估装置实施例中的具体限定可以参见上文中对于基于联邦学习的信贷
风险评估方法的限定,在此不再赘述。
96.在一个实施例中,如图4所示,提供了一种基于联邦学习的信贷风险评估装置400示意图,包括:历史数据获取模块410、样本数据确定模块420和评估模型模块430,其中:
97.历史数据获取模块410,用于分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;
98.样本数据确定模块420,用于根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;
99.评估模型模块430,用于根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
100.在一个实施例中,如图5所示,提供了一种样本数据确定模块420的模块示意图,样本数据确定模块420包括数据预处理模块422,数据预处理模块422用于根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
101.在一个实施例中,数据预处理模块422还用于根据第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
102.在一个实施例中,数据预处理模块422还用于对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
103.在一个实施例中,数据预处理模块422还用于获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型。
104.在一个实施例中,该装置还用于获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
105.上述基于联邦学习的信贷风险评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
106.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于联邦学习的信贷风险评估数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种
基于联邦学习的信贷风险评估方法。
107.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于联邦学习的信贷风险评估方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
108.本领域技术人员可以理解,前述结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
109.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
110.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,包括:根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
111.在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据,包括:根据第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
112.在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据之后,包括:对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
113.在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据第一样本数据和更新后的第二样本数据得到评估模型,包括:获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型。
114.在一个实施例中,处理器执行计算机程序时还实现以下步骤:用于获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
115.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
116.在一个实施例中,计算机程序被处理器执行时实现以下步骤:根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,包括:根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
117.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据,包括:根据第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
118.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据之后,包括:对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
119.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据第一样本数据和更新后的第二样本数据得到评估模型,包括:获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型。
120.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:用于获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
121.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。
122.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,包括:根据历史信贷数据得到用户标识对应的时间参数和用于表征信贷风险的特征参数;确定用户标识和时间参
数为基准参数,通过基准参数确定第一样本数据和第二样本数据。
123.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据,包括:根据第二样本数据的特征参数确定时序特征;确定时序特征的时序维度,根据时序维度对第二样本数据的特征参数进行更新,得到更新后的第二样本数据。
124.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定用户标识和时间参数为基准参数,通过基准参数确定第一样本数据和第二样本数据之后,包括:对第一数据样本和第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于基准参数对加密后的第一样本数据和第二样本数据进行样本对齐。
125.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:处理器执行计算机程序时还实现以下步骤:根据第一样本数据和更新后的第二样本数据得到评估模型,包括:获取第一样本数据和更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据目标特征参数进行模型训练,得到评估模型。
126.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:用于获取更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取更新后的第二样本数据的特征参数的重要性系数;根据相关性系数或重要性系数更新第二样本数据,得到更新后的第二样本数据。
127.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
128.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistiverandomaccessmemory,mram)、铁电存储器(ferroelectricrandomaccessmemory,fram)、相变存储器(phasechangememory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
129.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
130.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
技术特征:
1.一种基于联邦学习的信贷风险评估方法,其特征在于,所述方法包括:分别获取风险评估的发起方和参与方的历史信贷数据,所述历史信贷数据与用户标识对应;根据所述历史信贷数据获取所述发起方对应的第一样本数据和所述参与方对应的第二样本数据,确定所述第二样本数据的时序特征,根据所述时序特征对所述第二样本数据进行更新,得到更新后的第二样本数据;根据所述第一样本数据和所述更新后的第二样本数据得到评估模型,基于所述评估模型对所述用户标识进行风险评估。2.根据权利要求1所述的方法,其特征在于,所述根据所述历史信贷数据获取所述发起方对应的第一样本数据和所述参与方对应的第二样本数据,包括:根据所述历史信贷数据得到所述用户标识对应的时间参数和用于表征信贷风险的特征参数;确定所述用户标识和所述时间参数为基准参数,通过所述基准参数确定所述第一样本数据和所述第二样本数据。3.根据权利要求2所述的方法,其特征在于,所述确定所述第二样本数据的时序特征,根据所述时序特征对所述第二样本数据进行更新,得到更新后的第二样本数据,包括:根据所述第二样本数据的特征参数确定所述时序特征;确定所述时序特征的时序维度,根据所述时序维度对所述第二样本数据的所述特征参数进行更新,得到所述更新后的第二样本数据。4.根据权利要求2所述的方法,其特征在于,所述确定所述用户标识和所述时间参数为基准参数,通过所述基准参数确定所述第一样本数据和所述第二样本数据之后,包括:对所述第一数据样本和所述第二样本数据进行加密,得到加密后的第一样本数据和第二样本数据;基于所述基准参数对所述加密后的第一样本数据和第二样本数据进行样本对齐。5.根据权利要求2所述的方法,其特征在于,根据所述第一样本数据和所述更新后的第二样本数据得到评估模型,包括:获取所述第一样本数据和所述更新后的第二样本数据中不同的特征参数,得到目标特征参数;根据所述目标特征参数进行模型训练,得到评估模型。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述更新后的第二样本数据的特征参数与信贷风险的相关性系数,并获取所述更新后的第二样本数据的特征参数的重要性系数;根据所述相关性系数或所述重要性系数更新所述第二样本数据,得到更新后的第二样本数据。7.一种基于联邦学习的信贷风险评估装置,其特征在于,所述装置包括:历史数据获取模块,用于分别获取风险评估的发起方和参与方的历史信贷数据,所述历史信贷数据与用户标识对应;样本数据确定模块,用于根据所述历史信贷数据获取所述发起方对应的第一样本数据和所述参与方对应的第二样本数据,确定所述第二样本数据的时序特征,根据所述时序特
征对所述第二样本数据进行更新,得到更新后的第二样本数据;评估模型模块,用于根据所述第一样本数据和所述更新后的第二样本数据得到评估模型,基于所述评估模型对所述用户标识进行风险评估。8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
技术总结
本申请涉及一种基于联邦学习的信贷风险评估方法、装置、设备和介质,通过分别获取风险评估的发起方和参与方的历史信贷数据,历史信贷数据与用户标识对应;根据历史信贷数据获取发起方对应的第一样本数据和参与方对应的第二样本数据,确定第二样本数据的时序特征,根据时序特征对第二样本数据进行更新,得到更新后的第二样本数据;根据第一样本数据和更新后的第二样本数据得到评估模型,基于评估模型对用户标识进行风险评估。该方法有利于提高评估模型对于信贷风险评估的数据量和准确率,并提高评估模型的质量。高评估模型的质量。高评估模型的质量。
技术研发人员:赵少东 黄志伟 陈彬
受保护的技术使用者:深圳供电局有限公司
技术研发日:2023.04.14
技术公布日:2023/7/25
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
