基于目标模型进行联合预测的方法和装置与流程
未命名
10-09
阅读:120
评论:0
1.本说明书一个或多个实施例涉及机器学习领域,尤其涉及在保护各方隐私的情况下,基于目标模型进行联合预测的方法和装置。
背景技术:
2.在互联网大数据场景下,各个平台沉淀并积累了大量的数据。例如,电子支付平台拥有商户的交易流水数据,电子商务平台存储有商户的销售数据,银行机构拥有商户的借贷数据。为了增大数据价值,存在多个平台联合进行处理数据的需求。例如,以上的电子支付平台,电子商务平台和银行机构,有意向联合进行机器学习,训练出商户分类模型。
3.然而,各方存储的数据中往往涉及用户的隐私数据。目前,业界对于数据安全和个人隐私越来越重视,国内近来也紧密出台了多项数据保护相关政策法规。因此,在多方联合进行数据处理过程中保护各方隐私安全,成为关注的要点。
4.在联合进行模型训练和使用模型进行联合预测的场景中,取决于不同的模型结构和模型算法,需要相应的方式对各个参与分的隐私数据进行保护。近年来,利用因子分解机fm机制的模型,在许多场景下取得了优异的效果。针对这样的模型,希望能有改进的方案,可以在联合预测过程中保护数据安全,并提升执行性能。
技术实现要素:
5.本说明书一个或多个实施例描述了一种基于目标模型进行联合预测的方法和装置,针对基于fm模型的目标模型,可以在保护各方数据隐私安全的情况下,进行准确的联合预测。
6.根据第一方面,提供了一种基于目标模型进行联合预测的方法,所述目标模型包括基于因子分解机的第一子模型,所述联合预测涉及第一方和第二方,所述第一方持有目标对象的若干项第一特征,所述第二方持有所述目标对象的其他特征,所述方法通过第一方执行,包括:
7.获取第一子模型的二阶组合参数中针对各项第一特征各自的k维参数;
8.本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和;
9.将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,使其融合所述第一中间结果与来自所述第二方的第二中间结果,得到所述第一子模型的输出。
10.根据一种实施方式,上述方法还包括,获取所述第一子模型的线性组合参数中针对各项第一特征的第一线性参数,以及针对第一方的第一偏移参数;其中,所述第二中间项还包括,所述第一偏移参数,以及各项第一特征的特征值与其对应的所述第一线性参数的线性组合结果。
11.在一个实施例中,所述第一中间结果包括所述第一中间项和所述第二中间项;上述将第一中间结果发送给目标方,具体为:将所述第一中间结果发送给所述第二方。
12.在另一实施例中,将第一中间结果发送给目标方,具体包括:基于所述第一中间项和所述第二中间项添加满足差分隐私的噪声数据,作为所述第一中间结果;将所述第一中间结果发送给所述第二方。
13.在又一实施例中,将第一中间结果发送给目标方,具体包括:对所述第一中间项和第二中间项进行秘密分享的分片,将分配给其他方的分片作为所述第一中间结果;将所述第一中间结果发送给所述第二方,从而与第二方进行秘密分享下的多方安全计算mpc。
14.根据一种实施方式,将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,包括:将所述第一中间结果发送给第三方,所述第三方还从所述第二方接收所述第二中间结果。
15.在一种实现方式中,所述目标模型还包括第二子模型,所述方法还包括:对所述第一特征进行与所述第二子模型对应的目标处理,得到第一子结果;将所述第一子结果发送给所述目标方。
16.根据第二方面,提供了一种基于目标模型进行联合预测的装置,所述目标模型包括基于因子分解机的第一子模型,所述联合预测涉及第一方和第二方,所述第一方持有目标对象的若干项第一特征,所述第二方持有所述目标对象的其他特征,所述装置部署在第一方中,包括:
17.获取单元,配置为获取第一子模型的二阶组合参数中针对各项第一特征各自的k维参数;
18.计算单元,配置为本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和;
19.发送单元,配置为将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,使其融合所述第一中间结果与来自所述第二方的第二中间结果,得到所述第一子模型的输出。
20.根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。
21.根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
22.在本说明书的实施例中,提出一种针对基于fm模型的目标模型进行联合预测的方案,其中,任意参与方获取fm模型的二阶组合参数中针对本方特征的k维参数后,本地计算第一中间项和第二中间项,其中第一中间项和第二中间项均为本方特征值与k维参数的乘积的进一步运算。然后可将基于第一中间项和第二中间项得到的中间结果发送给目标方,使其融合第一中间结果与来自另一方的中间结果,得到fm模型的输出。如此,可以在保护各方数据隐私安全的情况下,进行准确的联合预测,解决了fm模型的处理过程中特征交叉运算带来的数据安全问题。
附图说明
23.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
24.图1示出根据一个实施例的fm模型的结构示意图;
25.图2示出根据一个实施例的deepfm模型的结构示意图;
26.图3示出根据一个实施例的基于目标模型进行联合预测的方法流程图;
27.图4示出deepfm模型运算过程中的维度变化示意图;
28.图5a和图5b分别示出两种交互场景;
29.图6示出根据一个实施例的联合预测装置的结构示意图。
具体实施方式
30.下面结合附图,对本说明书提供的方案进行描述。
31.在多种技术场景中,因子分解机fm(factorization machine)模型由于考虑了特征之间的关联关系,在多项预测任务中取得了优异的效果。因子分解机fm的提出基于二阶多项式回归模型,其中在常规线性回归的基础上,添加了特征的二阶组合,及两两组合项。二阶多项式回归模型的计算方式如以下公式(1)所示:
[0032][0033]
其中,n代表样本的特征项数量,xi是第i项特征的特征值;w0,wi,w
ij
是模型参数。则组合特征的参数一共有n2个。
[0034]
在此基础上,通过对特征关系的向量化,得到fm模型。具体的,可以将公式(1)中二项式参数w
ij
组成一个对称矩阵w。根据cholesky分解,将矩阵w分解为:w=vv
t
,矩阵v的第j列即为第j项特征对应的隐向量。如此,可以将每个参数w
ij
分解为:
[0035]wij
=《vi,vj》
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0036]
其中,《vi,vj》表示向量vi与vj的内积,又可写成viv
jt
。
[0037]
根据公式(2),可以将公式(1)改写为公式(3),即为fm模型的计算公式:
[0038][0039]
(3)式中,vi是第i项特征对应的隐向量或称为参数向量,隐向量的维度为k,k《《n。
[0040]
图1示出根据一个实施例的fm模型的结构示意图。如图1所示,样本的多个特征项可以被编码为向量形式(例如,通过one-hot编码),此时一般可以得到稀疏的编码向量。然后,一方面,可以对各个特征项进行一阶线性组合运算,即,计算公式(3)中的前2项。另一方面,在隐向量空间,即前述的k维空间,对各个特征性进行二阶组合运算,即,计算公式(3)中的最后一项。接着,对一阶运算结果和二阶运算结果求和,得到模型的计算结果y。后续可以直接输出该结果y作为模型预测结果,也可以基于该结果y进行诸如分类等进一步处理。
[0041]
fm模型既可以单独使用,也可以与其他模型结合起来,组成一个综合模型。例如,
将fm模型与深度神经网络dnn结合起来,可以组成deepfm模型。
[0042]
图2示出根据一个实施例的deepfm模型的结构示意图。对比图1可知,deepfm模型包括图1所示的fm模型作为一个子模型,此外还包括深度神经网络dnn作为另一子模型。样本的各个特征项的编码向量拼接起来,输入dnn,在其中进行网络处理,得到的结果与fm模型的计算结果融合起来,用于对样本进行分类或其他预测。上述deepfm模型结合了fm模型和深度神经网络模型的优势,可以同时提升低维和高维的特征,具有很好的综合预测性能。
[0043]
根据场景特点和样本特点,fm模型也可以与其他模型相组合,得到其他基于fm模型的综合模型。例如,当样本包含一些时空综合特征时,可以将例如卷积神经网络cnn,基于注意力的神经网络等,与fm模型相结合,在此不做限制。
[0044]
对于包含了fm模型的目标模型来说,其处理过程中需要进行特征的二阶交叉运算。在多方联合进行模型处理的情况下,这将会带来额外的困难。具体的,在典型的数据纵向分布的情况下,多个参与方,例如alice和bob,各自拥有同一样本的不同特征部分。fm模型中特征的二阶交叉运算要求两方的特征数据之间进行组合运算。而样本的特征数据往往涉及用户隐私,是参与方需保密的机密数据,不能直接进行运算。因此,基于fm模型的模型处理过程,对于纵向数据分布的多个参与方的联合运算,带来数据安全上的挑战和困难。
[0045]
为了解决上述问题,在本说明书的实施例中提出一种方案,可以针对基于fm模型的目标模型,在保护各方数据隐私安全的情况下,进行准确的联合预测。
[0046]
下面首先描述本说明书实施例方案的原理分析。
[0047]
为了更清晰发掘二阶特征交叉项的运算特点,可以对公式(3)中最后一项,即二阶特征交叉项,进行如下化简:
[0048][0049]
其中的第2步,将向量内积《vi,vj》展开成向量元素乘积和的形式,其中v
i,f
表示k维向量vi中的第f维元素。
[0050]
通过以上化简,fm模型的计算公式可以转化为如下的公式(5):
[0051][0052]
可以看到,公式(5)的计算方式中消去了vj。
[0053]
在两个参与方进行联合预测的情况下,两个参与方a和b各自拥有一部分特征项,例如,参与方a拥有a项特征,参与方b拥有b项特征,这两部分特征共同构成前述的n项特征,
即n=a+b。在该情况下,公式(5)又可以继续转化为公式(6):
[0054][0055]
由此,在fm模型的二阶特征交叉组合计算中,可以通过上述公式(6),将参与方a的特征计算部分与参与方b的特征计算部分分离出来。
[0056]
基于以上分析,提出两方联合进行模型预测的方案。下面详细描述该方案的具体实施方式。
[0057]
图3示出根据一个实施例的基于目标模型进行联合预测的方法流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如前所述,该目标模型包括基于因子分解机fm的第一子模型。并且,该联合预测方法涉及两个参与方,以下成为第一方a和第二方b。两个参与方各自持有目标对象的一部分特征。具体的,第一方a持有目标对象的若干项(记为a项)第一特征,第二方b持有该目标对象的至少一项(记为b项)第二特征。典型的,目标对象的特征属于各个参与方的隐私数据。
[0058]
在一个具体实施例中,上述目标对象为用户。第一方a例如可以是电子支付平台,持有用户的支付相关特征,例如历史支付总额,最近一次支付的金额,最大支付金额,等等。第二方b例如可以是银行机构,持有用户的信用相关特征,例如,信用评级,信用卡数量,透支额度,等等。
[0059]
在其他实施例中,上述目标对象也可以是其他分析对象,例如,商品或物品,互联网中的事件,待推荐的内容,等等。并且,上述目标对象既可以是单个对象,也可以包括一批多个对象。
[0060]
图3所示的方法流程通过两方中任意一方执行,下面以第一方a作为执行主体为例进行描述。为了与第二方联合进行模型预测,如图3所示,首先在步骤31,获取第一子模型(fm模型)的二阶组合参数中针对各项第一特征各自的k维参数。
[0061]
如前所述,fm模型通过公式(3)或(5)计算样本对象对应的预测值y,其中,w0,wi,以及各个vi(其中i从1到n)是模型参数。这些参数的参数值可以通过模型训练而确定。因此,在预测阶段,可以直接获取已经确定的参数值。在上述步骤31中,第一方a需获取fm模型中针对各项第一特征的参数值,这些参数值包括,二阶组合参数中针对各项第一特征各自的k维参数,也就是,公式(6)中的vi,其中i是从1到a,以表示针对a项第一特征。当然,第一方a还需获取针对第一特征的一阶参数,包括,针对第一特征的线性参数和偏移参数,也就是公式(6)中的w
a0
,wi,其中i是从1到a。
[0062]
之后,在步骤33,第一方计算本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与其对应的各个维度参数值的乘积的平方之和。
[0063]
根据一个示例,上述第一中间项m1可以表示为:
[0064][0065]
其中,xi是第i项第一特征的特征值,v
i,f
是第i项第一特征对应的k维参数向量vi中
的第f维参数值。因此,m1包括f取从1到k的k个维度值时分别得到的k个和值。
[0066]
根据一个示例,上述第二中间项m2可以表示为:
[0067][0068]
根据公式(8),第二中间项m2为各项第一特征与其对应的各个维度参数值的平方之和。
[0069]
在一个实施例中,第一方还本地计算第三中间项m3,其涉及针对第一特征的偏移参数,以及各项第一特征的特征值与其对应的线性参数的线性组合结果。具体的,在一个例子中,第三中间项可以表示为:
[0070][0071]
在另一实施例中,第一方基于组合系数,将公式(9)的一阶线性结果和公式(8)的平方和组合在一起,作为第二中间项m2。在该实施例中,第二中间项可以表示为:
[0072][0073]
于是,在步骤35,第一方基于第一中间项m1和第二中间项m2得到第一中间结果,并将第一中间结果发送给目标方,使其融合该第一中间结果与来自第二方的第二中间结果,得到fm模型的输出。
[0074]
可以理解,在第二中间项采用公式(9)形式的情况下,第一中间结果基于第一中间项和第二中间项确定;在第二中间项采用公式(8)形式的情况下,第一中间结果基于第一中间项、第二中间项以及第三中间项确定。下面以公式(9)形式的第二中间项为例说明。
[0075]
图4示出deepfm模型运算过程中的维度变化示意图。图4中的b表示批次大小batchsize,即一个批次中的样本数量,m表示每个样本的特征项数目,k为二阶组合时隐向量(或参数向量)的维度。如此,二阶运算过程中,处理的数据维度为b*m*k,经过二阶运算,得到的结果维度为b*k*1。这部分结果与一阶运算结果(维度为b*1)组合,作为fm部分的结果。
[0076]
参考图4可知,第一方a二阶部分处理数据的维度为batchsize*a*k,其中batchsize为前述目标对象的数目。经过前述运算,可以得出,第一中间项的维度为batchsize*k;在第二中间项采用公式(9)形式的情况下,其结果的维度为batchsize*1。当目标对象为单个对象时,第一中间项的维度为k(即包括k个中间值),第二中间项的维度为1。
[0077]
由此可知,如此得到的第一中间项和第二中间项,不仅隐去了特征值的信息,还隐去了特征维度的信息。在合理时间内,通过第一中间项和第二中间项难以反推出各个特征值xi的信息。因此,直接将第一中间项和第二中间项作为第一中间结果发送给其他方,并不会泄露隐私数据。
[0078]
然而,为了进一步增强隐私保护强度,在一些实施方式中,对第一中间项和第二中间项进行隐私增强处理,作为第一中间结果。
[0079]
具体的,在一个实施例中,在第一中间项m1和第二中间项m2基础上,添加满足差分隐私的噪声数据,作为第一中间结果。在一个示例中,在第一中间项m1上添加噪声,得到第一加噪中间项m
′
1,即:
[0080][0081]
公式(11)中,表示拉普拉斯随机噪声,其中心为0,分布参数为其中δf1表示第一中间项m1的敏感度,可以定义为可能的最大值和最小值之差,ε1为隐私预算。
[0082]
在第二中间项m2上添加噪声,得到第二加噪中间项m
′
2,即:
[0083][0084]
公式(12)中,δf2表示第二中间项m2的敏感度,ε2为隐私预算。以上公式(11)和(12)是基于拉普拉斯机制描述的,在其他实施例中,还可以基于高斯机制添加噪声。
[0085]
在添加噪声的情况下,第一中间结果包括第一加噪中间项m
′
1和第二加噪中间项m
′
2。
[0086]
在另一实施例中,对所述第一中间项和第二中间项进行秘密分享的分片,将各个分片作为所述第一中间结果。
[0087]
具体的,第一方a可以部署有密态引擎,该密态引擎中部署有若干预定的多方安全计算mpc的算法协议,可以进行若干安全计算,例如安全乘法,安全加法等。在一个例子中,可以基于秘密分享实现mpc。在此情况下,第一方将第一中间项和第二中间项送入密态引擎,在其中进行安全分片,得到第一中间项和第二中间项的多个分片,其中包括本方持有的分片,和分配给其他方的分片。于是,第一方可以将分配给其他方的分片作为第一中间结果,发送给目标方。在其他例子中,密态引擎还可以基于例如同态加密实现mpc。在该情况
[0088]
情况下,第一方可以对第一中间项和第二中间项进行同态加密,作为第一中间结果发送给目标方。
[0089]
在不同实现方式中,第一方a所交互的所述目标方可以是第二方b,也可以是独立于第一方和第二方的中间方,或称为第三方。无论是哪种实现方式,该目标方还获取第二方b按照前述类似方式对应得到的第二中间结果,从而对第一中间结果和第二中间结果进行融合。具体的,目标方根据前述公式(6),对第一中间结果和第二中间结果进行本地融合或mpc运算,从而得到fm模型的输出。
[0090]
图5a和图5b分别示出两种交互场景。
[0091]
根据图5a,在步骤51,第一方a获取fm模型中针对第一特征的第一参数,第二方b获取fm模型中针对第二特征的第二参数。在步骤53,第一方a基于第一参数本地计算针对第一特征的第一中间项和第二中间项,并据此得到第一中间结果。相应的,第二方b基于第二参数本地计算针对第二特征的第一中间项和第二中间项,并据此得到第二中间结果。在步骤55,第一方a将第一中间结果发送给第二方b。在步骤57,第二方b将第一中间结果和第二中间结果融合。
[0092]
在图5b中,步骤51和步骤53与图5a相同。在步骤55,第一方a将第一中间结果发送给第三方;第二方b将第二中间结果发送给第三方。在步骤57,第三方将第一中间结果和第二中间结果融合。
[0093]
可以理解,第一中间结果和第二中间结果融合的结果为fm模型的输出。当两方进行联合预测所基于的目标模型还包括其他模型部分,即第二子模型的情况下,两方还需针对第二子模型进行联合处理。就第一方a来说,还需对第一特征进行与所述第二子模型对应
的目标处理,得到第一子结果,发送给前述的目标方。第二方b类似对第二特征进行所述目标处理,得到第二子结果。第一子结果和第二子结果融合的结果,再与所述fm模型的输出进一步融合,才可以得到目标模型的最终输出结果。前述的目标处理的具体处理过程依赖于第二子模型的算法特点。这部分不是本说明书的重点,在此不展开详述。
[0094]
回顾以上过程可以看到,在本说明书的实施例中,针对基于fm模型的目标模型,可以在保护各方数据隐私安全的情况下,进行准确的联合预测,解决了fm模型的处理过程中特征交叉运算带来的数据安全问题。
[0095]
根据另一方面的实施例,提供了一种基于目标模型进行联合预测的装置。上述目标模型包括基于因子分解机的第一子模型,该联合预测涉及第一方和第二方,其中第一方持有目标对象的若干项第一特征,第二方持有所述目标对象的其他特征。图6示出根据一个实施例的联合预测装置的结构示意图,该预测装置可以部署在第一方中,该第一方可以体现为任何具有数据存储、计算、处理能力的设备、平台或设备集群。如图6所示,该预测装置600包括:
[0096]
获取单元61,配置为获取第一子模型的二阶组合参数中针对各项第一特征各自的k维参数;
[0097]
计算单元63,配置为本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和;
[0098]
发送单元65,配置为将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,使其融合所述第一中间结果与来自所述第二方的第二中间结果,得到所述第一子模型的输出。
[0099]
根据一种实施方式,所述获取单元61还配置为,获取所述第一子模型的线性组合参数中针对各项第一特征的第一线性参数,以及针对第一方的第一偏移参数;其中,所述第二中间项还包括,所述第一偏移参数,以及各项第一特征的特征值与其对应的所述第一线性参数的线性组合结果。
[0100]
在一个实施例中,所述第一中间结果包括所述第一中间项和所述第二中间项;所述发送单元65配置为:将所述第一中间结果发送给所述第二方。
[0101]
在另一实施例中,所述发送单元65配置为:基于所述第一中间项和所述第二中间项添加满足差分隐私的噪声数据,作为所述第一中间结果;将所述第一中间结果发送给所述第二方。
[0102]
在又一实施例中,所述发送单元65配置为:对所述第一中间项和第二中间项进行秘密分享的分片,将分配给其他方的分片作为所述第一中间结果;将所述第一中间结果发送给所述第二方,从而与第二方进行秘密分享下的多方安全计算mpc。
[0103]
根据一种实施方式,所述发送单元65配置为:将所述第一中间结果发送给第三方,所述第三方还从所述第二方接收所述第二中间结果。
[0104]
在一种实现方式中,所述目标模型还包括第二子模型,所述装置600还包括第二处理单元(未示出),配置为对所述第一特征进行与所述第二子模型对应的目标处理,得到第一子结果;所述发送单元65还配置为:将所述第一子结果发送给所述目标方。
[0105]
以上装置中各个单元的实现方式的具体例子,可以参照之前结合图3的描述。通过
以上装置,可以实现与另一方针对目标模型的安全联合预测。
[0106]
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。
[0107]
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3所述的方法。
[0108]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0109]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
技术特征:
1.一种基于目标模型进行联合预测的方法,所述目标模型包括基于因子分解机的第一子模型,所述联合预测涉及第一方和第二方,所述第一方持有目标对象的若干项第一特征,所述第二方持有所述目标对象的其他特征,所述方法通过第一方执行,包括:获取第一子模型的二阶组合参数中针对各项第一特征各自的k维参数;本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和;将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,使其融合所述第一中间结果与来自所述第二方的第二中间结果,得到所述第一子模型的输出。2.根据权利要求1所述的方法,还包括,获取所述第一子模型的线性组合参数中针对各项第一特征的第一线性参数,以及针对第一方的第一偏移参数;其中,所述第二中间项还包括,所述第一偏移参数,以及各项第一特征的特征值与其对应的所述第一线性参数的线性组合结果。3.根据权利要求1所述的方法,其中,所述第一中间结果包括所述第一中间项和所述第二中间项;将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,包括:将所述第一中间结果发送给所述第二方。4.根据权利要求1所述的方法,其中,将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,包括:基于所述第一中间项和所述第二中间项添加满足差分隐私的噪声数据,作为所述第一中间结果;将所述第一中间结果发送给所述第二方。5.根据权利要求1所述的方法,其中,将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,包括:对所述第一中间项和第二中间项进行秘密分享的分片,将分配给其他方的分片作为所述第一中间结果;将所述第一中间结果发送给所述第二方,从而与第二方进行秘密分享下的多方安全计算mpc。6.根据权利要求1所述的方法,其中,将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,包括:将所述第一中间结果发送给第三方,所述第三方还从所述第二方接收所述第二中间结果。7.根据权利要求1所述的方法,其中,所述目标模型还包括第二子模型,所述方法还包括:对所述第一特征进行与所述第二子模型对应的目标处理,得到第一子结果;将所述第一子结果发送给所述目标方。8.一种基于目标模型进行联合预测的装置,所述目标模型包括基于因子分解机的第一子模型,所述联合预测涉及第一方和第二方,所述第一方持有目标对象的若干项第一特征,所述第二方持有所述目标对象的其他特征,所述装置部署在第一方中,包括:
获取单元,配置为获取第一子模型的二阶组合参数中针对各项第一特征各自的k维参数;计算单元,配置为本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征的特征值与该项特征的第j维参数的乘积之和,所述第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和;发送单元,配置为将基于所述第一中间项和所述第二中间项得到的第一中间结果发送给目标方,使其融合所述第一中间结果与来自所述第二方的第二中间结果,得到所述第一子模型的输出。9.根据权利要求8所述的装置,所述获取单元还配置为,获取所述第一子模型的线性组合参数中针对各项第一特征的第一线性参数,以及针对第一方的第一偏移参数;其中,所述第二中间项还包括,所述第一偏移参数,以及各项第一特征的特征值与其对应的所述第一线性参数的线性组合结果。10.根据权利要求8所述的装置,其中,所述第一中间结果包括所述第一中间项和所述第二中间项;所述发送单元配置为:将所述第一中间结果发送给所述第二方。11.根据权利要求8所述的方法,其中,所述发送单元配置为:基于所述第一中间项和所述第二中间项添加满足差分隐私的噪声数据,作为所述第一中间结果;将所述第一中间结果发送给所述第二方。12.根据权利要求8所述的装置,其中,所述发送单元配置为:对所述第一中间项和第二中间项进行秘密分享的分片,将分配给其他方的分片作为所述第一中间结果;将所述第一中间结果发送给所述第二方,从而与第二方进行秘密分享下的多方安全计算mpc。13.根据权利要求8所述的装置,其中,所述发送单元配置为:将所述第一中间结果发送给第三方,所述第三方还从所述第二方接收所述第二中间结果。14.根据权利要求8所述的装置,其中,所述目标模型还包括第二子模型,所述装置还包括第二处理单元,配置为对所述第一特征进行与所述第二子模型对应的目标处理,得到第一子结果;所述发送单元还配置为:将所述第一子结果发送给所述目标方。15.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
技术总结
本说明书实施例提供一种基于目标模型进行联合预测的方法和装置,其中目标模型包括基于因子分解机FM的第一子模型,联合预测涉及第一方和第二方,第一方持有目标对象的若干项第一特征,第二方持有目标对象的其他特征。在该方法中,第一方可以获取FM模型的二阶组合参数中针对各项第一特征各自的k维参数;然后本地计算第一中间项和第二中间项,其中第一中间项包括k个中间值,任意第j中间值是各项第一特征对应的第j维参数的乘积之和,第二中间项包括,各项第一特征与各个维度参数值的乘积的平方之和。于是,第一方可以将基于第一中间项和第二中间项得到的第一中间结果发送给目标方,使其融合得到FM模型的输出。其融合得到FM模型的输出。其融合得到FM模型的输出。
技术研发人员:张兴盟 王磊
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2023.06.29
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
