一种图卷积神经网络联邦建模方法与流程

未命名 07-15 阅读:96 评论:0


1.本发明涉及图神经网络技术领域,具体为一种图卷积神经网络联邦建模方法。


背景技术:

2.卷积神经网络(convolutional neural network,cnn)在文本和图像等欧氏空间的数据处理上,可以有效地提升其推理任务效率,但对于图结构数据等非欧式空间数据的应用效果欠佳。随着对图结构数据的关注度越来越高,图神经网络(graph neural network,gnn)作为一种处理图数据的深度学习方法,被大量应用于不同的神经网络模型中。其中,图卷积神经网络(graph convolutional network,gcn)作为gnn的重要分支,在图结构处理上体现出其优势,已经在推荐系统、反金融欺诈、交通预测、基因检测等领域取得了成功应用。
3.现有技术中,随着业务场景的复杂性增多,业务模型建模迎来新的挑战,传统的单方独立建模方式的局限性开始体现,已经不能满足复杂场景的业务要求,需要融合跨机构、跨地域、多源数据来联合建模,然而,由于数据的分布性以及数据隐私的保护要求,就需要引入新的技术手段来解决此问题。因此,将安全多方计算mpc(secure multi-party computation)技术(如:private set intersection(psi)、oblivious transfer(ot)、同态加密等)与图卷积神经网络结合起来,成为研究的热点。
4.目前fedgcn、fedgnn等联邦算法在一定程度上满足了部分需求,然而在真实的业务建模需求场景中,参与建模的数据所有者拥有的图数据往往存在各种联系,比如节点重合、边重合,建模各方都各自拥有数据标签,在这种情况下,如何有效融合隐私计算技术和联邦建模技术,在保护数据隐私的前提下,实现数据重合复杂场景下图卷积神经网络的安全高效联合建模,提升业务价值成为亟需解决的问题。


技术实现要素:

5.本发明的目的在于提供一种图卷积神经网络联邦建模方法,以解决上述背景技术中提出的问题。
6.为实现上述目的,本发明提供如下技术方案:一种图卷积神经网络联邦建模方法,所述方法包括以下步骤:
7.提取整体图模型结构特征;
8.选择公共节点子图;
9.训练子图模型联邦建模的模型;
10.训练整体图模型;
11.推理预测任务。
12.优选的,步骤101、根据业务领域预测任务pred的需求,选定影响预测任务的数据特征;
13.步骤102、各个联合建模方收集预测任务pred业务领域海量数据,获取预测任务的
真实标签,形成训练数据;
14.步骤103、各个联合建模方i通过所述的图结构特征生成器gsgen对各自训练数据进行处理,生成图结构gs-i。
15.优选的,选择公共节点子图包括以下步骤:
16.步骤201、隐私集合求交psi模块设定隐私集合求交规则,默认为所有参与方的公共节点为隐私求交结果;
17.步骤202、节点选择模块nsc设定公共节点选择策略,可以设定公共节点数量、公共节点占比、优先节点选择规则等参数;
18.步骤203、根据各个联合建模方i拥有的所述的图结构gs-i的节点集合,通过隐私集合求交psi模块,进行多方的安全集合求交,获取公共节点集合;
19.步骤204、节点选择模块nsc对公共节点集合进行判断,不满足节点选择策略的要求,则重新设定隐私集合求交规则,由隐私集合求交psi模块重新选择;
20.步骤205、满足设定的选择策略,节点选择模块nsc选出公共节点集合selnodeset;
21.步骤206、改变公共节点选择策略设定,针对图数据找到最优的节点选择策略。
22.优选的,训练子图模型联邦建模的模型包括以下步骤:
23.步骤301、各个联合建模方i通过子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;
24.步骤302、将子图结构生成器subgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;
25.步骤303、各个联合建模方i对图结构selgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;
26.步骤304、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;
27.步骤305、将安全聚合结果的嵌入向量输入到所述的预测任务pred输出标签;
28.步骤306、通过所述损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;
29.步骤307、节点向量距离计算nvc模块设定triple loss损失函数,通过计算各方共同节点的嵌入向量的余弦相似度距离,使其最小化相同节点之间的节点嵌入向量距离,最大化不同节点的嵌入向量距离,并将梯度反向传播,更新所述的图结构生成器subgsgen;
30.步骤308、反复执行步骤302至307,各联合建模方i得到最终的公共节点子图结构selgs-i,包括其节点嵌入向量及关系嵌入向量。
31.优选的,训练整体图模型包括以下步骤:
32.步骤401、各个联合建模方i通过融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;
33.步骤402、将融合图结构生成器fusgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;
34.步骤403、各个联合建模方i对图结构newgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;
35.步骤404、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;
36.步骤405、将安全聚合结果的嵌入向量输入到预测任务pred输出标签;
37.步骤406、通过损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;
38.步骤407、公共节点向量更新模块nupd设定节点嵌入向量更新梯度阈值,并将梯度反向传播,限制更新图结构newgs的公共节点嵌入向量的范围;
39.步骤408、反复执行步骤402至407,各联合建模方i得到最终的公共节点子图结构newgs-i,包括其节点嵌入向量及关系嵌入向量。
40.优选的,。
41.优选的,推理预测任务包括以下步骤:
42.步骤501、联合建模方i根据真实数据,各自通过图特征生成器gsgen生成图结构gs-i;
43.步骤502、通过隐私集合求交psi模块和节点选择模块,生成节点集合selnodeset;
44.步骤503、联合建模方i联合建模方i通过所述的子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;
45.步骤504、联合建模方i通过所述的融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;
46.步骤504、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合,并经过预测任务pred输出预测结果;
47.步骤505、各方持续收集数据,同时对输出结果正确性进行反馈,用于模型的持续优化。
48.与现有技术相比,本发明的有益效果是:
49.本发明提出的图卷积神经网络联邦建模方法针对节点重合等真实业务复杂建模需求场景,充分考虑参与建模的数据所有者各自拥有图数据的相关性,根据策略选择,采用隐私集合求交(psi)协议确定共同节点,选出价值高的共同节点,基于选中的公共节点形成的子图进行安全联合建模,进而汇入整体图数据结构,完成整体图数据的安全建模。相较于传统的建模方式,通过公共节点子图图卷积安全联合建模的方式,能够更好挖掘出机构数据之间的深层联系,并且充分利用了各个参与方的数据,提升了模型预测的准确率。
附图说明
50.图1为本发明卷积神经网络联邦模型结构图。
具体实施方式
51.为了使本发明的目的、技术方案进行清楚、完整地描述,及优点更加清楚明白,以下结合附图对本发明实施例进行进一步详细说明。应当理解,此处所描述的具体实施例是本发明一部分实施例,而不是全部的实施例,仅仅用以解释本发明实施例,并不用于限定本
发明实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
52.实施例一
53.请参阅图1,本发明提供一种技术方案:一种图卷积神经网络联邦建模方法,所述方法包括以下步骤:
54.提取整体图模型结构特征;包括以下步骤:
55.步骤101、根据业务领域预测任务pred的需求,选定影响预测任务的数据特征;
56.步骤102、各个联合建模方收集预测任务pred业务领域海量数据,获取预测任务的真实标签,形成训练数据;
57.步骤103、各个联合建模方i通过所述的图结构特征生成器gsgen对各自训练数据进行处理,生成图结构gs-i;
58.选择公共节点子图;包括以下步骤:
59.步骤201、隐私集合求交psi模块设定隐私集合求交规则,默认为所有参与方的公共节点为隐私求交结果;
60.步骤202、节点选择模块nsc设定公共节点选择策略,可以设定公共节点数量、公共节点占比、优先节点选择规则等参数;
61.步骤203、根据各个联合建模方i拥有的所述的图结构gs-i的节点集合,通过隐私集合求交psi模块,进行多方的安全集合求交,获取公共节点集合;
62.步骤204、节点选择模块nsc对公共节点集合进行判断,不满足节点选择策略的要求,则重新设定隐私集合求交规则,由隐私集合求交psi模块重新选择;
63.步骤205、满足设定的选择策略,节点选择模块nsc选出公共节点集合selnodeset;
64.步骤206、改变公共节点选择策略设定,针对图数据找到最优的节点选择策略;
65.训练子图模型联邦建模的模型;包括以下步骤:
66.步骤301、各个联合建模方i通过子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;
67.步骤302、将子图结构生成器subgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;
68.步骤303、各个联合建模方i对图结构selgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;
69.步骤304、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;
70.步骤305、将安全聚合结果的嵌入向量输入到所述的预测任务pred输出标签;
71.步骤306、通过所述损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;
72.步骤307、节点向量距离计算nvc模块设定triple loss损失函数,通过计算各方共同节点的嵌入向量的余弦相似度距离,使其最小化相同节点之间的节点嵌入向量距离,最大化不同节点的嵌入向量距离,并将梯度反向传播,更新所述的图结构生成器subgsgen;
73.步骤308、反复执行步骤302至307,各联合建模方i得到最终的公共节点子图结构selgs-i,包括其节点嵌入向量及关系嵌入向量;
74.训练整体图模型;包括以下步骤:
75.步骤401、各个联合建模方i通过融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;
76.步骤402、将融合图结构生成器fusgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;
77.步骤403、各个联合建模方i对图结构newgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;
78.步骤404、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;
79.步骤405、将安全聚合结果的嵌入向量输入到预测任务pred输出标签;
80.步骤406、通过损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;
81.步骤407、公共节点向量更新模块nupd设定节点嵌入向量更新梯度阈值,并将梯度反向传播,限制更新图结构newgs的公共节点嵌入向量的范围;
82.步骤408、反复执行步骤402至407,各联合建模方i得到最终的公共节点子图结构newgs-i,包括其节点嵌入向量及关系嵌入向量;
83.推理预测任务;包括以下步骤:
84.步骤501、联合建模方i根据真实数据,各自通过图特征生成器gsgen生成图结构gs-i;
85.步骤502、通过隐私集合求交psi模块和节点选择模块,生成节点集合selnodeset;
86.步骤503、联合建模方i联合建模方i通过所述的子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;
87.步骤504、联合建模方i通过所述的融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;
88.步骤504、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合,并经过预测任务pred输出预测结果;
89.步骤505、各方持续收集数据,同时对输出结果正确性进行反馈,用于模型的持续优化。
90.实施例二
91.在实施例一的基础上,一种图卷积神经网络联邦建模方法,依据参与建模的数据所有者各自拥有图数据的相关性,由图结构特征生成器形成图结构,并通过隐私集合求交(psi)协议确定共同节点,根据策略选择出价值高的共同节点,再利用挑选出的共同节点自身形成的子图来进行安全联合建模,计算其公共图节点嵌入向量,形成初始图结构表示;设定公共图嵌入向量的变化范围,结合秘密分享技术,实现全局的图卷积操作,通过已知的节点级别任务标签和图结构级别任务标签来计算梯度并更新模型参数,形成多方图卷积神经网络模型的安全联合建模;多次调整节点选择策略,形成最佳联合建模模型,以应用于节点
级别、图结构级别的推理任务。
92.实施例三
93.在实施例二的基础上,一种图卷积神经网络联邦建模方法,所述的训练数据是来自各个联合建模参与方,分别存储在其联合建模参与方节点本地;所述的图结构gs是由训练数据通过图结构生成器形成的图关系结构(v,e,v,e),其中v表示图的节点,e表示图节点之间的关系,v是节点的特征组,e是节点关系的特征组,v和e由多维特征向量表示;所述的图结构特征生成器gsgen的核心是神经网络,负责生成图结构gs的同时,将原始数据进行归一化处理,为节点和关系生成特征向量;所述的隐私集合求交psi模块负责计算获得联合建模各参与方的公共节点;所述的节点选择模块nsc负责根据设定的策略选出符合要求的公共节点集合selnodeset,所述的公共节点集合selnodeset是全部公共节点的子集;所述的子图结构生成器subgsgen其核心是神经网络,负责根据选出的公共节点集合selnodeset生成图结构selgs,更新其图结构的节点特征和关系特征;所述的图卷积操作gcn采用gat算法,将图结构数据进行图卷积操作,形成节点嵌入向量和节点关系嵌入向量;所述的安全聚合模块sf负责将联合建模各参与方的嵌入向量通过秘密分享进行数据分片,并在含有预测任务标签的安全节点进行数据加权平均安全聚合;所述的节点向量距离计算模块nvc采用tripleloss损失,通过计算不同参与方共同节点的节点嵌入向量之间的距离,使其最小化相同节点之间的节点嵌入向量距离,最大化不同节点的嵌入向量距离;所述的预测任务pred是对节点数据和图数据的分析判断任务,包含节点级任务和图级别任务,根据节点嵌入向量和节点关系嵌入向量来输出预测标签;所述的损失梯度计算模型更新模块cl负责计算所述的预测任务pred输出的预测标签与预测任务真实标签之间的损失梯度,并对神经网络模型参数进行更新;所述的融合图结构生成器fusgsgen其核心是神经网络,负责基于生成的图结构gs以及选出的公共节点集合selnodeset来生成图结构newgs,并生成newgs图结构的节点特征和关系特征;所述的公共节点向量更新模块nupd负责对公共节点集合selnodeset的嵌入向量进行更新,保证节点嵌入向量更新梯度小于设定的阈值。
94.针对节点重合等真实业务复杂建模需求场景,充分考虑参与建模的数据所有者各自拥有图数据的相关性,根据策略选择,采用隐私集合求交(psi)协议确定共同节点,选出价值高的共同节点,基于选中的公共节点形成的子图进行安全联合建模,进而汇入整体图数据结构,完成整体图数据的安全建模。相较于传统的建模方式,通过公共节点子图图卷积安全联合建模的方式,能够更好挖掘出机构数据之间的深层联系,并且充分利用了各个参与方的数据,提升了模型预测的准确率;同时,采用子图安全建模再整体联合建模的方式,能够减少各方交换数据的通信量,同时加快联合建模的收敛速度。另外,通过多次调整节点选择策略,形成最佳联合建模模型,并不断收集反馈,不断优化提升模型准确率。在实际应用中,本发明的方法具有非常广泛的应用前景,能够更好地应对业务复杂度高、隐私性要求高的场景,适用范围广泛,具有非常好的实用效果。
95.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种图卷积神经网络联邦建模方法,其特征在于:所述方法包括以下步骤:提取整体图模型结构特征;选择公共节点子图;训练子图模型联邦建模的模型;训练整体图模型;推理预测任务。2.根据权利要求1所述的一种图卷积神经网络联邦建模方法,其特征在于:提取整体图模型结构特征包括以下步骤:步骤101、根据业务领域预测任务pred的需求,选定影响预测任务的数据特征;步骤102、各个联合建模方收集预测任务pred业务领域海量数据,获取预测任务的真实标签,形成训练数据;步骤103、各个联合建模方i通过图结构特征生成器gsgen对各自训练数据进行处理,生成图结构gs-i。3.根据权利要求1所述的一种图卷积神经网络联邦建模方法,其特征在于:选择公共节点子图包括以下步骤:步骤201、隐私集合求交psi模块设定隐私集合求交规则,默认为所有参与方的公共节点为隐私求交结果;步骤202、节点选择模块nsc设定公共节点选择策略,可以设定公共节点数量、公共节点占比、优先节点选择规则等参数;步骤203、根据各个联合建模方i拥有的图结构gs-i的节点集合,通过隐私集合求交psi模块,进行多方的安全集合求交,获取公共节点集合;步骤204、节点选择模块nsc对公共节点集合进行判断,不满足节点选择策略的要求,则重新设定隐私集合求交规则,由隐私集合求交psi模块重新选择;步骤205、满足设定的选择策略,节点选择模块nsc选出公共节点集合selnodeset;步骤206、改变公共节点选择策略设定,针对图数据找到最优的节点选择策略。4.根据权利要求1所述的一种图卷积神经网络联邦建模方法,其特征在于:训练子图模型联邦建模的模型包括以下步骤:步骤301、各个联合建模方i通过子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;步骤302、将子图结构生成器subgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;步骤303、各个联合建模方i对图结构selgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;步骤304、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;步骤305、将安全聚合结果的嵌入向量输入到所述的预测任务pred输出标签;步骤306、通过损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;步骤307、节点向量距离计算nvc模块设定tripleloss损失函数,通过计算各方共同节
点的嵌入向量的余弦相似度距离,使其最小化相同节点之间的节点嵌入向量距离,最大化不同节点的嵌入向量距离,并将梯度反向传播,更新所述的图结构生成器subgsgen;步骤308、反复执行步骤302至307,各联合建模方i得到最终的公共节点子图结构selgs-i,包括其节点嵌入向量及关系嵌入向量。5.根据权利要求1所述的一种图卷积神经网络联邦建模方法,其特征在于:训练整体图模型包括以下步骤:步骤401、各个联合建模方i通过融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;步骤402、将融合图结构生成器fusgsgen、图卷积操作、安全聚合模块sf以及预测任务pred构成一个模型来进行训练;步骤403、各个联合建模方i对图结构newgs-i分别进行gcn图卷积操作,形成各自的节点嵌入向量和关系嵌入向量;步骤404、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合;步骤405、将安全聚合结果的嵌入向量输入到预测任务pred输出标签;步骤406、通过损失梯度计算模型更新模块cl对预测任务pred输出的预测结果与预测任务实际标签进行计算,并将误差反向传播更新模型;步骤407、公共节点向量更新模块nupd设定节点嵌入向量更新梯度阈值,并将梯度反向传播,限制更新图结构newgs的公共节点嵌入向量的范围;步骤408、反复执行步骤402至407,各联合建模方i得到最终的公共节点子图结构newgs-i,包括其节点嵌入向量及关系嵌入向量。6.根据权利要求1所述的一种图卷积神经网络联邦建模方法,其特征在于:推理预测任务包括以下步骤:步骤501、联合建模方i根据真实数据,各自通过图特征生成器gsgen生成图结构gs-i;步骤502、通过隐私集合求交psi模块和节点选择模块,生成节点集合selnodeset;步骤503、联合建模方i联合建模方i通过所述的子图结构特征生成器subgsgen对各自拥有的图结构gs-i进行处理,结合选出公共节点集合selnodeset,生成图结构selgs-i;步骤504、联合建模方i通过融合图结构生成器fusgsgen对各自拥有的图结构gs-i以及公共节点子图结构selgs-i进行处理,结合选出的公共节点集合selnodeset,生成图结构newgs-i;步骤504、将各个联合建模方形成的节点嵌入向量和关系嵌入向量通过安全聚合模块sf基于秘密分享方法,进行加权平均安全聚合,并经过预测任务pred输出预测结果;步骤505、各方持续收集数据,同时对输出结果正确性进行反馈,用于模型的持续优化。

技术总结
本发明涉及图神经网络技术领域,具体为一种图卷积神经网络联邦建模方法,包括以下步骤:提取整体图模型结构特征;选择公共节点子图;训练子图模型联邦建模的模型;训练整体图模型;推理预测任务;有益效果为:本发明提出的图卷积神经网络联邦建模方法针对节点重合等真实业务复杂建模需求场景,充分考虑参与建模的数据所有者各自拥有图数据的相关性,根据策略选择,采用隐私集合求交(PSI)协议确定共同节点,选出价值高的共同节点,基于选中的公共节点形成的子图进行安全联合建模,进而汇入整体图数据结构,完成整体图数据的安全建模。相较于传统的建模方式,通过公共节点子图图卷积安全联合建模的方式,能够更好挖掘出机构数据之间的深层联系。之间的深层联系。之间的深层联系。


技术研发人员:孙善宝 贾荫鹏 沈国栋 罗清彩 李锐
受保护的技术使用者:山东浪潮科学研究院有限公司
技术研发日:2023.04.28
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐