一种面向电力移动边缘计算的去中心化联邦学习方法
未命名
07-23
阅读:107
评论:0
1.本发明针对去中心化联邦学习的数据异构难题,提出了一种面向电力移动边缘计算的去中心化联邦学习方法。
背景技术:
2.数据的异构性在一些去中心化联邦学习场景中,例如在电力移动边缘计算场景中十分常见。产生这一现象的原因是每台工作设备产生数据的源自特定的网络环境、特定的地理位置甚至特定的时间窗口。而在去中心化联邦学习方法中工作设备内的数据相互独立不能在工作设备间互相访问,这就导致了模型训练的数据分布就存在倾斜不平衡的情况。
3.虽然目前已经有提出一些相关的去中心化联邦学习方法,但是这些方法在电力移动边缘计算这种数据异构场景下依然无法高效训练出一个泛化性能出色的模型。即使有能力训练出一个符合要求的模型,但所要花费的代价却十分巨大。因此,如何在电力移动边缘计算领域内提出一个去中心化联邦学习方法,从而解决电力移动边缘计算的数据异构问题就变得十分重要。
技术实现要素:
4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述和/或现有的一种面向电力移动边缘计算的去中心化联邦学习方法中存在的问题,提出了本发明。
6.因此,本发明所要解决的问题在于如何提供一种面向电力移动边缘计算的去中心化联邦学习方法。
7.为解决上述技术问题,本发明提供如下技术方案:一种面向电力移动边缘计算的去中心化联邦学习方法,其包括,
8.初始阶段,初始化所有工作设备的模型参数、梯度追踪参数、学习率和动量超参,归一化超参以及和动量技术相关的超参;
9.确定网络拓扑矩阵、训练轮次和本地迭代次数;
10.执行关键的基于动量的模型本地迭代更新;
11.对参数变量进行更新得到第t+1个训练轮次的初始参数;
12.结合梯度追踪技术对梯度追踪参数进行更新;
13.执行完t次训练轮次后,训练结束。
14.作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:基于动量技术和梯度追踪技术来实现本地迭代更新和梯度追踪参数更新。
15.作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:在训练开始阶段时,即在初始阶段,初始化所有工作设备的模型参数为x0,初
始化梯度追踪参数等于该工作设备首次批处理随机梯度下降后的梯度值初始化学习率η、动量超参β∈[0,1)、归一化超参λ∈[0,1]以及和动量技术相关的超参α≥0;设变量在初始情况下是一个全o向量,确定网络拓扑矩阵w、训练轮次t和本地迭代次数k。
[0016]
作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:对于任意一个工作设备i,其在训练轮次{0,...,tv1}间与其他工作设备并行执行;假设在第t个训练轮次中,工作设备i会首先执行k次本地迭代,其范围在{0,...,k-1};那假设在第t个训练轮次内,正在执行第τ个本地迭代,得到当前的计算梯度为
[0017][0018]
是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时的模型参数;而是此时的批采样数据集;是工作设备i使用在集合相关的损失函数,接着,使用超参λ对此时的计算梯度和梯度追踪参数进行归一化组合得到即:
[0019][0020]
作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:执行一个关键的基于动量的模型本地迭代更新步骤:
[0021][0022]
其中种分别是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时引入的动量向量和额外的辅助向量,在执行完k次本地迭代会得到和
[0023]
作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:对上述两个参数变量进行以下操作进行更新,得到第t+1个训练轮次的初始参数,即:
[0024][0025]
[0026]
在得到后,进行以下操作得到
[0027][0028]
作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:结合梯度追踪技术对梯度追踪参数进行更新,为工作节点i在第t+1个训练轮次的后续训练提供相关需要的训练参数:
[0029][0030]
作为本发明所述一种面向电力移动边缘计算的去中心化联邦学习方法的一种优选方案,其中:上述操作在执行完t次训练轮次后,训练结束。
[0031]
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
[0032]
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述方法的步骤。
[0033]
本发明有益效果为:本发明面向电力移动边缘计算提出了一个去中心化联邦学习方法,该发明基于动量技术和梯度追踪技术,能有效缓解电力移动边缘计算场景中数据异构问题,训练模型的泛化性能得到了提升。
附图说明
[0034]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0035]
图1为实施例3中一种面向电力移动边缘计算的去中心化联邦学习方法的流程图。
具体实施方式
[0036]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
[0037]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0038]
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0039]
实施例1
[0040]
本发明的第一个实施例,该实施例提供了一种面向电力移动边缘计算的去中心化联邦学习方法,包括以下步骤:
[0041]
在训练开始阶段时,即在初始阶段,初始化所有工作设备的模型参数为x0,初始化
梯度追踪参数等于该工作设备首次批处理随机梯度下降后的梯度值初始化学习率η、动量超参β∈[0,1)、归一化超参λ∈[0,1]以及和动量技术相关的超参α≥0。设变量在初始情况下是一个全0向量。确定网络拓扑矩阵w、训练轮次t和本地迭代次数k。
[0042]
对于任意一个工作设备i,其在训练轮次{0,...,t-1}间与其他工作设备并行执行。假设在第t个训练轮次中,工作设备i会首先执行k次本地迭代,其范围在{0,...,k-1}。那假设在第t个训练轮次内,正在执行第τ个本地迭代,得到当前的计算梯度为
[0043][0044]
是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时的模型参数;而是此时的批采样数据集;是工作设备i使用在集合相关的损失函数,接着,使用超参λ对此时的计算梯度和梯度追踪参数进行归一化组合得到即:
[0045][0046]
接着,执行一个关键的基于动量的模型本地迭代更新步骤:
[0047][0048]
其中和分别是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时引入的动量向量和额外的辅助向量。在执行完k次本地迭代会得到和然后,对这两个参数变量进行以下操作进行更新,得到第t+1个训练轮次的初始参数,即:
[0049][0050][0051]
在得到后,进行以下操作得到
[0052][0053]
最后,结合梯度追踪技术对梯度追踪参数进行更新,为工作节点i在第t+1个训练
轮次的后续训练提供相关需要的训练参数:
[0054][0055]
上述操作步骤在执行完t次训练轮次后,训练结束。
[0056]
实施例2
[0057]
本发明第二个实施例,其不同于前两个实施例的是:还包括
[0058]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0059]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0060]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(ram)、只读存储器(rom)、可擦除可编辑只读存储器(eprom或闪速存储器)、光纤装置以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0061]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0062]
实施例3
[0063]
参照图1,为本发明第三个实施例,该实施将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
[0064]
本实施例初始化工作设备为10台。初始化所有工作设备的模型参数为x0,其内部参数值都是0,初始化工作设备i的梯度追踪参数让其等于该工作设备首次批处理随
机梯度下降后的梯度值初始化学习率η,本实施例采用网络搜索的方式将η的选定范围控制在集合{10-2
,10-1.5
,10-1
,10-0.5
}中;动量超参β∈[0,1),本实施令将β=0.9;归一化超参λ∈[0,1],本实施令将λ=0.8以及和动量技术相关的超参α≥0本实施令将α=2。设变量在初始情况下是一个全0向量。确定网络拓扑矩阵w、训练轮次t和本地迭代次数k。本实施例采用梅特罗波利斯-黑斯廷斯规则来生成网络拓扑举证,最后令t=1000,k=10。
[0065]
对于任意一个工作设备i,其在训练轮次{0,...,t-1}间与其他工作设备并行执行。假设在第t个训练轮次中,工作设备i会首先执行k次本地迭代,其范围在{0,...,k-1}。那假设在第t个训练轮次内,正在执行第τ个本地迭代,得到当前的计算梯度为
[0066][0067]
是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时的模型参数;而是此时的批采样数据集;是工作设备i使用在集合相关的损失函数,接着,使用超参λ对此时的计算梯度和梯度追踪参数进行归一化组合得到即:
[0068][0069]
接着,执行一个关键的基于动量的模型本地迭代更新步骤:
[0070][0071]
其中和分别是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时引入的动量向量和额外的辅助向量。在执行完k次本地迭代会得到和然后,对这两个参数变量进行以下操作进行更新,得到第t+1个训练轮次的初始参数,即:
[0072][0073][0074]
在得到后,进行以下操作得到
[0075][0076]
最后,结合梯度追踪技术对梯度追踪参数进行更新,为工作节点i在第t+1个训练轮次的后续训练提供相关需要的训练参数:
[0077][0078]
上述操作步骤在执行完t次训练轮次后,训练结束。
[0079]
为了对本方法中采用的技术效果加以验证说明,本实施例选择采用基于nesterov动量方法的local sgd方法、qg-dsgdm方法、slowmo方法和本方法进行对比测试,以科学论证的手段对比实验结果,以验证本方法所具有的真实效果。
[0080]
利用模型测试精度,分别将本方法和本实施例选择采用基于nesterov动量方法的local sgd方法、qg-dsgdm方法、slowmo方法在4类不同的基准实验(数据集:mnist,训练模型lenet;数据集emnist,训练模型cnn;数据集:cifar10,训练模型lenet;数据集:ag news,训练模型lstm)中进行对比实验。
[0081]
训练中,在cifar10数据集的相关实验中将本地批处理大小设置为256,其他数据集设置为128。另外,为了避免实验结果的偶然性,对上述指标取5次独立运行的平均结果,实验结果如表1、表2、表3、表4所示。
[0082]
由于本方法能够解决电力移动边缘计算的数据异构问题,本实施例使用狄利克雷分布对每台工作节点的数据分布进行控制。本实施例将这个数据分布程度分别设定为0.1、1、10。当这个数据分布程度越小时,则说明工作节点间的数据异构程度越严重。
[0083]
表1:使用lenet模型训练mnist数据集的模型测试精度对比实验
[0084][0085]
表2:使用cnn模型训练emnist数据集的模型测试精度对比实验
[0086][0087]
表3:使用lenet模型训练cifar10数据集的模型测试精度对比实验
[0088][0089]
表4:使用lstm模型训练ag news数据集的模型测试精度对比实验
[0090][0091]
由表1、表2、表3、表4可知,本去中心化联邦学习方法的第一个实例在电力移动边缘计算场景下且在不同的数据分布程度中,模型训练的测试精度都优于其他对比方法,这意味着本方法能有效缓解电力移动边缘计算下的数据异构问题。
[0092]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
技术特征:
1.一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:包括以下步骤,初始阶段,初始化所有工作设备的模型参数、梯度追踪参数、学习率和动量超参,归一化超参以及和动量技术相关的超参;确定网络拓扑矩阵、训练轮次和本地迭代次数;执行关键的基于动量的模型本地迭代更新;对参数变量进行更新得到第t+1个训练轮次的初始参数;结合梯度追踪技术对梯度追踪参数进行更新;执行完t次训练轮次后,训练结束。2.如权利要求1所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:基于动量技术和梯度追踪技术来实现本地迭代更新和梯度追踪参数更新。3.如权利要求1或2所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:在训练开始阶段时,即在初始阶段,初始化所有工作设备的模型参数为x0,初始化梯度追踪参数等于该工作设备首次批处理随机梯度下降后的梯度值初始化学习率η、动量超参β∈[0,1)、归一化超参λ∈[0,1]以及和动量技术相关的超参α≥0;设变量在初始情况下是一个全0向量,确定网络拓扑矩阵w、训练轮次t和本地迭代次数k。4.如权利要求3所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:对于任意一个工作设备i,其在训练轮次{0,
…
,t-1}间与其他工作设备并行执行;假设在第t个训练轮次中,工作设备i会首先执行k次本地迭代,其范围在{0,
…
,k-1};那假设在第t个训练轮次内,正在执行第τ个本地迭代,得到当前的计算梯度为在第t个训练轮次内,正在执行第τ个本地迭代,得到当前的计算梯度为是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时的模型参数;而是此时的批采样数据集;是工作设备i使用在集合相关的损失函数,接着,使用超参λ对此时的计算梯度和梯度追踪参数进行归一化组合得到即:5.如权利要求4所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:执行一个关键的基于动量的模型本地迭代更新步骤:其中和分别是工作设备i在第t个训练轮次内,正在执行第τ个本地迭代时引
入的动量向量和额外的辅助向量,在执行完k次本地迭代会得到和6.如权利要求5所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:对上述两个参数变量进行以下操作进行更新,得到第t+1个训练轮次的初始参数,即:在于:对上述两个参数变量进行以下操作进行更新,得到第t+1个训练轮次的初始参数,即:在得到后,进行以下操作得到后,进行以下操作得到7.如权利要求6所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:结合梯度追踪技术对梯度追踪参数进行更新,为工作节点i在第t+1个训练轮次的后续训练提供相关需要的训练参数:8.如权利要求7所述的一种面向电力移动边缘计算的去中心化联邦学习方法,其特征在于:上述操作在执行完t次训练轮次后,训练结束。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
技术总结
本发明公开了一种面向电力移动边缘计算场景的去中心化联邦学习方法,属于电力移动边缘计算领域,包括以下步骤,初始阶段,初始化所有相关参数;确定网络拓扑矩阵、训练轮次和本地迭代次数;执行关键的基于动量的模型本地迭代更新;对参数变量进行更新得到第t+1个训练轮次的初始参数;结合梯度追踪技术对梯度追踪参数进行更新;执行完T次训练轮次后,训练结束。本发明基于动量技术和梯度追踪技术对去中心化联邦学习进行探索,提出了一种面向电力移动边缘计算的去中心化联邦学习方法,缓解了电力移动边缘计算领域中数据异构的影响。该发明相比其他去中心化联邦学习方法能有效解决电力移动边缘计算的数据异构问题,提升了模型泛化性能。化性能。化性能。
技术研发人员:杜海舟 倪诚栋
受保护的技术使用者:上海电力大学
技术研发日:2023.04.12
技术公布日:2023/7/21
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种水凝胶注射装置及钻孔方法 下一篇:一种地震震源定位方法及装置
