工业物联网中时效性感知的联邦学习参与设备激励方法

未命名 08-15 阅读：138 评论：0

1.本发明涉及联邦学习的技术领域，尤其涉及工业物联网中时效性感知的联邦学习参与设备激励方法。

背景技术：

2.工业物联网被认为是将传统产业升级到一个新的智能阶段的关键技术。工业物联网具有普遍连接的特点，几乎覆盖了整个产业链。广泛部署的工业物联网设备每天都在产生前所未有的大数据。随着人工智能的快速发展，工业物联网设备的感官数据可以被充分探索和利用。然而，这些数据可能对隐私很敏感。处理不当可能会导致隐私和安全问题，从而阻碍实现行业智能发展的步伐。本专利申请主要是联邦学习的激励机制方法的探索。
3.联邦学习是一种新兴的分布式机器学习范式，其设备可以在本地训练机器学习模型，而无需将原始数据发送给其他人。联邦学习最近被广泛采用来保护数据隐私。尽管有上述巨大的好处，联邦学习的实际应用仍然面临着巨大的挑战。一个主要的挑战是：在设备参与联邦学习任务时，需要贡献自己的资源和数据，同时还要面临隐私泄露的风险。因此，如果没有足够的报酬，大多数设备不愿意参加联邦学习训练。参与者的缺乏将对联邦学习的表现产生相当大的影响。因此，设计一种有效的联邦学习激励机制，鼓励更多的设备加入联邦训练具有重要意义。
4.在一些不同的情况下(如p2p网络和移动人群感知网络)，激励机制被广泛研究。然而，由于一些挑战，为联邦学习设计激励机制仍然不是很简单的事情。第一个问题是，很难公平地量化联邦学习中每个参与者的贡献；二是如何利用联邦学习的本质，为参与者设计激励机制，进而提高联邦学习模型的性能。为了解决上述挑战，许多研究都是基于不同的技术(如博弈论、拍卖理论、区块链)和量度(如数据质量、数据量、信誉价值)。然而，这些研究并没有考虑到数据新鲜度的影响。在一些工业物联网应用中，如自动驾驶汽车和无人机，数据新鲜度是一个重要因素，对准确性和应用效率有很大的影响。
5.此外，由于设备的流动性和边缘网络的动态性质，边缘服务器无法获得设备在执行联邦学习任务时的具体行为并且工业物联网设备的行为完全取决于它们自身的道德约束，这导致了边缘服务器和设备之间的信息异构。由于信息不对称，边缘服务器可能不知道每个设备的确切信息，如信誉价值、本地数据质量和可用资源。边缘服务器和设备之间的信息不对称可能会给整个联邦学习任务带来额外的成本。因此，设计一种有效的机制是有意义的，它满足了不同设备的要求，减轻了信息不对称的影响。

技术实现要素：

6.针对现有联邦学习中边缘服务器和设备之间的信息不对称会给整个联邦学习任务带来额外的成本技术问题，本发明提出工业物联网中时效性感知的联邦学习参与设备激励方法，可有效保证边缘服务器和设备的效益；保证激励的公平与参与设备的积极性。
7.为了达到上述目的，本发明的技术方案是这样实现的：工业物联网中时效性感知
的联邦学习参与设备激励方法，其步骤如下：
8.步骤一.边缘服务器根据联邦学习任务设计资源条件要求和契约项，在满足资源条件要求后，工业物联网设备被选为候选设备；
9.步骤二.利用平均aoi度量候选设备的数据新鲜度，计算候选设备的综合信誉值，通过综合信誉值选择候选设备为参与设备，参与设备执行联邦学习任务对本地模型进行训练；
10.步骤三.根据参与设备的契约项建立边缘服务器的效益函数作为目标函数，根据参与设备的个人理性约束和激励相容性约束建立约束条件，推导信息不对称和信息对称条件下的最优契约设计问题，利用凸优化工具得出参与设备的最优契约项；
11.步骤四.边缘服务器根据最优契约项的奖励使用区块链对参与设备进行支付，边缘服务器不能拒绝付款。
12.优选地，所述联邦学习任务设计要求的资源条件包括数据大小、数据类型、cpu频率、训练需要达到的精度和训练时间阈值；
13.根据联邦学习任务设计的契约项是(rn(fn)，fn)，fn是工业物联网设备n执行联邦学习任务需要付出的计算资源,rn是工业物联网设备n得到的相应的奖励。
14.优选地，所述计算候选设备的综合信誉值的方法为：综合信誉值为：
[0015][0016]
其中，为直接信誉意见，为间接信誉意见，权重权重
[0017]
优选地，间接信誉意见由三个要素组成：信任值不信任值和不确定性值并且对于一个时间窗口{t1,
…
,ta,
…
,t
x
}，x表示时间窗口的总数量，
[0018]
间接信誉意见为：
[0019][0020]
其中，k是给定的常数；
[0021]
使用λ1和λ2分别表示积极交互和消极交互的信誉计算权重，且λ1+λ2＝1，λ1,λ2∈(0,1)，λ1≤λ2，得到：
[0022][0023]
其中，和分别是积极交互和消极交互的次数；如果与上次本地模型更新的性能相比，此次本地模型更新的性能下降，则定义为一次消极交互；表示影响信誉意见不确定性的变量。
[0024]
优选地，所述候选设备的直接信誉值为：
[0025][0026]
其中，a为权重值，a∈(0,1)，权重值a大于最近和过去的经验的权重y1和y2，y1、y2∈(0,1)，y1+y2＝1；表示候选设备n的平均aoi；
[0027]
定义在一个时隙t内，候选设备n执行联邦学习任务和参与竞争总次数的比率为：en＝pw/pc，pc代表候选设备参与竞争参与设备的总次数，pw为执行联邦学习任务的次数，pw≤pc；最近和过去经验的时间尺度为t
gap
，候选设备n的交互经验在最近时隙t内满足t≤t
gap
时为最近的比率t＞t
gap
时为过去的比率
[0028]
优选地，所述平均aoi的计算方法为：
[0029]
假设数据在时刻t1,...,tz,...,tz产生，随之在u1,...,uz,...,uz时刻被接收，候选设备n的瞬时信息年龄an(tz)表示为an(tz)＝t
z-uz，用一个时隙t上的候选设备n的平均aoi定义数据的新鲜度为：
[0030]
优选地，如果候选设备的综合信誉值大于预定义信誉阈值，则选择该候选设备作为执行联邦学习任务的参与设备，然后参与设备根据自身的类型来选择最优契约来进行本地模型训练，得到的结果使全局模型的精度达到预定义的值；
[0031]
执行联邦学习任务的过程包括：参与执行联邦学习任务的参与设备用其局部数据迭代地训练一个共享的全局模型，并生成本地模型；参与设备将本地模型更新到边缘服务器上，进行全局模型聚合；重复执行上述过程，直到全局模型精度达到预定义的值；
[0032]
联邦学习任务完成后，边缘服务器根据交互历史更新其对参与设备的直接信誉意见，进行块验证和共识方案后将直接信誉意见加入信誉区块链。
[0033]
优选地，所述步骤三中推倒信息不对称条件下的最优契约设计问题的方法为：
[0034]
使用设备类型的统计分布来优化边缘服务器的预期效益，定义参数θj来评估数据质量，质量，是局部模型迭代次数的系数，根据数据质量θj将参与设备分为j种类型，并按升序排序：θ1≤
…
≤θj≤
…
≤θj；
[0035]
根据契约项(rj(fj)，fj)来设计类型j设备的效益函数为：
[0036][0037]
式中，ε是一个预定义的能量消耗的权重参数；表示在全局迭代中传输本地模型更新的能量消耗，且pj是传输功率，σ是本地模型更新的数据大小，ej是由不确定的传输环境引起的数据包错误率，hj是类型j设备和边缘服务器之间的点对点链接的通道增益，nj是背景噪声，b是传输带宽；表示一次局部迭代的能量消耗，且cj、dj分别代表类型j设备在本地模型训练中执行一个数据样本所需的cpu周期数以及使用的本地数据样本的大小，ζ表示类型j设备的计算芯片组的有效电容参数；
[0038]
根据契约项(rj(fj)，fj)设计边缘服务器的效益函数为：
[0039][0040]
式中，u表示边缘服务器对参与设备的满意度参数，l代表单位奖励成本，表示一次全局迭代的总时间，t
max
代表边缘服务器为联邦学习任务所容忍的最大时间,且代表边缘服务器为联邦学习任务所容忍的最大时间,且表示本地模型迭代的计算时间，表示本地模型迭代的计算时间，代表局部模型更新的传输时间；
[0041]
根据类型j设备的效益函数，利用契约理论设计最优契约，最优契约设计问题为最大化边缘服务器的效益函数：
[0042][0043]
式中，j表示参与设备的总数量，qj表示参与设备属于类型j的可能的概率，
[0044]
不同类型的参与设备需满足个人理性约束和激励相容性约束的约束条件为：
[0045][0046][0047]
0≤f1＜
…
＜fj，j∈[2,...,j]；
[0048]
t
jcmp
≤t
max
,j∈[1,2,...,j]；
[0049][0050]
其中，r
max
表示边缘服务器的总奖励预算；
[0051]
根据个人理性约束和激励相容性约束,将其简化得到松弛的最优契约设计问题，求解松弛的最优契约的解为：
[0052]
令得到：
[0053][0054]
式中，π1＝0，类型k表示取1，2，...，j；
[0055]
则：
[0056][0057]
式中，
[0058]
可得到：
[0059]
[0060]
约束条件为：
[0061]
0≤f1＜
…
＜fj,j∈[2,...,j]；
[0062]
t
jcmp
≤t
max
,j∈[1,...,j]；
[0063][0064]
利用标准的凸优化工具cvx进行求解，则可得到最优的计算资源fj和相应的奖励rj。
[0065]
优选地，在信息对称条件下，边缘服务器准确地知道所有参与设备的类型，而且任何契约项(rj(fj)，fj)都应该满足
[0066]
通过使每个工业物联网设备的效益为零，优化问题为：
[0067][0068]
约束条件为：
[0069][0070]
t
jcmp
≤t
max
,j∈[1,...,j]；
[0071][0072]
利用凸优化工具cvx得出最优的计算资源fj和相应的奖励rj。
[0073]
优选地，边缘服务器使用区块链进行支付时，奖励通过区块链上的智能合约自动执行，即契约按照预先确定的规则自动执行交易；如果参与设备未完成联邦学习任务，边缘服务器将受到智能合约的保护，拒绝付款。
[0074]
与现有技术相比，本发明的有益效果：提出结合平均信息年龄(aoi)来评价工业物联网设备数据新鲜度的信誉评价方案，边缘服务器可以评估每个参与者的数据质量，并指导最优契约的设计；此外，还提出了一种基于区块链的信誉管理系统，以保证工业物联网设备所提供的数据的真实性；然后，设计了一种基于契约理论的时效性感知的激励机制，可以监督工业物联网设备积极参与联邦任务，并提供高质量的数据，通过最大化边缘服务器的效益得到最优契约。仿真结果表明，随着信誉值的增加，本发明有效地提高了边缘服务器的效益。
附图说明
[0075]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0076]
图1为本发明的流程示意图。
[0077]
图2为本发明的aoi随时间的连续变化示意图。
[0078]
图3为本发明不同平均aoi下设备的直接信誉值示意图。
[0079]
图4为本发明边缘服务器在不同的信誉范围内的效益示意图。
[0080]
图5为本发明边缘服务器在不同场景下的效益示意图。
具体实施方式
[0081]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0082]
如图1所示，基于工业物联网为背景，本发明提出了工业物联网中时效性感知的联邦学习参与设备激励方法，具体包括以下步骤：
[0083]
步骤一.边缘服务器根据联邦学习任务设计资源条件要求和契约项，在满足资源条件要求后，工业物联网设备被选为候选设备，有资格执行联邦学习任务。
[0084]
联邦学习任务设计要求的资源条件具体包括数据大小、数据类型、cpu频率、训练需要达到的精度、训练时间阈值。资源条件的设置可以确保联邦学习的质量。
[0085]
根据联邦学习任务设计的契约项是(rn(fn)，fn)，fn指的是工业物联网设备n执行联邦学习任务需要付出的计算资源,rn是工业物联网设备n得到的相应的奖励，奖励rn和计算资源fn可以通过求解目标函数得到。
[0086]
步骤二.基于信誉的评估方案来选择高质量的候选设备来执行联邦学习任务：利用平均aoi度量来评估候选设备的数据新鲜度，计算候选设备的综合信誉值，通过综合信誉值选择候选设备为参与设备，参与设备执行联邦学习任务对本地模型进行训练。联邦学习任务完成后，边缘服务器根据交互历史在信誉区块链上更新其直接信誉意见。
[0087]
计算候选设备的综合信誉值，综合信誉值由直接信誉意见和间接信誉意见组成，计算公式为：
[0088][0089]
其中，权重对于一个时间窗口{t1,...,t
x
,...,t
x
}，x表示时间窗口的总数量。间接信誉意见由三个要素组成：信任值不信任值和不确定性值并且间接信誉意见的计算公式为：
[0090][0091]
其中，k是给定的常数，表示对信誉的不确定性的影响水平。引入行为效应来计算间接信誉意见，积极的互动可以增加候选设备的信誉值，反之亦然。为了阻止消极行为事件，在消极互动的情况下会施加更重的惩罚。使用λ1和λ2分别表示积极交互和消极交互的信誉计算权重。λ1+λ2＝1，λ1,λ2∈(0,1)，λ1≤λ2，得到以下公式：
[0092][0093]
其中，和分别是积极交互和消极交互的次数，如果与上次本地模型更新的性能相比，此次本地模型更新的性能下降，则定义为一次消极交互。表示影响信誉意见不
确定性的变量。
[0094]
候选设备的直接信誉值的计算公式为：
[0095][0096]
其中，a为权重值，a∈(0,1)，权重值a大于y1和y2。y1和y2分别表示最近和过去的经验的权重，y1、y2∈(0,1)，y1+y2＝1。定义在一个时隙t内，候选设备n执行联邦学习任务和参与竞争总次数的比率为：en＝pw/pc。pc代表候选设备参与竞争参与设备的总次数，pw为执行联邦学习任务的次数，pw≤pc。最近和过去经验的时间尺度由t
gap
定义，候选设备n的交互经验在最近时隙t内满足t≤t
gap
时为最近的比率t＞t
gap
时为过去的比率时为过去的比率表示候选设备n的平均信息年龄(age of information，aoi)。
[0097]
引入平均信息年龄(aoi)来评估候选设备的数据新鲜度。假设数据在时刻t1,...,tz,...,tz产生，随之在u1,...,uz,...,uz时刻被接收，候选设备n的瞬时信息年龄an(tz)表示为an(tz)＝t
z-uz，用一个时隙t上的候选设备n的平均信息年龄来定义数据的新鲜度，其计算方法为：
[0098][0099]
平均aoi越小，代表数据越新鲜，本地模型更新的质量越高。
[0100]
如果候选设备的综合信誉值大于预定义信誉阈值，设置信誉阈值为0.5，则选择该候选设备作为执行联邦学习任务的参与设备，然后参与设备根据自身的类型来选择最优契约来进行模型训练，任务完成后可以得到相应的奖励。根据自身类型选择契约项，设备本身肯定会根据自身的条件来选择合适的契约项；其实就是执行联邦学习进行本地模型训练，得到的结果需要全局精度达到预定义的值。
[0101]
执行联邦学习任务的过程具体包括：参与执行联邦学习任务的工业物联网设备用其局部数据(训练模型用的仿真数据集是mnist数据集)迭代地训练一个共享的全局模型，并生成本地模型；工业物联网设备将本地模型更新到边缘服务器上，进行全局模型聚合；重复执行上述过程，直到全局模型精度达到预定义的值。
[0102]
联邦学习任务完成后，边缘服务器根据交互历史更新其对参与设备的直接信誉意见，进行块验证和共识方案后将直接信誉意见加入信誉区块链。区块链保证工业物联网设备所提供的数据的真实性。
[0103]
步骤三.在本地模型训练中制定基于时效性感知的联邦学习激励机制：根据步骤一的契约项建立边缘服务器的效益函数作为目标函数，将根据参与设备的个人理性约束和激励相容性约束建立约束条件，推导信息不对称和信息对称条件下的最优契约设计问题，利用凸优化工具得出参与设备的最优契约项。
[0104]
在信息不对称条件下基于时效性感知的联邦学习激励机制去解决一个契约问题，虽然边缘服务器没有关于设备的确切信息，但它可以将参与设备分类为不同的类型，并使用设备类型的统计分布来优化边缘服务器的预期效益，定义了参数θj来评估数据质量，来评估数据质量，是局部模型迭代次数的系数，根据数据质量θj将参与设备分为j种类型，并按
升序排序：θ1≤
…
≤θj≤
…
≤θj。
[0105]
将综合信誉值进行归一化处理得到归一化综合信誉值rj∈(0,1)，使用来表示当全局精度固定时，本地模型更新的迭代次数。在仿真时，可以预设置需要达到的全局精度值，当达到时，本地模型训练停止。设备的综合信誉值越高，代表着本地数据的质量越高，从而本地模型更新的迭代次数也就越少。
[0106]
根据契约项(rj(fj)，fj)来设计类型j设备的效益函数，具体为：
[0107][0108]
式中，ε是一个预定义的能量消耗的权重参数,仿真时ε＝1。表示在全局迭代中传输本地模型更新的能量消耗，且pj是传输功率，σ是一个本地模型更新的数据大小，eh是由不确定的传输环境引起的数据包错误率，hh是类型j设备和边缘服务器之间的点对点链接的通道增益，nh是背景噪声，b是传输带宽。在不失一般性的情况下，因为连续时隙之间的无线通信环境(如信道带宽和信道容量)几乎保持不变，因此假设所有参与设备的网络状态都是相同的，即变，因此假设所有参与设备的网络状态都是相同的，即表示一次局部迭代的能量消耗，且cj、dj分别代表类型j设备在本地模型训练中执行一个数据样本所需的cpu周期数以及使用的本地数据样本的大小，ζ表示类型j设备的计算芯片组的有效电容参数。
[0109]
根据契约项(rj(fj)，fj)设计边缘服务器的效益函数，具体为：
[0110]us
(rj)＝uln(t
max-t
jt
)-lrj[0111]
式中，u表示边缘服务器对参与设备的满意度参数，l代表单位奖励成本，表示一次全局迭代的总时间，t
max
代表边缘服务器为联邦学习任务所容忍的最大时间,且代表边缘服务器为联邦学习任务所容忍的最大时间,且表示本地模型迭代的计算时间，t
jcom
＝σ/(1-ej)bln(1+p
jhj
/nj)代表局部模型更新的传输时间。
[0112]
根据类型j设备的效益函数，利用契约理论设计最优契约，最优契约设计问题为最大化边缘服务器的效益函数：
[0113][0114]
式中，j表示参与设备的总数量，qj表示参与设备属于类型j的可能的概率，
[0115]
不同类型的参与设备需要满足个人理性约束和激励相容性约束，约束条件为：
[0116][0117][0118]
0≤f1＜
···
＜fj，j∈[2,...,j]；
[0119]
t
jcmp
≤t
max
,j∈[1,2,...,j]；
[0120][0121]
其中，r
max
表示边缘服务器的总奖励预算。
[0122]
为推导出最优契约，根据个人理性约束和激励相容性约束,将其简化可以得到松弛的最优契约设计问题，求解松弛的最优契约的解为：
[0123]
令得到：
[0124][0125]
式中，π1＝0，类型k表示取1，2，...，j。
[0126]
将公式(6)带入到中，得到
[0127][0128]
式中，
[0129]
将公式(7)带入到公式(5)中，再移除掉所有的奖励rj，可以得到：
[0130][0131]
约束条件为：
[0132]
0≤f1＜
…
＜fj,j∈[2,...,j]；
[0133]
t
jcmp
≤t
nax
,j∈[1,...,j]；
[0134][0135]
注意，上述问题是一个凹函数，此外，约束集是凸集。利用标准的凸优化工具，cvx进行求解公式(8)，则可以得到最优的计算资源fj和相应的奖励rj。
[0136]
在信息对称条件下基于联邦学习的时效性感知的激励机制去解决一个契约问题。在信息对称条件下，边缘服务器可以准确地知道所有参与设备的类型，而且任何契约项(rj(fj)，fj)都应该满足即任何参与设备的效益为零。
[0137]
通过使每个工业物联网设备的效益为零，将优化问题表述为：
[0138][0139]
约束条件为：
[0140][0141]
t
jcmp
≤t
max
,j∈[1,...,j]；
[0142][0143]
在信息对称条件下任何参与设备的效益为零，假设有一个最优的契约项(rj(fj)，fj
)，也就是说假设边缘服务器可以进一步增加其效益，通过增加计算资源fj的数量直到的数量直到这与假设所矛盾，假设不成立。因此，在信息对称条件下任何设备的效益为零。
[0144]
解决该问题，利用凸优化工具cvx即可得出最优的计算资源fj和相应的奖励rj。
[0145]
步骤四.根据最优契约项的奖励，由边缘服务器使用区块链对参与设备进行支付，边缘服务器不能拒绝付款；智能合约可以帮助监督奖励从边缘服务器到参与设备的传输。
[0146]
边缘服务器使用区块链进行支付时，奖励可以通过区块链上的智能合约自动执行，即契约按照预先确定的规则自动执行交易。如果参与设备未完成联邦学习任务，边缘服务器将受到智能合约条件的保护，拒绝付款。
[0147]
如图2所示，在大多数工业物联网情况下(例如，自动驾驶、远程医疗)，设备需要实时监控周围的物理环境，实时监控系统状态，为智能决策和控制提供及时有效的信息。因此，平均aoi对于工业物联网的实时监控系统和状态更新非常重要，已成为评价信息新鲜度的重要指标。假设数据在时间t1,t2,...tz生成，并在时间u1,u2,...uz依次接受。平均aoi越小，数据就越新鲜。
[0148]
如图3所示，计算直接信誉值时，除平均aoi之外的参数保持不变，得到平均aoi越小，数据越新鲜，直接信誉值越大。
[0149]
计算边缘服务器的效益时，除综合信誉值这一参数改变，其它参数保持不变，如图4所示，边缘服务器的效益随着设备综合信誉范围的增加而增加。随着信誉范围的增加，意味着信誉和高质量设备的数量在增加。设备的高信誉对边缘服务器的效益有积极的影响。平均aoi的引入实现了更准确的信誉计算，并鼓励知名设备以准确、可靠的数据加入学习任务，从而实现更可靠的联邦学习任务。
[0150]
信息对称求解方程如图5所示，信息对称时边缘服务器的效益要高于信息不对称条件下的情景。虽然所提出的信息不对称方案可以鼓励设备找到符合自己类型的契约项，但边缘服务器无法获得确切的设备类型。当信息对称时，每个设备的效益为零，获得的总奖励最小，因此边缘服务器可以获得最大的效益。
[0151]
以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

技术特征：
1.工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，其步骤如下：步骤一.边缘服务器根据联邦学习任务设计资源条件要求和契约项，在满足资源条件要求后，工业物联网设备被选为候选设备；步骤二.利用平均aoi度量候选设备的数据新鲜度，计算候选设备的综合信誉值，通过综合信誉值选择候选设备为参与设备，参与设备执行联邦学习任务对本地模型进行训练；步骤三.根据参与设备的契约项建立边缘服务器的效益函数作为目标函数，根据参与设备的个人理性约束和激励相容性约束建立约束条件，推导信息不对称和信息对称条件下的最优契约设计问题，利用凸优化工具得出参与设备的最优契约项；步骤四.边缘服务器根据最优契约项的奖励使用区块链对参与设备进行支付，边缘服务器不能拒绝付款。2.根据权利要求1所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，所述联邦学习任务设计要求的资源条件包括数据大小、数据类型、cpu频率、训练需要达到的精度和训练时间阈值；根据联邦学习任务设计的契约项是(r
n
(f
n
)，f
n
)，f
n
是工业物联网设备n执行联邦学习任务需要付出的计算资源,r
n
是工业物联网设备n得到的相应的奖励。3.根据权利要求1或2所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，所述计算候选设备的综合信誉值的方法为：综合信誉值为：其中，为直接信誉意见，为间接信誉意见，权重权重权重4.根据权利要求3所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，间接信誉意见由三个要素组成：信任值不信任值和不确定性值并且对于一个时间窗口{t1,
…
,t
x
,
…
,t
x
}，x表示时间窗口的总数量，间接信誉意见为：其中，k是给定的常数；使用λ1和λ2分别表示积极交互和消极交互的信誉计算权重，且λ1+λ2＝1，λ1,λ2∈(0,1)，λ1≤λ2，得到：其中，和分别是积极交互和消极交互的次数；如果与上次本地模型更新的性能相比，此次本地模型更新的性能下降，则定义为一次消极交互；表示影响信誉意见不确定性的变量。5.根据权利要求4所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其
特征在于，所述候选设备的直接信誉值为：其中，a为权重值，a∈(0,1，权重值a大于最近和过去的经验的权重y1和y2，y1、y2∈(0,1，y1+y2＝1；表示候选设备n的平均aoi；定义在一个时隙t内，候选设备n执行联邦学习任务和参与竞争总次数的比率为：e
n
＝p
w
/p
c
，p
c
代表候选设备参与竞争参与设备的总次数，p
w
为执行联邦学习任务的次数，p
w
≤p
c
；最近和过去经验的时间尺度为t
gap
，候选设备n的交互经验在最近时隙t内满足t≤t
gap
时为最近的比率t＞t
gap
时为过去的比率6.根据权利要求5所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，所述平均aoi的计算方法为：假设数据在时刻t1,...,t
z
,...,t
z
产生，随之在u1,...,u
z
,...,u
z
时刻被接收，候选设备n的瞬时信息年龄a
n
(t
z
)表示为a
n
(t
z
)＝t
z-u
z
，用一个时隙t上的候选设备n的平均aoi定义数据的新鲜度为：7.根据权利要求4-6中任意一项所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，如果候选设备的综合信誉值大于预定义信誉阈值，则选择该候选设备作为执行联邦学习任务的参与设备，然后参与设备根据自身的类型来选择最优契约来进行本地模型训练，得到的结果使全局模型的精度达到预定义的值；执行联邦学习任务的过程包括：参与执行联邦学习任务的参与设备用其局部数据迭代地训练一个共享的全局模型，并生成本地模型；参与设备将本地模型更新到边缘服务器上，进行全局模型聚合；重复执行上述过程，直到全局模型精度达到预定义的值；联邦学习任务完成后，边缘服务器根据交互历史更新其对参与设备的直接信誉意见，进行块验证和共识方案后将直接信誉意见加入信誉区块链。8.根据权利要求7所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，所述步骤三中推倒信息不对称条件下的最优契约设计问题的方法为：使用设备类型的统计分布来优化边缘服务器的预期效益，定义参数θ
j
来评估数据质量，来评估数据质量，是局部模型迭代次数的系数，根据数据质量θ
h
将参与设备分为j种类型，并按升序排序：θ1≤
…
≤θ
j
≤
…
≤θ
j
；根据契约项(r
j
(f
j
)，f
j
)来设计类型j设备的效益函数为：式中，ε是一个预定义的能量消耗的权重参数；表示在全局迭代中传输本地模型更新的能量消耗，且p
j
是传输功率，σ是本地模型更新的数据大小，e
j
是由不确定的传输环境引起的数据包错误率，h
j
是类型j设备和边缘服务器之间的点对点链接的通道增益，n
j
是背景噪声，b是传输带宽；表示一次局部迭代的能量消耗，且c
j
、d
j
分别代表类型j设备在本地模型训练中执行一个数据样本所需
的cpu周期数以及使用的本地数据样本的大小，ζ表示类型j设备的计算芯片组的有效电容参数；根据契约项(r
j
(f
j
)，f
j
)设计边缘服务器的效益函数为：u
s
(r
j
)＝uln(t
max-t
jt
)-lr
j
式中，u表示边缘服务器对参与设备的满意度参数，l代表单位奖励成本，t
jt
表示一次全局迭代的总时间，t
max
代表边缘服务器为联邦学习任务所容忍的最大时间,且代表边缘服务器为联邦学习任务所容忍的最大时间,且代表边缘服务器为联邦学习任务所容忍的最大时间,且表示本地模型迭代的计算时间，t
jcom
＝σ/(1-e
j
)bln(1+p
j
h
j
/n
j
)代表局部模型更新的传输时间；根据类型j设备的效益函数，利用契约理论设计最优契约，最优契约设计问题为最大化边缘服务器的效益函数：式中，j表示参与设备的总数量，q
j
表示参与设备属于类型j的可能的概率，不同类型的参与设备需满足个人理性约束和激励相容性约束的约束条件为：不同类型的参与设备需满足个人理性约束和激励相容性约束的约束条件为：0≤f1＜
…
＜f
j
，j∈[2,...,j]；t
jcmp
≤t
max
,j∈[1,2,...,j]；其中，r
max
表示边缘服务器的总奖励预算；根据个人理性约束和激励相容性约束,将其简化得到松弛的最优契约设计问题，求解松弛的最优契约的解为：令得到：式中，π1＝0，类型k表示取1，2，...，j；则：式中，
可得到：约束条件为：0≤f1＜
…
＜f
j
,j∈[2,...,j]；t
jcmp
≤t
max
,∈[1,...,j]；利用标准的凸优化工具cvx进行求解，则可得到最优的计算资源f
j
和相应的奖励r
j
。9.根据权利要求8所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，在信息对称条件下，边缘服务器准确地知道所有参与设备的类型，而且任何契约项(r
j
(f
j
)，f
j
)都应该满足通过使每个工业物联网设备的效益为零，优化问题为：约束条件为：t
jcmp
≤t
max
,∈[1,...,j]；利用凸优化工具cvx得出最优的计算资源f
j
和相应的奖励r
j
。10.根据权利要求8或9所述的工业物联网中时效性感知的联邦学习参与设备激励方法，其特征在于，边缘服务器使用区块链进行支付时，奖励通过区块链上的智能合约自动执行，即契约按照预先确定的规则自动执行交易；如果参与设备未完成联邦学习任务，边缘服务器将受到智能合约的保护，拒绝付款。

技术总结
本发明提出了工业物联网中时效性感知的联邦学习参与设备激励方法，其步骤为：边缘服务器根据联邦学习任务设计资源条件要求和契约项选择候选设备；利用平均AoI度量候选设备的数据新鲜度，计算候选设备的综合信誉值，通过综合信誉值选择候选设备为参与设备，参与设备执行联邦学习任务对本地模型进行训练；根据参与设备的契约项建立边缘服务器的效益函数作为目标函数，建立约束条件，推导信息不对称和信息对称条件下的最优契约设计问题，利用凸优化工具得出参与设备的最优契约项；边缘服务器根据最优契约项的奖励使用区块链对参与设备进行支付。本发明可有效保证边缘服务器和设备的效益；保证激励的公平与参与设备的积极性。性。性。

技术研发人员：徐明亮贺硕王楚姜晓恒任天祥毕聪贤
受保护的技术使用者：郑州大学
技术研发日：2023.05.17
技术公布日：2023/8/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种面向危重症儿童的疼痛表情数据集的构建与验证方法 下一篇：一种钴基金属有机骨架材料及其制备方法和应用

工业物联网中时效性感知的联邦学习参与设备激励方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

工业物联网中时效性感知的联邦学习参与设备激励方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表