一种无人区电力运行数据传输方法、系统、设备及介质与流程
未命名
08-22
阅读:108
评论:0
1.本发明涉及通信技术领域,特别是关于一种无人区电力运行数据传输方法、系统、设备及介质。
背景技术:
2.随着经济的不断发展,中国的中西部地区的基础设施建设不断完善,川藏地区地质构造复杂、人口密度低且地质灾害频发,大部分地区无运营商信号,主流的无线通信设备因能耗等问题无法支撑常态应用。且在广阔的区域传输信号大大增加了工作人员监测和维护系统的难度和成本。
3.因此,基于这些问题,需要一种可用于无人区电力运行数据长距离免维护的数据传输方法。
技术实现要素:
4.针对上述问题,本发明的目的是提供一种无人区电力运行数据传输方法、系统、设备及介质,能够保证无人区电力运行数据长距离免维护传输的。
5.为实现上述目的,本发明采取以下技术方案:第一方面,提供一种无人区电力运行数据传输方法,包括:
6.获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态;
7.根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式;
8.当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端;
9.当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至预先设置的多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。
10.进一步地,该方法还包括预先构建基于actor-critic强化学习的神经网络和dnn网络,包括:
11.获取所需进行电力运行数据传输区域内若干采集点的环境信息;
12.构建基于actor-critic强化学习的神经网络;
13.构建dnn网络;
14.采用训练样本训练dnn网络,并对训练好的dnn网络进行测试。
15.进一步地,所述基于actor-critic强化学习的神经网络包括actor网络和critic网络;
16.actor网络和critic网络均选用含有两层隐藏层的神经网络,actor网络的输入为环境信息和critic网络采用策略梯度方法修正后的q值,actor网络的输出为预测的信道状态,并输出至dnn网络以及反馈至critic网络的第二层隐藏层;
17.critic网络的输入为环境信息和actor网络预测的信道状态,critic网络的输出为通过q学习输出的q值,critic网络还采用策略梯度方法对输出的q值进行修正。
18.进一步地,所述dnn网络包括输入层、第一层隐藏层、第二层隐藏层和输出层;
19.输入层用于输入随机产生的l个角度向量θ,其中,角度向量由入射信号的入射到达的角度组成,入射信号包括期望信号和k个干扰信号;
20.第一层隐藏层的隐藏节点个数为2048个,第二层隐藏层的隐藏节点个数为1024个,两层隐藏层用于增加数据训练;
21.输出层用于在利用随机产生的l个角度向量θ和从mvdr算法权矢量中获得的w
re+im
作为训练样本来训练好dnn模型后输入新的测试数据θ
test
时,输出波束赋形权值矩阵。
22.进一步地,该方法还包括在所需进行电力运行数据传输区域内的若干采集点与终端之间设置多跳中继系统。
23.进一步地,所述多跳中继系统包括若干采集器、一个采集端和若干多跳中继模块;
24.所述采集器用于采集对应采集点处的电力运行数据;
25.所述采集端用于汇总各所述采集器采集的电力运行数据;
26.所述多跳中继模块用于对接收的电力运行数据进行解调和噪声剔除,并采用相同的编码方式进行编码后发送至下一所述多跳中继模块,通过循环冗余校验判断是否收到正确的数据包,如果无误则进行转发,如果有误则将其丢弃。
27.进一步地,所述根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式,包括:
28.当预测的信道状态不满足预先设定的信道状态评估值时,则确定传输方式为中继传输方式;
29.当预测的信道状态满足预先设定的信道状态评估值时,则确定传输方式为直达传输方式。
30.第二方面,提供一种无人区电力运行数据传输系统,包括:
31.信道状态预测模块,用于获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态;
32.传输方式确定模块,用于根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式;
33.直达传输模块,用于当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端;
34.中继传输模块,用于当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至预先设置的多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。
35.第三方面,提供一种处理设备,包括计算机程序指令,其中,所述计算机程序指令被处理设备执行时用于实现上述无人区电力运行数据传输方法对应的步骤。
36.第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时用于实现上述无人区电力运行
数据传输方法对应的步骤。
37.本发明由于采取以上技术方案,其具有以下优点:
38.1、本发明提出了作为直接通信备用线路的多跳中继系统,在直接通信信道环境较差或特殊情况下直接通信无法完成时,启用多跳中继,通过中继可完成电力运行数据的长距离传输。
39.2、本发明使用基于机器学习的波束赋形直接通信方式为主,多跳中继通信方式为辅的双通信方式结合满足川藏无人区电力运行数据的长距离免维护传输,为数据传输的稳定性提供支持。
40.3、本发明采用actor-critic方法进行信道状态信息的预测,无需大量训练集,基于策略的强化学习方法可通过最大化长期折扣回报进行网络参数自修正。
41.4、本发明采用强化学习与深度神经网络学习相结合的方法进行波束赋形权值矩阵的生成,优于传统的神经网络方法,预测结果具有一定的参考价值。
42.综上所述,本发明可以广泛应用于通信技术领域中。
附图说明
43.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在整个附图中,用相同的附图标记表示相同的部件。在附图中:
44.图1是本发明一实施例提供的方法流程示意图;
45.图2是本发明一实施例提供的多跳中继系统结构示意图;
46.图3是本发明一实施例提供的系统架构示意图。
具体实施方式
47.下面将参照附图更详细地描述本发明的示例性实施方式。虽然附图中显示了本发明的示例性实施方式,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本发明,并且能够将本发明的范围完整地传达给本领域的技术人员。
48.应理解的是,文中使用的术语仅出于描述特定示例实施方式的目的,而无意于进行限制。除非上下文另外明确地指出,否则如文中使用的单数形式“一”、“一个”以及“所述”也可以表示包括复数形式。术语“包括”、“包含”、“含有”以及“具有”是包含性的,并且因此指明所陈述的特征、步骤、操作、元件和/或部件的存在,但并不排除存在或者添加一个或多个其它特征、步骤、操作、元件、部件、和/或它们的组合。文中描述的方法步骤、过程、以及操作不解释为必须要求它们以所描述或说明的特定顺序执行,除非明确指出执行顺序。还应当理解,可以使用另外或者替代的步骤。
49.尽管可以在文中使用术语第一、第二、第三等来描述多个元件、部件、区域、层和/或部段,但是,这些元件、部件、区域、层和/或部段不应被这些术语所限制。这些术语可以仅用来将一个元件、部件、区域、层或部段与另一区域、层或部段区分开。除非上下文明确地指出,否则诸如“第一”、“第二”之类的术语以及其它数字术语在文中使用时并不暗示顺序或者次序。因此,以下讨论的第一元件、部件、区域、层或部段在不脱离示例实施方式的教导的
情况下可以被称作第二元件、部件、区域、层或部段。
50.本发明实施例提供的无人区电力运行数据传输方法、系统、设备及介质,以远距离直达传输方式为主,中继传输方式为辅,通过机器模型进行波束赋形权值矩阵的生成完成长距离直接通信并通过多跳中继作为辅助通信系统,为电力运行数据长距离传输的可靠性和免维护性提供支撑,同时也可保证电力数据传输过程中的安全性。
51.实施例1
52.如图1所示,本实施例提供一种无人区电力运行数据传输方法,包括以下步骤:
53.1)预先构建基于actor-critic强化学习的神经网络和dnn网络(深度神经网络),具体为:
54.1.1)获取所需进行电力运行数据传输区域内若干采集点的环境信息s
t
。
55.具体地,环境信息s
t
包括历史信道状态预测结果、导频序列、历史导频信号与当前时刻信道状态的反馈信息以及随机的期望信号和干扰信号组成的向量。
56.1.2)构建基于actor-critic强化学习的神经网络,包括actor网络和critic网络。
57.具体地,基于actor-critic强化学习的神经网络在时隙ts内的瞬时回报为:
[0058][0059]
其中,γ
it
为时隙ts下用户的sinr;i为采集点;m为总采集点数量;b为带宽频率。
[0060]
长期回报为:
[0061][0062]
其中,l为需要计算瞬时奖励的时刻;γ
l-t
为属于[0,1]的折扣因子;r
l+1
为时刻t之后的瞬时奖励。本发明所提出的信道预测方案以获得最优预测策略为目标。
[0063]
具体地,actor网络和critic网络均选用含有两层隐藏层的神经网络,actor网络的输入为环境信息s
t
和critic网络采用策略梯度方法修正后的q值qw(s
t
,a
t
),actor网络的输出为预测的信道状态a
t
(csi),并输出至dnn网络以及反馈至critic网络的第二层隐藏层,actor网络通过确定性地将信道状态a
t
映射到特定的动作来指定当前策略,并直接输出信道状态a
t
;critic网络的输入为环境信息s
t
和actor网络预测的信道状态a
t
,critic网络的输出为通过q学习输出的q值qw(s
t
,a
t
),critic网络还采用策略梯度方法对输出的q值qw(sy,a
t
)进行修正,即将策略函数调整至目标梯度方向,寻找最优动作。长期来看,q学习次数越多,近似q值越接近,预测效果更佳。另外,无需大量数据进行网络训练是基于actor-critic强化学习的神经网络的显著特点。
[0064]
1.3)构建dnn网络。
[0065]
具体地,dnn网络采用试错法确定网络隐藏层数量。
[0066]
具体地,dnn网络包括输入层、第一层隐藏层、第二层隐藏层和输出层,输入层用于输入随机产生的l个角度向量θ,其中,角度向量由入射信号的入射到达的角度组成,入射信号包括期望信号和k个干扰信号,第一层隐藏层的隐藏节点个数为2048个,第二层隐藏层的隐藏节点个数为1024个,两层隐藏层用于增加数据训练,使得网络泛化能力越强,拟合效果
越好,输出层用于在利用随机产生的l个角度向量θ和从mvdr算法权矢量中获得的w
re+im
作为训练样本来训练好dnn模型后输入新的测试数据θ
test
时,输出波束赋形权值矩阵。
[0067]
具体地,第一层隐藏层和第二层隐藏层采用leaky-relu函数激活,输出层采用tanh函数激活,采用adam算法作为优化器。
[0068]
更具体地,在dnn网络中考虑一个阵元数为n的均匀线阵,阵元间距d,有k+1个入射信号,期望信号入射角度为θ0,第k个入射角度为θk,天线的接收信号为x(t)=s(t)+(t),s(t)为期望信号的复包络,n(t)为噪声,a为阵列流形矩阵,入射信号的入射角度为θ时均匀直线阵列的阵列流形a为:
[0069][0070]
当输入k+1个入射信号可组成n
×
k+1的阵列流形矩阵a为:
[0071][0072]
其中,λ为信号的波长。
[0073]
mvdr算法是使干扰和噪声功率最小,其问题可描述为:
[0074][0075]
通过拉格朗日乘子法可求得矢量值w
mvdr
为:
[0076][0077]
其中,w为要求解的矢量值;wh为w的转置共轭;为干性加噪声的协方差矩阵,x
j+n
(t)为第j个干扰加噪声信号,为x
j+n
(t)的转置共轭;a(θ0)为阵列导向向量;ah(θ0)为a(θ0)的转置共轭。
[0078]
更具体地,在adam算法中的参数θ
t+1
更新公式为:
[0079][0080][0081][0082]
其中,t为更新的步数;η为学习率用于控制步幅;m
t
为梯度第一时刻平均值;为m
t
的偏置矫正;v
t
为梯度第二时刻的方差;为v
t
的偏置矫正;为β1的t次幂,β1为一阶矩衰减系数;为β2的t次幂,β2为二阶矩衰减系数,一般设β1为0.9,β2为0.999,参数ε设为10-8
。
[0083]
更具体地,在dnn网络中,设相邻两层网络之间的连接权值矩阵分别为v1、v2、v3,各层偏置为γ1、γ2、γ3,第一层隐藏层的输出h1为:
[0084]
h1=1(
trainv1
+1)(10)
[0085][0086]
第二层隐藏层的输出h2为:
[0087]
h2=1(h
1v2
+2)(12)
[0088][0089]
网络的输出为:
[0090][0091]
网络的损失函数e为:
[0092][0093]
其中,σ1为leaky-relu函数;θ
train
为随机产生l个角度向量;x为变量;w
re+im
为网络目标输出。
[0094]
1.4)采用训练样本{θ
train
,w
re+im
}训练dnn网络,并对训练好的dnn网络进行测试。
[0095]
具体地,输入新的角度向量测试数据θ
train
至dnn网络,dnn网络可自适应地输出权矢量,将网络输出转变为复数形式的权矢量w
dnn
,采用w
dnn
进行波束形成。
[0096]
2)在所需进行电力运行数据传输区域内的若干采集点与终端之间设置多跳中继系统。
[0097]
具体地,如图2所示,多跳中继系统包括若干采集器、一个采集端和若干多跳中继模块,采集器用于采集对应采集点处的电力运行数据,采集端用于汇总各采集器采集的电力运行数据,多跳中继模块用于电力运行数据的传递。
[0098]
具体地,多跳中继模块对接收的电力运行数据进行解调和噪声剔除,并采用相同的编码方式进行编码后发送至下一多跳中继模块,通过循环冗余校验来判断是否收到正确的数据包,如果无误则进行转发,如果有误则将其丢弃。
[0099]
具体地,为实现远距离传输,采用3个多跳中继模块多数情况下可达20km以上距离的信息传输。
[0100]
3)获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态。
[0101]
4)获取待传输电力运行数据。
[0102]
具体地,电力运行数据的发送端可以接收导频信号,并存储历史的导频信号、预测得到的信道状态以及当前时刻信道状态的反馈信息。
[0103]
5)根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式。
[0104]
具体地,当预测的信道状态不满足预先设定的信道状态评估值时,则判断预测的信道状态较差,确定传输方式为中继传输方式;当预测的信道状态满足预先设定的信道状态评估值时,则判断预测的信道状态较好,确定传输方式为直达传输方式。
[0105]
6)当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端。
[0106]
7)当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。
[0107]
本波束赋形权值矩阵的意义是调节发射端的天线,使接收端接受的信号强度尽可能大,在发射端同等发射功率的情况下,采用波束赋形方式传播的距离更远。波束赋形权值矩阵是通过调节发射端天线阵列,确定发射信号(蕴含电力运行数据)主波束方向,起到抗衰落的效果。
[0108]
实施例2
[0109]
如图3所示,本实施例提供一种无人区电力运行数据传输系统,包括:
[0110]
信道状态预测模块,用于获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态。
[0111]
传输方式确定模块,用于根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式。
[0112]
直达传输模块,用于当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端。
[0113]
中继传输模块,用于当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。
[0114]
在一个优选的实施例中,还包括电力运行数据获取模块,用于获取待传输电力运行数据。
[0115]
在一个优选的实施例中,还包括模型构建模块,用于预先构建基于actor-critic强化学习的神经网络和dnn网络。
[0116]
具体地,模型构建模块包括:
[0117]
环境信息获取单元,用于获取所需进行电力运行数据传输区域内若干采集点的环境信息。
[0118]
神经网络构建单元,用于构建基于actor-critic强化学习的神经网络。
[0119]
dnn网络构建单元,用于构建dnn网络。
[0120]
dnn网络训练单元,用于采用训练样本训练dnn网络,并对训练好的dnn网络进行测试。
[0121]
在一个优选的实施例中,基于actor-critic强化学习的神经网络包括actor网络和critic网络;actor网络和critic网络均选用含有两层隐藏层的神经网络,actor网络的输入为环境信息和critic网络采用策略梯度方法修正后的q值,actor网络的输出为预测的信道状态,并输出至dnn网络以及反馈至critic网络的第二层隐藏层;critic网络的输入为环境信息和actor网络预测的信道状态,critic网络的输出为通过q学习输出的q值,critic网络还采用策略梯度方法对输出的q值进行修正。
[0122]
在一个优选的实施例中,dnn网络包括输入层、第一层隐藏层、第二层隐藏层和输出层;输入层用于输入随机产生的l个角度向量θ,其中,角度向量由入射信号的入射到达的
角度组成,入射信号包括期望信号和k个干扰信号;第一层隐藏层的隐藏节点个数为2048个,第二层隐藏层的隐藏节点个数为1024个,两层隐藏层用于增加数据训练;输出层用于在利用随机产生的l个角度向量θ和从mvdr算法权矢量中获得的w
re+im
作为训练样本来训练好dnn模型后输入新的测试数据θ
test
时,输出波束赋形权值矩阵。
[0123]
在一个优选的实施例中,还包括多跳中继系统设置模块,用于在所需进行电力运行数据传输区域内的若干采集点与终端之间设置多跳中继系统。
[0124]
具体地,多跳中继系统包括若干采集器、一个采集端和若干多跳中继模块;采集器用于采集对应采集点处的电力运行数据;采集端用于汇总各采集器采集的电力运行数据;多跳中继模块用于对接收的电力运行数据进行解调和噪声剔除,并采用相同的编码方式进行编码后发送至下一所述多跳中继模块,通过循环冗余校验判断是否收到正确的数据包,如果无误则进行转发,如果有误则将其丢弃。
[0125]
在一个优选的实施例中,传输方式确定模块包括:当预测的信道状态不满足预先设定的信道状态评估值时,则确定传输方式为中继传输方式;当预测的信道状态满足预先设定的信道状态评估值时,则确定传输方式为直达传输方式。
[0126]
本实施例提供的系统是用于执行上述各方法实施例,具体流程和详细内容请参照上述实施例,此处不再赘述。
[0127]
实施例3
[0128]
本实施例提供一种与本实施例1所提供的无人区电力运行数据传输方法对应的处理设备,处理设备可以适用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行实施例1的方法。
[0129]
所述处理设备包括处理器、存储器、通信接口和总线,处理器、存储器和通信接口通过总线连接,以完成相互间的通信。存储器中存储有可在处理设备上运行的计算机程序,处理设备运行计算机程序时执行本实施例1所提供的无人区电力运行数据传输方法。
[0130]
在一些实现中,存储器可以是高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
[0131]
在另一些实现中,处理器可以为中央处理器(cpu)、数字信号处理器(dsp)等各种类型通用处理器,在此不做限定。
[0132]
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0133]
本领域技术人员可以理解,上述计算设备的结构,仅仅是与本技术方案相关的部分结构,并不构成对本技术方案所应用于其上的计算设备的限定,具体的计算设备可以包括更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0134]
实施例4
[0135]
本实施例提供一种与本实施例1所提供的无人区电力运行数据传输方法对应的计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本实施例1所述的无人区电力运行数据传输方法的计算机可读程序指令。
[0136]
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
[0137]
上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
[0138]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0139]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0140]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0141]
上述各实施例仅用于说明本发明,其中各部件的结构、连接方式和制作工艺等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。
技术特征:
1.一种无人区电力运行数据传输方法,其特征在于,包括:获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态;根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式;当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端;当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至预先设置的多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。2.如权利要求1所述的一种无人区电力运行数据传输方法,其特征在于,该方法还包括预先构建基于actor-critic强化学习的神经网络和dnn网络,包括:获取所需进行电力运行数据传输区域内若干采集点的环境信息;构建基于actor-critic强化学习的神经网络;构建dnn网络;采用训练样本训练dnn网络,并对训练好的dnn网络进行测试。3.如权利要求2所述的一种无人区电力运行数据传输方法,其特征在于,所述基于actor-critic强化学习的神经网络包括actor网络和critic网络;actor网络和critic网络均选用含有两层隐藏层的神经网络,actor网络的输入为环境信息和critic网络采用策略梯度方法修正后的q值,actor网络的输出为预测的信道状态,并输出至dnn网络以及反馈至critic网络的第二层隐藏层;critic网络的输入为环境信息和actor网络预测的信道状态,critic网络的输出为通过q学习输出的q值,critic网络还采用策略梯度方法对输出的q值进行修正。4.如权利要求2所述的一种无人区电力运行数据传输方法,其特征在于,所述dnn网络包括输入层、第一层隐藏层、第二层隐藏层和输出层;输入层用于输入随机产生的l个角度向量θ,其中,角度向量由入射信号的入射到达的角度组成,入射信号包括期望信号和k个干扰信号;第一层隐藏层的隐藏节点个数为2048个,第二层隐藏层的隐藏节点个数为1024个,两层隐藏层用于增加数据训练;输出层用于在利用随机产生的l个角度向量θ和从mvdr算法权矢量中获得的w
re+im
作为训练样本来训练好dnn模型后输入新的测试数据θ
test
时,输出波束赋形权值矩阵。5.如权利要求1所述的一种无人区电力运行数据传输方法,其特征在于,该方法还包括在所需进行电力运行数据传输区域内的若干采集点与终端之间设置多跳中继系统。6.如权利要求5所述的一种无人区电力运行数据传输方法,其特征在于,所述多跳中继系统包括若干采集器、一个采集端和若干多跳中继模块;所述采集器用于采集对应采集点处的电力运行数据;所述采集端用于汇总各所述采集器采集的电力运行数据;所述多跳中继模块用于对接收的电力运行数据进行解调和噪声剔除,并采用相同的编码方式进行编码后发送至下一所述多跳中继模块,通过循环冗余校验判断是否收到正确的数据包,如果无误则进行转发,如果有误则将其丢弃。
7.如权利要求1所述的一种无人区电力运行数据传输方法,其特征在于,所述根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式,包括:当预测的信道状态不满足预先设定的信道状态评估值时,则确定传输方式为中继传输方式;当预测的信道状态满足预先设定的信道状态评估值时,则确定传输方式为直达传输方式。8.一种无人区电力运行数据传输系统,其特征在于,包括:信道状态预测模块,用于获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态;传输方式确定模块,用于根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式;直达传输模块,用于当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至dnn网络得到波束赋形权值矩阵,实时形成波束并输出至终端;中继传输模块,用于当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至预先设置的多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端。9.一种处理设备,其特征在于,包括计算机程序指令,其中,所述计算机程序指令被处理设备执行时用于实现权利要求1-7中任一项所述的无人区电力运行数据传输方法对应的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时用于实现权利要求1-7中任一项所述的无人区电力运行数据传输方法对应的步骤。
技术总结
本发明涉及一种无人区电力运行数据传输方法、系统、设备及介质,该方法包括:获取所需进行电力运行数据传输区域内对应采集点的环境信息并输入至预先构建的基于actor-critic强化学习的神经网络中,得到预测的信道状态;根据预先设定的信道状态评估值和预测的信道状态,确定传输方式为直达传输方式或中继传输方式;当传输方式为直达传输方式时,将获取的待传输电力运行数据转换为发射信号后,输入至DNN网络得到波束赋形权值矩阵,实时形成波束并输出至终端;当传输方式为中继传输方式时,将获取的待传输电力运行数据输入至预先设置的多跳中继系统中,多跳中继系统对接收的数据进行处理后输出至终端,本发明可以广泛应用于通信技术领域中。通信技术领域中。通信技术领域中。
技术研发人员:刘敏 金广祥 位祺 王玉东 李疆生 张蒙晰 周波
受保护的技术使用者:国网四川省电力公司电力科学研究院
技术研发日:2023.05.26
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种混合燃料矿粉烧结机的制作方法 下一篇:一种通风管道安装用连接吊架的制作方法
