一种多站点风速预测方法

未命名 10-18 阅读:225 评论:0


1.本发明涉及信息技术和气象技术领域,尤其涉及一种多站点风速预测方法。


背景技术:

2.风速预测作为天气预测重要组成之一,准确的风速预测对于经济,商业和管理非常重要,它会影响相关部门的决策过程和资源部署,不仅可以用于预测自然灾害,还可以为气候变化分析提供指导。由于受温度、海拔、地形、气压等因素的影响,风能具有波动性、随机性和不稳定性的特点,因此准确地进行风速预测面临很多挑战。
3.目前,天气预报方法通常包括基于nwp(值天气预报,numerical weather prediction)模型、机器学习模型、深度学习模型等方式,但上述方式存在如下缺点和不足:
4.nwp模型通过求解复杂的数学方程,尽可能地模拟现实世界的大气、流体和热力学。这种方法需要巨大的计算能力,即使使用当前的技术设备和工具,也可能需要几个小时才能完成处理。
5.机器学习模型与nwp模型相比,虽然能够减少处理时间,但机器学习任务更多的是线性回归预测,对于空间的相关性缺乏考虑导致预测精度较低。
6.基于卷积神经网络(convolutional neural network,cnn)的深度学习方法是在规则矩阵的前提下进行卷积操作,而风速站点分布如图1所示呈不均匀状态,难以在保证空间信息关联性不变的前提下进行规则排列,所以一般的卷积网络中无法捕获气象站之间的空间关系。


技术实现要素:

7.本发明所要解决的技术问题是针对现有技术存在的问题,提供一种多站点风速预测方法、系统、存储介质及计算设备。
8.为解决上述技术问题,本发明提供一种多站点风速预测方法,包括:对各个气象监测站采集的气象数据进行数据预处理;将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;将所述时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。
9.为解决上述技术问题,本发明还提供一种多站点风速预测系统,包括:预处理模块、数据流生成模块和预测模块;预处理模块用于对各个气象监测站采集的气象数据进行数据预处理;数据流生成模块用于将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;预测模块用于将所述时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。
10.为解决上述技术问题,本发明还提供一种计算机可读存储介质,包括指令,其特征在于,当所述指令在计算机上运行时,使所述计算机执行上述技术方案提供的多站点风速预测方法。
11.为解决上述技术问题,本发明还提供一种计算设备,包括存储器、处理器及存储在
所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述技术方案提供的多站点风速预测方法。
12.本发明的有益效果是:本发明将不规则分布的气象监测站抽象为图结构,将不同时间步长的气象数据变量(例如温度,风速,气压等)值视为时空图数据;使用图卷积网络提取局部空间信息,结合多空间注意力机制建立不同节点之间的注意力分数然后进行动态注意力计算和转换,从而实现高精度风速预测的任务。
13.本发明附加的方面及其优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
14.图1为站点分布图;
15.图2为本发明一实施例提供的多站点风速预测方法流程图;
16.图3为本发明实施例中站点之间的分布图;
17.图4为本发明实施例中顶点连接分布图;
18.图5为本发明实施例中时空数据流示意图;
19.图6为本发明实施例中采样算法示例图;
20.图7为本发明另一实施例提供的多站点风速预测方法流程图;
21.图8为本发明实施例提供的图动态注意力网络模型结构图;
22.图9为本发明实施例中dae和sad构成及连接结构图;
23.图10为本发明使用的多空间注意力计算的数据计算过程图。
具体实施方式
24.以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
25.需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
26.图2为本发明实施例提供的多站点风速预测方法流程图。如图2所示,该方法包括:
27.s1,对各个气象监测站采集的气象数据进行数据预处理。
28.本发明实施例中,采集到的气象数据可以包括温度、露点、风向、风速和大气压强
等。进行数据预处理的手段可以包括删除、填充、切片和归一化处理等。站点数据包含缺失值,主要原因是传感器采集数据时造成的。通过对数据的初步处理和分析,云量的气象因素缺失数量较多,每个站点的缺失数据站总体数据的98%,所以对于此类数据在实验过程中会进行删除。对于风向、风速、露点和降水等气象指标缺失较少,通过采用线性插值的方式进行数据填充。对数据处理完后,根据气象站点位置提取不同站点的时序数据。采用滑动窗口的的方式对所有数据进行切片;滑动窗口的数据使用过去一周和未来12小时分别作为历史输入数据和未来预测数据,每次滑步长度为1。这样就对所有的实验数据完成了切片。最后使用线性函数对训练数据和测试数据数据进行归一化。
29.s2,将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流。
30.图3是15个站点的不规则分布。将该图中的节点看作为图的顶点,然后按照顶点之间的位置计算距离,抽象得到的空间结构图如图4所示。
31.按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流如图5所示。
32.s3,将时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。
33.本发明实施例将不规则分布的气象监测站抽象为图结构,将不同时间步长的气象数据变量(例如温度,风速,气压等)值视为时空图数据。使用图卷积网络提取局部空间信息,结合多空间注意力机制建立不同节点之间的注意力分数然后进行动态注意力计算和转换,从而达到预测未来风速的目的并使用自回归模型进行多步预测,实现高精度风速预测的任务。
34.可选地,在一个实施例中,空间结构图将气象监测站作为图的顶点,气象监测站之间的距离作为构建连接边的因素重构空间结构图的分布;带权邻接矩阵w作为顶点之间的连接方式,空间结构图的带权邻接矩阵w的公式如下:
[0035][0036]
其中,σ和ε是用于调整带权邻接矩阵w的分布和稀疏度的超参数,为常数;d
ij
表示节点i和节点j之间的距离;σ和ε可以通过人为设定来控制带权邻接矩阵的分布和稀疏度,d
ij
是通过节点i和j的经纬度计算其之间的距离,具体计算方式可以表示为如下公式:
[0037][0038]
其中r
radius
为地球半径;lati、longi和latj、longj分别为节点i和节点j的纬度和经度;b=long
i-longj、a=lat
i-latj分别表示两节点经纬度之差。
[0039]
该实施例中,通过节点的经纬度构建的带权邻接矩阵,在进行图卷积过程中,考虑了节点聚合周围的特征的同时时也包含自身的特征。
[0040]
上述实施例中,通过定义带权邻接矩阵的方式可以将站点分布之间的空间相关性
进行建模,因为类似气象站点这种具备不规则空间分布结构的数据中,一般的卷积是无法进行特征提取,所以将数据通过构建图结构的连接时可以将普通卷积过程泛化到非欧氏空间中,这样便可以达到站点之间数据特征的传递和聚合。通过这种方式进行实验并和传统的cnn卷积进行对比,发现本发明中的使用定义带权邻接矩阵的方法预测准确度都有所提高,其1小时,6小时和12小时预测的准确度的rmse分别提高了3.9%、10.9%和14.4%。
[0041]
可选地,在一个实施例中,时空数据流第t时间步的空间结构图表达式如下
[0042]gt
=(v
t
,e,w);
ꢀꢀꢀ
(3)
[0043]
其中,v
t
表示第t时刻上的顶点集n,n为顶点个数,不同时间步中顶点的数量不变,每个站点的特征属性随时间而变化,w表示带权邻接矩阵,e表示边集,是由带权邻接矩阵w得到的顶点之间的连接关系;具体可以描述为带权邻接矩阵中非零元素的顶点之间即存在一条边。
[0044]
基于时空图网络的多站点风速预测问题是将历史数据作为输入,然后通过建模神经网络模型得到建模函数f(
·
),然后通过f(
·
)预测未来时间段的站点风速值,整体描述可以表示为:
[0045][0046]
其中,为图特征矩阵,c表示特征维度,t表示时间步,图特征矩阵表示时间步t的空间网络g的各个顶点观测值;t表示历史时空网络序列的长度,p表示要预测的目标时空网络序列的长度。
[0047]
上述实施例中,通过建模时空数据流的方式可以更好地表示图数据的时序关系,使得多元时空站点风速预测更加直观,也解决了一般cnn卷积过程中对于非规则空间结构的无法提取特征的弊端。
[0048]
可选地,在一个实施例中,将时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测,包括:
[0049]
s31,在空间结构图中分别以每个顶点为中心按照带权邻接矩阵进行图采样,获得每个顶点的一阶邻居节点和二阶邻居节点;顶点、顶点对应的一节邻居节点及二阶邻居节点构成顶点的采样子图。
[0050]
为了和输入对应,在全图中分别以每个顶点为中心进行图的采样,具体采样方法是按照带权邻接矩阵w进行的。
[0051]
在空间结构图的全图中分别以每个顶点为中心按照带权邻接矩阵进行图采样,获得采样子图,包括:以一顶点x为中心选择第一预设数量的最接近的邻居点,并按距离从小到大排列,获得一阶邻居节点xd,再以顶点为中心选择第二预设数量的最接近的邻居点,并按距离从小到大排列,获得二阶邻居节点x;顶点x、一阶邻居节点xd和二节邻居节点x构成顶点x的采样子图,第二预设数量大于第一预设数量。
[0052]
如图6给出了采样算法的示例;有s1、s2、s3、s4、s5、s6和s7的7个顶点,它们之间的连接是w中表示的权重。首先将顶点中心作为x,即x={s1},然后选择以顶点x为中心的最接近或者最亲密的若干一阶邻居以表示xd={s1,s2,s3,s4},最后再此基础上选择若干二阶邻居表示x={s1,s2,s3,s4,s5,s6,s7};通过对采样的节点进行相对位置的排列,具体排列的顺序为目标节点,与其亲密的邻居1、与其亲密的邻居2、与其亲密的邻居3、
……
与其次亲
密的邻居n以此形成逻辑上的并列关系;其中,n为正整数。因此上述的相对位置可以表示为x={s1},xd={s1,s3,s4,s1},x={s1,s3,s4,s2,s7,s6,s5}。对每个节点重复上述过程则可以获得以每个节点为中心的xd、x和x其相应的相对位置。由于在stpe中,由于相对位置编码会随着中心节点的变化而变化,在一段时间内,中心节点会随着预测任务的目标随着时间发生相应改变,所以对于h时间段内其相应的相对位置编码和时间编码一一对应。
[0053]
s32,计算预设时间段内采样子图的时空位置编码。
[0054]
首先计算h时间段内采样子图的相对位置编码(spe),此部分使用类似自然语言处理(natural language processing,nlp)的相对位置编码的方式进行改进和创新,主要原因是能够显式地对输入序列中任意两个亲密节点的位置关系进行建模。使用不同频率的正弦和余弦函数计算给定相对顶点坐标的spe:
[0055][0056]
其中,是在采样子图图中顶点i的编码维度序号为l的向量,d是每一个位置经过编码后的投影的向量维度;在计算了所有维度之后表示spe的数据维度是1
×nlocal
×
d,n
local
是在不同的局部采样子图中的顶点个数,在此编码中给定不同xd、x和x,经过编码后得到一阶邻居节点的相对位置编码值x'd、二阶邻居节点的相对位置编码值x'和顶点相对位置编码值x'。以上得到的所有的空间位置编码都是静态的,可以在训练之前提前进行计算以节约模型训练过程中的计算时间。
[0057]
接下来计算h时间长度的时间位置编码(tpe),针对采样子图,由于时间编码对于所有节点其时间变化的规律都是一样,所以针对xd、x和x按照节点输入的不同先进行时间外部信息的全连接投影,然后再进行embedding操作将投影的信息加入到节点的特征数据中。具体操作可以描述为采样子图的一阶邻居节点xd、二阶邻居节点x和顶点x分别作为时间位置编码的输入,可分别得到一阶邻居节点的时间位置编码值x'd'、二阶邻居节点的时间位置编码值x”和顶点的时间位置编码值x”。由于时间外部特征对于采样子图来说都是一致性变化的,所以不同采样子图得到的时间位置编码也一致。r是时间位置编码的输入,表示h时间步长的时间特征表示即r={r1,r2,...rh}:
[0058]
tpe=σ(relu(rw1+b1)w2+b2) (6)
[0059]
其中w1∈r
t
×d,w2∈rd×d,b1,b2是可学习参数,σ表示激活函数,tpe∈rh×1×d表示h时间步的时间编码表示,d是投影维度,其值同位置编码的投影向量维度一致。
[0060]
s33,分别对一阶邻居节点和二阶邻居节点进行频域图卷积,获得第一卷积结果和第二卷积结果,分别将第一卷积结果和第二卷积结果与采样子图的时空位置编码求和,获得第一求和结果和第二求和结果。
[0061]
由于网络图结构可以描述为g=(v,e,w),v∈rn是节点集合,n是节点的个数,e∈rn×n是边集合,w∈rn×n是邻接矩阵,d
ii
=∑jw
ij
是度矩阵。利用邻接矩阵w和度矩阵d定义图的归一化laplacian矩阵l:
[0062][0063]
根据频域图卷积的概念定义卷积核g
θ
与图节点特征x的卷积操作:
[0064]gθ
*x=g
θ
(l)x=g
θ
(uλu
t
)x=ug
θ
(λ)u
t
x
ꢀꢀꢀ
(8)
[0065]
其中,in为n阶的单位矩阵,l为实对称矩阵,u是l的特征向量矩阵,λ是l的特征值组成的对角矩阵。
[0066]
通过对时空数据的构建可以完整的表达不同时间图中的顶点信息表示,并利用频域图卷积提取其空间特征。由于一般的频域图卷积要对拉普拉斯矩阵进行特征分解,所以时间复杂度过高,因此采用基于chebnet定义特征向量对角矩阵的切比雪夫多项式近似为图卷积核,通过使用迭代定义的切比雪夫多项式tk(x)的k阶展开来拟合即:
[0067][0068]
其中,为缩放后的特征向量矩阵,λ
max
是拉普拉斯矩阵的最大特征值,θ∈rk是切比雪夫系数的向量,切比雪夫多项式递归定义为:
[0069][0070]
通过时间步可以将空间结构图组织成为时空数据流,于是对于每个时刻的空间结构图x与图卷积核g
θ
的卷积结果输出y定义为:
[0071][0072]
其中w是邻接矩阵,卷积核ci是空间结构图输入维度,投影输出维度为co。对于一张完整的时空图,输入m个时间步特征向量图卷积之后输出
[0073]
s34,提取顶点的空间特征,将顶点的空间特征先通过全连接网络映射,再与采样子图的时空位置编码求和,获得第三求和结果。
[0074]
s35,根据第一求和结果和第二求和结果进行动态注意力编码,获得注意力编码结果;
[0075]
s36,根据注意力编码结果和第三求和结果进行转换注意力解码,获得注意力转换结果;
[0076]
s37,注意力转换结果通过全连接网络生成多站点风速预测结果。
[0077]
如图7所示,对各个气象监测站采集的气象数据进行数据预处理;将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流。图动态注意力网络模型包括频域图卷积部分、时空位置编码部分、动态注意力编码器部分、转后注意力解码器部分和预测输出部分。按照上文的描述的方式将时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。输出预测
结果后进行结果展示和指标评价。
[0078]
图8为图动态注意力网络模型结构图。输入的三部分分别是x、x和xd;xd是x的一个子集,属于图g
t
的局部子图区域,x是x在g
t,i
=(v
ti
,e,w)的第i个顶点的当前t时刻的特征信息。对于x和xd使用图卷积网络(gcn)、x使用全连接神经网络(full connect neural network,fcn)进行空间投影。然后按照邻接采样算法进行相应的位置排列并分别计算采样后的相对空间位置编码和时间位置编码生成时空位置编码(spatio-temporal position encoding,stpe)。在进入动态注意力编码器(dynamic attention encoder,dae)或转换注意力解码器(switch-attention decoder,sad)之前,将输入投影的结果与相应的时空位置编码相加。dae设计为两层编码器框架,包含两层编码器enc-g和enc-d,sad实现了两层解码器dec-s和dec-t,在它们之间执行注意力计算和转化操作。表示将输入结果通过gcn或者fcn后与时空位置编码投影的结果相加,从而将时空信息加入到输入变量中;表示维度转化以实现动态注意力转换操作,b表示使用的gcn和fcn的网络层数,s表示编码器和解码器的层数;输出out是模型最终的预测值。
[0079]
上述实施例中,可以通过多空间注意力计算得到更加准确的预测结果,因为transformer模型最近在时序预测上面取得了良好的效果,因为自注意力机制的出现使得在时空相关性的捕获中可一得到更加准确的计算结果,动态注意力编码器机制是通过数据数据先计算自注意力机制,然后在不同的子空间中计算注意力并将信息进行压缩表示,而转换注意力解码器是将压缩后的信息表示通过中心节点的输入将信息解码表示;大部分的transformer模型都拥有这两种结构并且在预测性能上也有着还不错的表现。
[0080]
可选地,在一个实施例中,根据第一求和结果和第二求和结果进行动态注意力编码,获得注意力编码结果,包括:将第一求和结果输入动态注意力编码器的第一msa进行自注意力计算,计算结果经过第一前馈网络进行维度对齐,输出结果作为第一k值和第一v值;将第二求和结果输入动态注意力编码器的第二msa进行自注意力计算,输出结果作为第一q值;将第一q值、第一k值和第一v值输入第三msa普通进行注意力计算,计算结果经过第二前馈网络进行维度对齐,得到注意力编码结果。
[0081]
可选地,在一个实施例中,根据注意力编码结果和第三求和结果进行转换注意力解码,得到多站点风速预测结果,包括:将第三求和结果输入转换注意力解码器的第四msa进行自注意力计算,输出第二q值;将注意力编码结果作为第二k值和第二v值,并和第二q值输入第五msa进行自注意力计算,计算结果经过第三前馈网络进行维度对齐,输出第三k值和第三v值;将第三求和结果输入转换注意力解码器的第六msa进行自注意力计算,其输出结果作为第三q值;将第三q值、第三k值和第三v值输入第七msa普通进行注意力计算,计算结果经过第四前馈网络进行维度对齐,得到注意力解码结果。
[0082]
本发明实施例中,将原始输入xd、x和x通过时空位置编码得到相应的x'd、x'、x'和x
″d、x

、x

;然后将x和xd进行频域图卷积,将x通过全连接网络映射,上述得到的结果再与采样子图的时空位置编码求和,分别获得第一求和结果,第二求和结果和第三求和结果,利用动态注意力编码器从采样子图的二阶邻居节点得到的第一求和结果中提取相关的全局信息;将采样子图的一阶邻居节点得到的第二求和结果中经过多空间注意力机制计算与全局信息进行结合;通过转换注意力解码器对动态注意力编码器的输出结果进行注意力转换,输出结果作为多站点风速预测结果。
[0083]
如图9所示动态注意编码器(dae)从全局输入即采样子图中二阶邻居输入节点得到的第一求和结果中提取相关的全局信息,然后将一阶邻居输入的到的第二求和结果经过多空间注意力机制计算与全局信息进行结合。由于多空间注意力机制(msa)通过截断时空来进行注意力计算,在不同的子空间中留下了分离的结果,然后通过转换注意力解码器(sad)转换dae的输出来转换注意力,并进一步跨子空间执行msa以计算最终输出。
[0084]
在dae和sad中使用多空间注意力机制(msa)分别进行注意力计算。其中过程如图10所示,将query,key,value作为msa输入,msa通过缩放点积方式计算注意力加权输出。在msa中计算多头注意力时,第i个注意力头执行的关注机制可以表述为:
[0085][0086]
其中,dh=d/nh表示每个注意力头中的维度,d是输入msa的投影维度,与之前使用全连接网络和位置编码投影维度是一致的,nh是注意力头的数量,m是一种人工阈值掩码,通过调整函数的输入以操纵注意力分数从而过滤掉某些不重要节点的信息;msa的公式概括为:
[0087][0088]
其中w
iq
、w
ik
、w
iv
和wo是可学习参数,通过多头注意力计算后将结果在最后一个通道进行拼接,其中||表示拼接步骤。
[0089]
由于不同的顶点和不同时间步的邻居节点的数量和分布是动态的,并考虑临近节点和其他较远重要节点的影响。dae从全局输入中提取与顶点相关性较强的特征信息。本发明实施例采用注意力机制计算捕捉不同时序的关系;第一个编码器(enc-g)使用自注意力机制计算全局输入x与时空位置编码的第一求和结果的表示,之后在enc-d实现动态提取;第二编码器(enc-d)将xd与时空位置编码的第二求和结果作为输入通过自注意力机制计算一个query q,然后将enc-g的输出作为key k和value v。然后将q、k和v通过附加的msa层从全局表示中选择信息并进行压缩表示。每一个enc-g执行自注意力机制计算后接一个前馈网络(feed forward network,ffn)以完成维度的对齐。使用阈值掩码mg来筛选出不重要的网格顶点从而使得某些节点经过softmax后注意力分数变为0。最后经过enc-d后接ffn就可以将所需要的全局信息提取完成并将其作为sad的输入。整个编码器部分的主要工作是将所有输入数据提取特征,然后经过多空间注意力部分提取时空相关性然后进行提取信息的压缩表示。
[0090]
msa通过截断时空进行注意力计算,并在不同的子空间中留下了分离的结果。sad通过转换dae的输出来转换注意力并进一步在子空间中执行msa以计算最终输出。在sad中,dec-s和dec-t均包含两层msa和一个ffn,其结构和动态注意力编码器的结构类似,输入的x经过全连接网络并与时空位置编码求和之后得到的第三求和结果并通过维度扩展得到将作为dec-s的输入,在这期间会使用自回归模型形成多步预测。经过第一层的自注意力计算得到query q,期间会使用阈值掩码和前瞻掩码mask掉输入位置后的序列信息。dae的输出作为key k和value v,然后将q、k和v作为第二个msa的输入,经过ffn后得到包含由子空间中的msa计算的输出。全连接网络并与时空位置编码求和之后得到的第三求和结果通
过维度扩展得到经过第一层自注意力机制计算得到query q,dec-s的输出作为key k和value v。在dec-t的第二个msa中,输入的q和计算输出的结果通过两个转换门后将前两个维度进行转换,最后经过ffn得到输出h
t
,然后将得到结果通过全连接网络生成最终的预测out:
[0091]
out=σ(h
t
wy+by)
ꢀꢀꢀꢀ
(14)
[0092]
其中,h
t
为转换注意力解码器的输出结果wy和by是可学习参数,σ为激活函数。
[0093]
通过均方根误差(root mean square error,rmse)和平均绝对误差(mean absolute error,mae)作为模型的评价指标可以评价预测结果的准确度,并可以采用可视化方法将预测结果进行展示。
[0094]
上述实施例中,通过编解码器的计算和输出可以有效减少误差在模型计算过程中的传递,使用均方根误差rmse和平均绝对误差mae来衡量预测值和真实值之间的误差可以更加直观,通过以上步骤便可以达到本发明的基本功能和效果,可以对于不同时长的气象数据进行预测,并通过数据可视化便可以更加形象的得到最终结果。
[0095]
本发明实施例提出的模型预测1小时、6小时和12小时得到的rmse和mae均小于比较的基线模型convlstm、stdn、xgboost、dsan和dsan-ns;其中1小时预测的rmse分别降低了28.9%,27.6%,9.5%,3.9%和6.1%;6小时预测的rmse分别降低了15.1%,12.7%,4.1%,10.6%和11.5%;12小时预测的rmse分别降低了28.2%,8.9%,2.7%,14.4%和11.9%。
[0096]
模型运行环境为:cpu版本intel(r)xeon(r)silver 4208cpu@2.10ghz,gpu版本nvidia tesla t4;操作系统为:ubuntu 18.04.5,编程语言为:python,深度学习框架为:tensorflow-2.4。
[0097]
本发明实施例还提供一种多站点风速预测系统,包括:预处理模块、数据流生成模块和预测模块;预处理模块用于对各个气象监测站采集的气象数据进行数据预处理;数据流生成模块用于将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;预测模块用于将时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。
[0098]
本发明实施例还提供一种计算机可读存储介质,包括指令,当指令在计算机上运行时,使计算机执行上述实施例提供的多站点风速预测方法。
[0099]
本发明实施例还提供一种计算设备,包括存储器、处理器及存储在存储器上的并可在处理器上运行的计算机程序,处理器执行程序时实现上述实施例提供的多站点风速预测方法。
[0100]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0101]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0102]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0103]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0104]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0105]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种多站点风速预测方法,其特征在于,包括:对各个气象监测站采集的气象数据进行数据预处理;将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;将所述时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。2.根据权利要求1所述的多站点风速预测方法,其特征在于,所述空间结构图将气象监测站作为图的顶点,气象监测站之间的距离作为构建连接边的因素重构空间结构图的分布;将带权邻接矩阵w作为顶点之间的连接方式,所述空间结构图的带权邻接矩阵w的公式如下:其中,σ和ε是用于调整带权邻接矩阵w的分布和稀疏度的超参数,为常数,d
ij
表示节点i和节点j之间的距离。3.根据权利要求2所述的多站点风速预测方法,其特征在于,所述时空数据流第t时间步的空间结构图表达式如下:g
t
=(v
t
,e,w);其中,v
t
表示第t时刻上的顶点集n,n为顶点个数,不同时间步中顶点的数量不变,每个站点的特征属性随时间而变化,w表示带权邻接矩阵,e表示边集,是由带权邻接矩阵w得到的顶点之间的连接关系;基于时空图网络的多站点风速预测问题整体描述表示为:通过神经网络模型的构建获得建模函数f(
·
),通过历史输入数据预测未来时间的风速;其中,为图特征矩阵,c表示特征维度,t表示时间步,图特征矩阵表示时间步t的空间网络g的各个顶点观测值;t表示历史时空网络序列的长度,p表示要预测的目标时空网络序列的长度。4.根据权利要求1至3任一项所述的多站点风速预测方法,其特征在于,所述将所述时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测,包括:在所述空间结构图中分别以每个顶点为中心按照带权邻接矩阵进行图采样,获得每个顶点的一阶邻居节点和二阶邻居节点;所述顶点、顶点对应的一节邻居节点及二阶邻居节点构成所述顶点的采样子图;计算预设时间段内所述采样子图的时空位置编码;分别对所述一阶邻居节点和所述二阶邻居节点进行频域图卷积,获得第一卷积结果和第二卷积结果,分别将所述第一卷积结果和所述第二卷积结果与所述采样子图的时空位置编码求和,获得第一求和结果和第二求和结果;
提取所述顶点的空间特征,将所述顶点的空间特征先通过全连接网络映射,再与所述所述采样子图的时空位置编码求和,获得第三求和结果;根据所述第一求和结果和所述第二求和结果进行动态注意力编码,获得注意力编码结果;根据所述注意力编码结果和所述第三求和结果进行转换注意力解码,获得注意力转换结果;所述注意力转换结果通过全连接网络生成多站点风速预测结果。5.所述根据权利要求4所述的方法,其特征在于,所述获得每个顶点的一阶邻居节点和二阶邻居节点,包括:以一顶点x为中心选择第一预设数量的最接近的邻居点,并按距离从小到大排列,获得一阶邻居节点x
d
,再以所述顶点为中心选择第二预设数量的最接近的邻居点,并按距离从小到大排列,获得二阶邻居节点x;所述顶点x、一阶邻居节点x
d
和二节邻居节点x构成所述顶点x的采样子图,所述第二预设数量大于所述第一预设数量。6.所述根据权利要求4所述的方法,其特征在于,所述计算预设时间段内采样子图的时空位置编码,包括:计算预设时间段内采样子图的相对位置编码,公式如下:其中,是在采样子图图中顶点i的编码维度序号为l的向量,d为投影维度,n为顶点个数;在计算了所有维度之后,spe∈r
l
×
n
×
d
表示spe的数据维度是1
×
n
×
d,r表示数据维度;在此编码中给定不同输入x
d
、x和x,经过编码后得到一阶邻居节点的相对位置编码值x'
d
、二阶邻居节点的相对位置编码值x'和顶点相对位置编码值x';计算预设时间段内采样子图的时间位置编码,公式如下:tpe=σ(relu(rw1+b1)w2+b2)其中w1∈r
t
×
d
,w2∈r
d
×
d
,b1,b2是可学习参数,σ表示激活函数,tpe∈r
h
×1×
d
表示h时间步的时间编码表示,r是时间位置编码的输入,表示h时间步长的时间特征表示即r={r1,r2,...r
h
};采样子图的一阶邻居节点、二阶邻居节点和顶点分别作为时间位置编码的输入,可分别得到一阶邻居节点的时间位置编码值x

d
、二阶邻居节点的时间位置编码值x”和顶点的时间位置编码值x”。7.所述根据权利要求4所述的方法,其特征在于,所述分别对所述一阶邻居节点和所述二阶邻居节点进行频域图卷积,图卷积公式如下:其中,y为卷积结果,g
θ
为图卷积核,利用切比雪夫多项式k阶定义图卷积核,χ为图信号
矩阵,所述图信号矩阵为一阶邻居节点或二阶邻居节点,i
n
为n阶的单位矩阵,,卷积核c
i
是空间结构图输入维度,投影输出维度为c
o
;空间结构图描述为g=(v,e,w),v∈r
n
是节点集合,n为顶点的个数,e∈r
n
×
n
是边集合,w∈r
n
×
n
是邻接矩阵,d
ii
=∑
j
w
ij
是度矩阵;利用邻接矩阵w和度矩阵d定义图的归一化laplacian矩阵l,然后根据频域图卷积的概念定义卷积核g
θ
与空间结构图χ的卷积操作:g
θ
*χ=g
θ
(l)χ=g
θ
(uλu
t
)χ=ug
θ
(λ)u
t
χ其中,l为laplacian实对称矩阵,u是l的特征向量矩阵,λ是l的特征值组成的对角矩阵;通过使用迭代定义的切比雪夫多项式t
k
(x)的k阶展开来拟合即:其中,为缩放后的特征向量矩阵,λ
max
是拉普拉斯矩阵的最大特征值,θ∈r
k
是切比雪夫系数的向量。8.根据权利要求4所述的方法,其特征在于,根据所述第一求和结果和所述第二求和结果进行动态注意力编码,获得注意力编码结果,包括:将所述第一求和结果输入动态注意力编码器的第一msa进行自注意力计算,计算结果经过第一前馈网络进行维度对齐,输出结果作为第一k值和第一v值;将所述第二求和结果输入动态注意力编码器的第二msa进行自注意力计算,输出结果作为第一q值;将所述第一q值、第一k值和第一v值输入第三msa普通进行注意力计算,计算结果经过第二前馈网络进行维度对齐,得到注意力编码结果。9.根据权利要求8所述的方法,其特征在于,根据所述注意力编码结果和所述第三求和结果进行转换注意力解码,得到多站点风速预测结果,包括:将所述第三求和结果输入转换注意力解码器的第四msa进行自注意力计算,输出第二q值;将所述注意力编码结果作为第二k值和第二v值,并和所述第二q值输入第五msa进行自注意力计算,计算结果经过第三前馈网络进行维度对齐,输出第三k值和第三v值;将所述第三求和结果输入转换注意力解码器的第六msa进行自注意力计算,其输出结果作为第三q值;将所述第三q值、第三k值和第三v值输入第七msa普通进行注意力计算,计算结果经过第四前馈网络进行维度对齐,得到注意力解码结果。10.根据权利要求4所述的方法,其特征在于,所述注意力转换结果通过全连接网络生成具体的多站点风速预测结果out公式如下:out=σ(h
t
w
y
+b
y
)其中,h
t
为所述转换注意力解码的输出结果,w
y
和b
y
是可学习参数,σ为激活函数。

技术总结
本发明公开了一种多站点风速预测方法,方法包括:对各个气象监测站采集的气象数据进行数据预处理;将不规则分布的各个气象监测站抽象为空间结构图,按照时间将不同节点之间的特征作为数据,组成由时间序列构成的时空数据流;将所述时空数据流输入预先构建的图动态注意力网络模型,进行多站点风速预测。本发明将不规则分布的气象监测站抽象为图结构,将不同时间步长的气象数据变量值视为时空图数据,使用图卷积网络提取局部空间信息,结合多空间注意力机制建立不同节点之间的注意力分数然后进行动态注意力计算和转换,从而实现高精度风速预测的任务。速预测的任务。速预测的任务。


技术研发人员:李博录 吴利 王晓英
受保护的技术使用者:青海大学
技术研发日:2023.05.31
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐