一种基于条件重要性加权自编码器的风电出力场景生成方法

未命名 10-19 阅读:120 评论:0


1.本发明涉及风电出力场景生成领域,具体涉及一种基于条件重要性加权自编码器的风电出力场景生成方法。


背景技术:

2.以风能等为代表的可再生能源资源总量丰富,不产生污染。大规模的风电并网将给电网的稳定运行带来巨大的挑战,风能往往具有较强的随机性和波动性,从而导致风力发电出力不确定,因此如何描述风电出力的不确定性问题十分关键。
3.场景生成是一种通过构建确定性场景来分析电力系统不确定性问题的方法,是应对风力发电不确定性的主要方法之一,现有方法主要是基于概率模型的方法,采用概率假设建立风电出力的数学模型,依靠抽样产生场景。但概率模型过度依赖人为假设的概率密度函数,且难以处理复杂的非线性数据,具有较大的局限性。与此相比人工智能技术无需进行统计假设,并且具有更强大的处理复杂非线性数据和容错能力。随着计算机与人工智能技术的发展,以数据驱动的场景生成模型开始广泛应用于电力系统处理不确定性问题,其中典型的就是变分自编码器与生成对抗网络。这类方法能根据历史数据生成新的场景,而无需明确指定模型或拟合概率分布,其次,还能给数据制定标签生成特定情况下的场景。生成对抗网络还存在训练过程不稳定,损失函数剧烈抖动以及难以收敛的问题,这些问题目前还没有有效的解决方法。变分自编码器通过最大化变分下界函数来逼近样本的对数似然函数,但无法准确计算出实际的似然函数,因此生成效果还有待提高。重要性加权自编码器是变分自编码器的变体结构,优化目标也是最大化模型的变分下界函数,使用多个采样路径来计算潜在变量的后验分布,并应用重要性加权得出更紧凑的变分下界,更加接近真实的对数似然,最终提高生成效果,但是目前还没有应用于风电场景生成领域的技术方案。


技术实现要素:

4.本发明的目的在于针对传统变分自编码器在风电历史数据中挖掘其统计规律、获取样本后验分布和泛化能力方面性能还有待提高的问题,提出一种更有效,可靠的场景生成方法,一种基于条件重要性加权自编码器的风电出力场景生成方法。
5.一种基于条件重要性加权自编码器的风电出力场景生成方法,其特征在于,包括以下步骤:
6.i.获取所在地区的风电出力的历史实测数据并进行数据集划分;
7.ii.对数据进行预处理;
8.iii.搭建条件重要性加权自编码器场景生成模型;
9.iv.利用训练集数据训练条件重要性加权自编码器场景生成模型,直到损失函数收敛;
10.v.生成新的风电出力场景,评估场景生成模型性能,验证模型的有效性;
11.优选地,所述步骤i中具体包括:
12.1)采用的历史实测数据结构为10min采样间隔,即每条功率曲线的时间分辨率为10min,每日样本包括144个采样点;
13.2)数据随机按照80%,20%的比例划分为训练集和测试集;
14.优选地,所述步骤ii中具体包括:
15.1)对历史风电出力数据进行数据预处理,对数据进行清洗,剔除偏差较大的异常数据;
16.2)对历史数据进行归一化处理,采用归一化方法公式如下:
[0017][0018]
其中,x为原始数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;
[0019]
3)将每日的一维历史数据格式转换成二维矩阵格式;
[0020]
优选地,所述步骤iii中具体包括:
[0021]
1)构建一个编码器将输入数据x映射到低维空间的隐变量z,编码器由四个卷积层和两个全连接层组成,每个卷积层后都有一个批量归一化层和一个relu激活函数;
[0022]
其中,relu激活函数为:
[0023]
f(x)=max(0,x)
ꢀꢀꢀ
(2)
[0024]
2)构建一个解码器将隐变量还原为重构样本解码器由两个全连接层和四个转置卷积层组成,每个转置卷积层中都有一个批量归一化层和一个relu激活函数,内部结构与编码器相互对称;
[0025]
优选地,所述步骤iv中具体包括:
[0026]
1)确定条件信息c,将c作为标签值赋予训练集;
[0027]
2)在训练集中随机采样选取一组历史出力数据,作为编码器的输入数据;
[0028]
3)构建并计算损失函数;
[0029]
条件重要性加权自编码器优化目标为最大化模型的变分下界函数,用极大似然法优化目标函数可得到对数似然函数logp(x|c)为:
[0030]
logp(x|c)=d
kl
(q(z|x,c)||p(z|x,c))+l(x,c)
ꢀꢀꢀ
(3)
[0031]
其中c为额外条件信息,d
kl
[.]表示kullback-leibler散度,q(z|x,c)为近似后验分布,p(z|x,c)为真实后验分布,l(x,c)为似然函数的变分下界函数;
[0032]
在近似后验分布中进行k次采样得到k个平均权重的隐变量z1,z2...zk,从而适应更多形式的分布,提高生成网络的生成能力,变分下界l(x,c)表示为:
[0033][0034]
其中e
q(z|x)
[.]表示数学期望,p(z|c)和p(x|z,c)表示概率分布函数;
[0035]
得到损失函数l
ciwae
:
[0036]
l
ciwae
=-e[logp(x|c)]+d
kl
(q(z|x,c)||p(z|x,c))
ꢀꢀꢀ
(5)
[0037]
其中e[.]表示数学期望;
[0038]
4)利用梯度计算计算损失函数来获取编码器和解码器参数;
[0039]
梯度计算公式为:
[0040][0041]
其中wi神经网络的重要性权重;为归一化后的重要性权重;k为采样次数;
[0042]
5)重复步骤2),3),4),直到损失函数收敛;
[0043]
6)提取训练好的条件重要性加权自编码器用于风电出力场景生成任务;
[0044]
优选地,所述步骤v中具体包括:
[0045]
1)从测试集中随机挑选一组历史出力数据作为输入,生成新的风电出力场景;
[0046]
2)对新生成的风电场景进行反归一化,反归一化公式为:
[0047]
x=x
*
(x
max-x
min
)+x
min
ꢀꢀꢀ
(7)
[0048]
其中,x为反归一化后的数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;
[0049]
3)将新生成的风电出力场景与测试集中实际场景进行对比,验证生成场景的有效性,采用自相关函数r(τ)来评估实际场景和生成场景的时间相关性,其数学表达式为:
[0050][0051]
其中e[.]表示期望;τ为时间延迟;σ
x
为风电出力x
t
的标准差;u为风电出力x
t
的均值;
[0052]
采用连续分级概率评分crps来评估生成场景的综合性能,其数学表达式为:
[0053][0054]
其中,f(x)为生成场景的累计分布函数,p(x)实际场景的累计分布函数。
附图说明
[0055]
图1为本发明中条件重要性加权自编码器的风电出力场景生成方法流程示意图
[0056]
图2本发明中历史风电出力曲线格式转换示意图;
[0057]
图3本发明中条件重要性加权自编码器结构示意图;
[0058]
图4本发明中条件重要性加权自编码器优化目标示意图;
[0059]
图5本发明中条件重要性加权自编码器隐变量采样示意图。
具体实施方式
[0060]
下面结合附图对本发明进行详细说明,本部分的描述仅是示范性和解释性,不应对本发明的保护范围有任何的限制作用。此外,本领域技术人员根据本文件的描述,可以对本文件中实施例中以及不同实施例中的特征进行相应组合。
[0061]
一种基于条件重要性加权自编码器的风电出力场景生成方法,其流程示意图如图1所示,包括以下步骤:
[0062]
i.获取所在地区的风电出力的历史实测数据并进行数据集划分;
[0063]
ii.对数据进行预处理;
[0064]
iii.搭建条件重要性加权自编码器场景生成模型;
[0065]
iv.利用训练集数据训练条件重要性加权自编码器,直到损失函数收敛;
[0066]
v.生成新的风电出力场景,评估场景生成模型性能,验证模型的有效性;
[0067]
所述步骤i中具体包括:
[0068]
1)采用的历史实测数据结构为10min采样间隔,即每条功率曲线的时间分辨率为10min,每日样本包括144个采样点;
[0069]
2)数据随机按照80%,20%的比例划分为训练集和测试集;
[0070]
所述步骤ii中具体包括:
[0071]
1)对历史风电出力数据进行数据预处理,对数据进行清洗,剔除偏差较大的异常数据;
[0072]
2)对历史数据进行归一化处理,采用归一化方法公式如下:
[0073][0074]
其中,x为原始数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;
[0075]
3)将每日的一维历史数据格式转换成二维矩阵作为模型的输入,考虑到编码器网络使用的卷积神经网络层,而卷积神经网络更适合处理具有相同行数和列数的矩阵输入,而风电出力曲线为1
×
n的时间序列,可以通过格式转换为二维矩阵再作为输入数据,格式转换示意图如图2示;
[0076]
所述步骤iii中具体包括:
[0077]
1)构建编码器由四个卷积层和两个全连接层组成,每个卷积层后都有一个批量归一化层和一个relu激活函数;
[0078]
其中,relu激活函数为:
[0079]
f(x)=max(0,x)
ꢀꢀꢀ
(2)
[0080]
2)构建解码器由两个全连接层和四个转置卷积层组成,每个转置卷积层中都有一个批量归一化层和一个relu激活函数,内部结构与编码器相互对称,条件重要性加权自编码器整体结构图如图3所示;
[0081]
所述步骤iv中具体包括:
[0082]
1)确定条件信息c,将c作为标签值赋予训练集,常用的条件信息有年份,月份,天气等;
[0083]
2)在训练集中随机采样选取一组历史出力数据,作为编码器的输入数据;
[0084]
3)构建并计算损失函数;
[0085]
条件重要性自编码器优化目标为最大化模型的变分下界函数,优化原理示意图如图4示,到对数似然函数为:
[0086]
log p(x|c)=d
kl
(q(z|x,c)||p(z|x,c))+l(x,c)
ꢀꢀꢀ
(3)
[0087]
其中c为额外条件信息,d
kl
[.]表示kullback-leibler散度,q(z|x,c)为近似后验分布,p(z|x,c)为真实后验分布,l(x,c)为似然函数的变分下界函数;
[0088]
图5所示为条件重要性自编码器隐变量采样过程图,近似后验分布中进行k次采样得到k个平均权重的隐变量z1,z2...zk,从而适应更多形式的分布,提高生成网络的生成能
力,l(x,c)表示为:
[0089][0090]
其中e
q(z|x)
[.]表示数学期望,p(z)和p(x|z,c)表示概率分布函数;
[0091]
得到损失函数:
[0092]
l
ciwae
=-e[logp(x|c)]+d
kl
(q(z|x,c)||p(z|x,c))
ꢀꢀꢀ
(5)
[0093]
其中e[.]表示数学期望;
[0094]
4)利用梯度计算计算损失函数来获取编码器和解码器参数;
[0095]
梯度计算公式为:
[0096][0097]
其中wi神经网络的重要性权重;为归一化后的重要性权重;k为采样次数;
[0098]
5)重复步骤2),3),4),直到损失函数收敛;
[0099]
6)提取训练好的条件重要性加权自编码器用于风电出力场景生成任务;
[0100]
所述步骤vi中具体包括:
[0101]
1)从测试集中随机挑选一组历史出力数据作为输入,生成新的风电出力场景;
[0102]
2)对新生成的风电场景进行反归一化,反归一化公式为:
[0103]
x=x
*
(x
max-x
min
)+x
min
ꢀꢀꢀ
(7)
[0104]
其中,x为反归一化后的数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;
[0105]
3)将新生成的风电出力场景与测试集中实际场景进行对比,验证生成场景的有效性,采用自相关函数r(τ)来评估实际场景和生成场景的时间相关性,其数学表达式为:
[0106][0107]
其中e[.]表示期望;τ为时间延迟;σ
x
为风电出力x
t
的标准差;u为风电出力x
t
的均值;
[0108]
采用连续等级概率分数crps来评估生成场景的综合性能,其数学表达式为:
[0109][0110]
其中,f(x)为生成场景的累计分布函数,p(x)实际场景的累计分布函数。
[0111]
与现有的变分自编码器风电出力场景生成方法相比,本发明有以下优点:
[0112]
(1)本发明在场景生成过程中,通过对每个样本进行多次隐变量采样,可以获得更准确的对数似然估计值,从而生成更高质量的样本,提高生成效果;
[0113]
(2)更准确地建模数据分布的多模式性和异构性,增加了模型灵活性,可以捕捉更复杂的数据分布;
[0114]
(3)引入重要性加权思路,对采样的隐变量进行加权平均提高了鲁棒性,更适合处理不完整或噪声数据。
[0115]
这里所述的实施方式是为了帮助读者理解本发明,应被理解为本发明的保护范围并不局限于这样的特别陈述;本领域的技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其他具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

技术特征:
1.一种基于条件重要性加权自编码器的风电出力场景生成方法,其特征在于,包括以下步骤:i.获取所在地区的风电出力的历史实测数据并进行数据集划分;ii.对数据进行预处理;iii.搭建条件重要性加权自编码器场景生成模型;iv.利用训练集数据训练条件重要性加权自编码器场景生成模型,直到损失函数收敛;v.生成新的风电出力场景,评估场景生成模型性能,验证模型的有效性。2.根据权利要求1所述,其特征在于,步骤i中具体包括:1)采用的历史实测数据结构为10min采样间隔,即每条功率曲线的时间分辨率为10min,每日样本包括144个采样点;2)数据随机按照80%,20%的比例划分为训练集和测试集。3.根据权利要求1所述,其特征在于,步骤ii中具体包括:1)对历史风电出力数据进行数据预处理,对数据进行清洗,剔除偏差较大的异常数据;2)对历史数据进行归一化处理,采用归一化方法公式如下:其中,x为原始数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;3)将每日的一维历史数据格式转换成二维矩阵格式。4.根据权利要求1所述,其特征在于,步骤iii中具体包括:1)构建一个编码器将输入数据x映射到低维空间的隐变量z,编码器由四个卷积层和两个全连接层组成,每个卷积层后都有一个批量归一化层和一个relu激活函数;其中,relu激活函数为:f(x)=max(0,x)
ꢀꢀꢀ
(2)2)构建一个解码器将隐变量还原为重构样本解码器由两个全连接层和四个转置卷积层组成,每个转置卷积层中都有一个批量归一化层和一个relu激活函数,内部结构与编码器相互对称。5.根据权利要求1所述,其特征在于,步骤iv中具体包括:1)确定条件信息c,将c作为标签值赋予训练集;2)在训练集中随机采样选取一组历史出力数据,作为编码器的输入数据;3)构建并计算损失函数;条件重要性加权自编码器优化目标为最大化模型的变分下界函数,用极大似然法优化目标函数可得到对数似然函数logp(x|c)为:logp(x|c)=d
kl
(q(z|x,c)||p(z|x,c))+l(x,c)
ꢀꢀꢀ
(3)其中c为额外条件信息,d
kl
[.]表示kullback-leibler散度,q(z|x,c)为近似后验分布,p(z|x,c)为真实后验分布,l(x,c)为似然函数的变分下界函数;在近似后验分布中进行k次采样得到k个平均权重的隐变量z1,z2...z
k
,从而适应更多形式的分布,提高生成网络的生成能力,变分下界l(x,c)表示为:
其中e
q(z|x)
[.]表示数学期望,p(z|c)和p(x|z,c)表示概率分布函数;得到损失函数l
ciwae
:l
ciwae
=-e[logp(x|c)]+d
kl
(q(z|x,c)||p(z||p(z|x|x,c))
ꢀꢀꢀ
(5)其中e[.]表示数学期望;4)利用梯度计算计算损失函数来获取编码器和解码器参数;梯度计算公式为:其中w
i
神经网络的重要性权重;为归一化后的重要性权重;k为采样次数;5)重复步骤2),3),4),直到损失函数收敛;6)提取训练好的条件重要性加权自编码器用于风电出力场景生成任务。6.根据权利要求1所述,其特征在于,步骤v中具体包括:1)从测试集中随机挑选一组历史出力数据作为输入,生成新的风电出力场景;2)对新生成的风电场景进行反归一化,反归一化公式为:x=x
*
(x
max-x
min
)+x
min
ꢀꢀꢀ
(7)其中,x为反归一化后的数据,x
*
为归一化后的数据,x
min
为历史数据最小值,x
max
为历史数据最大值;3)将新生成的风电出力场景与测试集中实际场景进行对比,验证生成场景的有效性,采用自相关函数r(τ)来评估实际场景和生成场景的时间相关性,其数学表达式为:其中e[.]表示期望;τ为时间延迟;σ
x
为风电出力x
t
的标准差;u为风电出力x
t
的均值;采用连续分级概率评分crps来评估生成场景的综合性能,其数学表达式为:其中,f(x)为生成场景的累计分布函数,p(x)实际场景的累计分布函数。

技术总结
本发明公开了一种基于条件重要性加权自编码器的风电出力场景生成方法,包括以下步骤:获取所在地区的风电出力的历史实测数据并进行数据集划分;对数据进行预处理;搭建条件重要性加权自编码器场景生成模型;利用训练集数据训练条件重要性加权自编码器,直到损失函数收敛;生成新的风电出力场景,评估场景生成模型性能,验证模型的有效性。本方法在风电出力场景生成过程中,通过对每个样本进行多次隐变量采样,获得更准确的对数似然估计值,从而更准确地建模数据分布,最终提高生成场景的质量。量。量。


技术研发人员:吴亚联 肖思远 刘政 何翔
受保护的技术使用者:湘潭大学
技术研发日:2023.03.27
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐