基于数据驱动的机组组合决策方法、系统、设备及介质与流程

未命名 08-15 阅读：111 评论：0

1.本发明属于电力调度技术领域，具体涉及一种基于数据驱动的机组组合决策方法、系统、设备及介质。

背景技术：

2.基于物理模型驱动的机组组合决策方法往往是以机理研究为基础，因而其建模、求解过程都较为复杂，研究周期较长，而且在面对不断涌现的新问题时往往需要对模型或算法进行重构，在当今能源变革日新月异的背景下，这种决策方法的适应性不高。
3.深度学习起源于人工神经网络，其模型通常由多层非线性运算单元组合而成。它将较低层的输出作为更高一层的输入，通过这种方式自动地从大量训练数据中学习抽象的特征表示，以发现数据的分布式特征。2014年至今，深度学习已在人工智能领域取得一系列重大突破，发展出了包括卷积神经网络(convolutional neural network，cnn)、深度置信网络(deep belief network，dbn)、堆栈自编码网络(stacked auto-encoder，sae)等在内的多种模型。由于以上几种模型中，每层的节点相互独立，适用于处理时序不相关数据，而对于日前机组组合这种和时间序列紧密相关的数据，上述模型并不适用。
4.与传统神经网络架构不同，rnn的每个神经元都可以按照数据的时序进行展开，即一组输入序列当前的输出与前一时刻的隐藏层输出有关，因此被成功用于处理时序相关数据。但是，由于在面对序列较长的训练数据时，rnn会出现梯度消失问题，而日前机组组合样本数据的时间序列一般为96维，因此如果直接利用rnn构建机组组合输入量和决策结果间的映射关系，精度方面难以保证。

技术实现要素：

5.本发明的目的在于针对上述现有技术中的问题，提供一种基于数据驱动的机组组合决策方法、系统、设备及介质，有助于实际电力调度系统应对各种复杂因素和突发状况的影响。
6.为了实现上述目的，本发明有如下的技术方案：
7.第一方面，提供一种基于数据驱动的机组组合决策方法，包括：
8.结合机组组合历史样本数据的特征，建立机组组合深度学习模型；
9.利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；
10.在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。
11.作为一种优选方案，所述机组组合深度学习模型的建立步骤包括：
12.根据长短时记忆网络模型和门控循环单元，构建机组组合深度学习模型；
13.根据机组组合历史样本数据的特征，构建机组组合深度学习模型中神经网络模块b的具体模型；
14.其中，所述机组组合深度学习模型采用多个循环式结构线性连接而成，一个循环式结构由多个相同的线性连接结构线性连接而成，一个循环式结构中线性连接结构的个数与时间序列的维度相关，线性连接结构为神经网络模块b。
15.作为一种优选方案，所述神经网络模块b按照如下步骤建立：
16.结合机组组合历史样本数据的特征，确定当前神经网络模块b中遗忘门f
t
、输入门i
t
、输出门o
t
、当前时刻隐藏状态h
t
、待更新记忆单元状态记忆单元状态c
t
、输出值y
t
的具体模型为：
[0017][0018]
式中：p
lt
表示考虑时间特性的输入量，h
t-1
表示当前神经网络模块b的前一神经网络模块b的隐藏状态，w
xf
表示输入量和f
t
之间的权重系数矩阵，w
xo
表示输入量和o
t
之间的权重系数矩阵，w
xi
表示输入量和i
t
之间的权重系数矩阵，w
xc
表示输入量和之间的权重系数矩阵，bf为f
t
的偏置参数，bo为o
t
的偏置参数，bi为i
t
的偏置参数，bc为的偏置参数，c
t-1
为t-1时刻记忆单元状态，表示哈达玛积；
[0019]
当前神经网络模块b的隐藏状态h
t
的具体模型为：
[0020][0021]
当前神经网络模块b的输出值y
t
的具体模型为：
[0022]yt
αsigmoid(h
t
)。
[0023]
作为一种优选方案，在所述利用训练样本对机组组合深度学习模型进行训练的步骤中，利用深度学习算法计算训练样本在机组组合深度学习模型的前向传播中各输入信号的乘积及对应的权重；
[0024]
根据各输入信号的乘积及权重，确定总和；
[0025]
将激活函数作用于总和，得到误差；
[0026]
根据误差建立损失函数，利用损失函数，结合训练样本中日负荷与机组组合方案之间的映射关系的实际值，及训练样本输入至机组组合深度学习模型得到输出值，计算损失值；
[0027]
根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整，得到调整后的机组组合深度学习模型。
[0028]
作为一种优选方案，所述根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整的步骤包括：
[0029]
根据损失值，计算机组组合深度学习模型中的权重参数的梯度和偏置参数的梯度；
[0030]
根据机组组合深度学习模型中的权重参数的梯度，对机组组合深度学习模型中的权重参数进行调整；
[0031]
根据机组组合深度学习模型中的偏置参数的梯度，对机组组合深度学习模型中偏
置参数进行调整。
[0032]
作为一种优选方案，所述根据误差建立损失函数的步骤中，损失函数的表达式为：
[0033][0034]
式中，q为时间序列的长度，y
t
为t时刻当前神经网络模块b的输出值；(u
gt
,p
gt
)为训练样本中日负荷与机组组合方案之间映射关系的实际值。
[0035]
作为一种优选方案，所述的深度学习算法采用adam算法，adam算法的权重更新表达式如下：
[0036][0037]
式中，θ
t
为待更新参数变量，θ
t+1
为更新后的参数变量，δ为学习率，ε为平滑参数，和为经过误差修正后的梯度带权平均值和梯度带权有偏方差；
[0038]
和的计算表达式如下：
[0039][0040]
式中，m
t
为梯度带权平均值，v
t
为梯度带权有偏方差，β1和β2为衰减因子；
[0041]
将和的计算表达式代入adam算法的权重更新表达式中，对模型的权重系数和偏置参数进行修正，计算表达式分别如下：
[0042][0043][0044]
式中，w为长短时记忆网络模型和门控循环单元中各门间权重系数矩阵，b为长短时记忆网络模型偏置参数的集合；通过对上式进行求解，实现对长短时记忆网络模型的训练。
[0045]
第二方面，提供一种基于数据驱动的机组组合决策系统，包括：
[0046]
深度学习模型建立模块，用于结合机组组合历史样本数据的特征，建立机组组合深度学习模型；
[0047]
深度学习模型训练模块，用于利用训练样本对机组组合深度学习模型进行训练，
训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；
[0048]
机组组合方案求解模块，用于在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。
[0049]
第三方面，提供一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述的处理器执行所述的计算机程序时实现所述基于数据驱动的机组组合决策方法的步骤。
[0050]
第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述的计算机程序被处理器执行时实现所述基于数据驱动的机组组合决策方法的步骤。
[0051]
相较于现有技术，本发明的第一方面至少具有如下的有益效果：
[0052]
通过预先建立的长短时记忆网络模型对训练样本间日负荷和机组组合方案之间的映射关系进行学习，并采用深度学习算法对长短时记忆网络模型进行训练，即可获得机组组合方案的决策结果。本发明方法不研究机组组合的内在机理，而是基于深度学习方法，利用海量历史决策数据训练，直接构建已知输入量和决策结果间的映射关系。因而，和传统基于物理模型驱动的机组组合决策方法相比，在面对不同类型的机组组合问题时，本发明方法的适应性更高，为实际电力调度系统应对各种复杂因素和突发状况的影响提供一种新的解决思路。
[0053]
可以理解的是，上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。
附图说明
[0054]
为了更清楚地说明本技术实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0055]
图1本发明实施例基于数据驱动的机组组合决策方法流程图；
[0056]
图2本发明实施例长短时记忆网络模型结构示意图；
[0057]
图3本发明实施例长短时记忆网络模型的神经网络模块b结构示意图；
[0058]
图4本发明实施例基于数据驱动的机组组合决策系统结构框图。
具体实施方式
[0059]
以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本技术的实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本技术的描述。
[0060]
另外，在本技术说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。
[0061]
实施例1
[0062]
本发明实施例基于数据驱动的机组组合决策方法，首先建立机组组合问题的数学
模型，并使用求解算法完成机组组合决策。基于数据驱动的机组组合决策方法采用lstm模型学习训练样本间日负荷p
l
和机组组合方案(ug,pg)之间的映射关系，然后采用adam算法进行训练，进而可以进行机组组合决策。
[0063]
作为rnn的一种改进型，lstm在神经网络模块中添加了记忆单元、输入门、输出门以及遗忘门，进而实现模型对重要信息的记忆，有效解决了rnn由于数据序列过长导致模型训练过程中梯度消失的问题。因此，研究以lstm为基础，构建机组组合深度学习模型具有重要的意义。请参阅图1，本发明实施例基于数据驱动的机组组合决策方法具体包括以下步骤：
[0064]
s1、结合机组组合历史样本数据的特征，建立机组组合深度学习模型；
[0065]
s2、利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；
[0066]
s3、在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。
[0067]
在一种可能的实施方式中，步骤s1所述机组组合深度学习模型的建立步骤包括：
[0068]
结合长短时记忆网络模型(lstm模型)和门控循环单元(gru模型)构建机组组合深度学习模型，如图2和图3所示，所述长短时记忆网络模型采用多个循环式结构线性连接而成，一个循环式结构由多个相同的线性连接结构线性连接而成，一个循环式结构中线性连接结构的个数与时间序列的维度相关，每个线性连接结构的神经网络模块b用于实现重要信息的记录。
[0069]
更进一步的，所述每个线性连接结构的神经网络模块b按照如下步骤建立：
[0070]
结合机组组合历史样本数据的特征，确定当前神经网络模块b中遗忘门f
t
、输入门i
t
、输出门o
t
、当前时刻隐藏状态h
t
、待更新记忆单元状态记忆单元状态c
t
、输出值y
t
的具体模型为：
[0071][0072]
式中：p
lt
表示考虑时间特性的输入量，h
t-1
表示当前神经网络模块b的前一神经网络模块b的隐藏状态，w
xf
表示输入量和f
t
之间的权重系数矩阵，w
xo
表示输入量和o
t
之间的权重系数矩阵，w
xi
表示输入量和i
t
之间的权重系数矩阵，w
xc
表示输入量和之间的权重系数矩阵，bf为f
t
的偏置参数，bo为o
t
的偏置参数，bi为i
t
的偏置参数，bc为的偏置参数，c
t-1
为t-1时刻记忆单元状态，表示哈达玛积；
[0073]
计算o
t
与c
t
的哈达玛积，得到当前神经网络模块b的隐藏状态h
t
：
[0074][0075]
将当前神经网络模块b的隐藏状态h
t
进行sigmoid变换得到当前神经网络模块b的输出值y
t
，变换过程如下式：
[0076]yt
＝sigmoid(h
t
)。
[0077]
在一种可能的实施方式中，步骤s2利用训练样本对机组组合深度学习模型进行训练的步骤中，利用深度学习算法计算训练样本在机组组合深度学习模型的前向传播中各输入信号的乘积及对应的权重；
[0078]
根据各输入信号的乘积及权重，确定总和；
[0079]
将激活函数作用于总和，得到误差；
[0080]
根据误差建立损失函数，利用损失函数，结合训练样本中日负荷与机组组合方案之间的映射关系的实际值，及训练样本输入至机组组合深度学习模型得到输出值，计算损失值；
[0081]
根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整，得到调整后的机组组合深度学习模型。
[0082]
更进一步的，所述根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整的步骤包括：
[0083]
根据损失值，计算机组组合深度学习模型中的权重参数的梯度和偏置参数的梯度；
[0084]
根据机组组合深度学习模型中的权重参数的梯度，对机组组合深度学习模型中的权重参数进行调整；
[0085]
根据机组组合深度学习模型中的偏置参数的梯度，对机组组合深度学习模型中偏置参数进行调整。
[0086]
更进一步的，所述的深度学习算法采用adam算法，所述的adam算法采用绝对平均误差(mean absolute error，mae)作为损失函数，绝对平均误差的计算表达式如下：
[0087][0088]
式中，q为时间序列的长度，z
t
为实际值，y
t
为t时刻当前神经网络模块b的输出值；
[0089]
在lstm模型和gru模型的训练过程中，将y
t
值和训练样本中日负荷与机组组合方案之间映射关系的实际值(u
gt
,p
gt
)代入绝对平均误差的计算表达式，则损失函数表达式为：
[0090][0091]
adam算法的权重更新表达式如下：
[0092][0093]
式中，θ
t+1
为更新后的参数变量，θ
t
为待更新参数变量，δ为学习率，ε为平滑参数，和为经过误差修正后的梯度带权平均值和梯度带权有偏方差；
[0094]
和的计算表达式如下：
[0095][0096]
式中，m
t
为梯度带权平均值，v
t
为梯度带权有偏方差，β1和β2为衰减因子；
[0097]
将和的计算表达式代入adam算法的权重更新表达式中，对模型的权重系数和偏置参数进行修正，计算表达式分别如下：
[0098][0099][0100]
式中，w为lstm模型和gru模型中各门间权重系数矩阵，b为长短时记忆网络模型偏置参数的集合；通过对上式进行求解，实现对长短时记忆网络模型的训练。
[0101]
本发明实施例基于数据驱动的机组组合决策方法，不研究机组组合的内在机理，而是基于深度学习方法，利用海量历史决策数据训练，直接构建已知输入量和决策结果间的映射关系。因而，和传统基于物理模型驱动的机组组合决策方法相比，在面对不同类型的机组组合问题时，其适应性更高，有助于实际电力调度系统应对各种复杂因素和突发状况的影响。
[0102]
实施例2
[0103]
请参阅图4，本发明实施例还提出一种基于数据驱动的机组组合决策系统，包括：
[0104]
深度学习模型建立模块，用于结合机组组合历史样本数据的特征，建立机组组合深度学习模型；
[0105]
深度学习模型训练模块，用于利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；
[0106]
机组组合方案求解模块，用于在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。
[0107]
在一种可能的实施方式中，所述深度学习模型建立模块结合长短时记忆网络模型和门控循环单元构建机组组合深度学习模型；所述长短时记忆网络模型采用多个循环式结构线性连接而成，一个循环式结构由多个相同的线性连接结构线性连接而成，一个循环式结构中线性连接结构的个数与时间序列的维度相关，每个线性连接结构的神经网络模块b用于实现重要信息的记录。
[0108]
更进一步的，所述深度学习模型建立模块结合机组组合历史样本数据的特征，确
定当前神经网络模块b中遗忘门f
t
、输入门i
t
、输出门o
t
、当前时刻隐藏状态h
t
、待更新记忆单元状态记忆单元状态c
t
、输出值y
t
的具体模型为：
[0109][0110]
式中：p
lt
表示考虑时间特性的输入量，h
t-1
表示当前神经网络模块b的前一神经网络模块b的隐藏状态，w
xf
表示输入量和f
t
之间的权重系数矩阵，w
xo
表示输入量和o
t
之间的权重系数矩阵，w
xi
表示输入量和i
t
之间的权重系数矩阵，w
xc
表示输入量和之间的权重系数矩阵，bf为f
t
的偏置参数，bo为o
t
的偏置参数，bi为i
t
的偏置参数，bc为的偏置参数，c
t-1
为t-1时刻记忆单元状态，表示哈达玛积；
[0111]
计算o
t
与c
t
的哈达玛积，得到当前神经网络模块b的隐藏状态h
t
：
[0112][0113]
将当前神经网络模块b的隐藏状态h
t
进行sigmoid变换得到当前神经网络模块b的输出值y
t
，变换过程如下式：
[0114]yt
＝sigmoid(h
t
)。
[0115]
在一种可能的实施方式中，所述深度学习模型训练模块采用adam算法作为深度学习算法，所述adam算法利用训练样本对机组组合深度学习模型进行训练，并利用深度学习算法计算训练样本在机组组合深度学习模型的前向传播中各输入信号的乘积及对应的权重；
[0116]
根据各输入信号的乘积及权重，确定总和；
[0117]
将激活函数作用于总和，得到误差；
[0118]
根据误差建立损失函数，利用损失函数，结合训练样本中日负荷与机组组合方案之间的映射关系的实际值，及训练样本输入至机组组合深度学习模型得到输出值，计算损失值；
[0119]
根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整，得到调整后的机组组合深度学习模型。
[0120]
更进一步的，所述根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整的步骤包括：
[0121]
根据损失值，计算机组组合深度学习模型中的权重参数的梯度和偏置参数的梯度；
[0122]
根据机组组合深度学习模型中的权重参数的梯度，对机组组合深度学习模型中的权重参数进行调整；
[0123]
根据机组组合深度学习模型中的偏置参数的梯度，对机组组合深度学习模型中偏置参数进行调整。
[0124]
更进一步的，所述的adam算法采用绝对平均误差(mean absolute error，mae)作为损失函数，绝对平均误差的计算表达式如下：
[0125][0126]
式中，q为时间序列的长度，z
t
为实际值，y
t
为t时刻当前神经网络模块b的输出值；
[0127]
在机组组合深度学习模型的训练过程中，将y
t
值和训练样本中日负荷与机组组合方案之间映射关系的实际值(u
gt
,p
gt
)代入绝对平均误差的计算表达式，则损失函数表达式为：
[0128][0129]
adam算法的权重更新表达式如下：
[0130][0131]
式中，θ
t
为待更新参数变量，θ
t+1
为更新后的参数变量，δ为学习率，ε为平滑参数，和为经过误差修正后的梯度带权平均值和梯度带权有偏方差；
[0132]
和的计算表达式如下：
[0133][0134]
式中，m
t
为梯度带权平均值，v
t
为梯度带权有偏方差，β1和β2为衰减因子；
[0135]
将和的计算表达式代入adam算法的权重更新表达式中，对模型的权重系数和偏置参数进行修正，计算表达式分别如下：
[0136][0137][0138]
式中，w为长短时记忆网络模型和门控循环单元中各门间权重系数矩阵，b为长短时记忆网络模型偏置参数的集合；通过对上式进行求解，实现对长短时记忆网络模型的训练。
[0139]
实施例3
[0140]
本发明的另一实施例还提出一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述的处理器执行所述的计算机程序时
实现如实施例1所述基于数据驱动的机组组合决策方法的步骤。
[0141]
实施例4
[0142]
本发明的另一实施例还提出一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述的计算机程序被处理器执行时实现如实施例1所述基于数据驱动的机组组合决策方法的步骤。
[0143]
所述计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。为了便于说明，以上内容仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该计算机可读存储介质是非暂时性的，可以存储在各种电子设备形成的存储装置当中，能够实现本发明实施例方法记载的执行过程。
[0144]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0145]
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0146]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0147]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0148]
最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

技术特征：
1.一种基于数据驱动的机组组合决策方法，其特征在于，包括：结合机组组合历史样本数据的特征，建立机组组合深度学习模型；利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。2.根据权利要求1所述基于数据驱动的机组组合决策方法，其特征在于，所述机组组合深度学习模型的建立步骤包括：根据长短时记忆网络模型和门控循环单元，构建机组组合深度学习模型；根据机组组合历史样本数据的特征，构建机组组合深度学习模型中神经网络模块b的具体模型；其中，所述机组组合深度学习模型采用多个循环式结构线性连接而成，一个循环式结构由多个相同的线性连接结构线性连接而成，一个循环式结构中线性连接结构的个数与时间序列的维度相关，线性连接结构为神经网络模块b。3.根据权利要求2所述基于数据驱动的机组组合决策方法，其特征在于，所述神经网络模块b按照如下步骤建立：结合机组组合历史样本数据的特征，确定当前神经网络模块b中遗忘门f
t
、输入门i
t
、输出门o
t
、当前时刻隐藏状态h
t
、待更新记忆单元状态记忆单元状态c
t
、输出值y
t
的具体模型为：式中：p
lt
表示考虑时间特性的输入量，h
t-1
表示当前神经网络模块b的前一神经网络模块b的隐藏状态，w
xf
表示输入量和f
t
之间的权重系数矩阵，w
xo
表示输入量和o
t
之间的权重系数矩阵，w
xi
表示输入量和i
t
之间的权重系数矩阵，w
xc
表示输入量和之间的权重系数矩阵，b
f
为f
t
的偏置参数，b
o
为o
t
的偏置参数，b
i
为i
t
的偏置参数，b
c
为的偏置参数，c
t-1
为t-1时刻记忆单元状态，表示哈达玛积；当前神经网络模块b的隐藏状态h
t
的具体模型为：当前神经网络模块b的输出值y
t
的具体模型为：y
t
＝sigmoid(h
t
)。4.根据权利要求3所述基于数据驱动的机组组合决策方法，其特征在于，在所述利用训练样本对机组组合深度学习模型进行训练的步骤中，利用深度学习算法计算训练样本在机组组合深度学习模型的前向传播中各输入信号的乘积及对应的权重；根据各输入信号的乘积及权重，确定总和；将激活函数作用于总和，得到误差；根据误差建立损失函数，利用损失函数，结合训练样本中日负荷与机组组合方案之间
的映射关系的实际值，及训练样本输入至机组组合深度学习模型得到输出值，计算损失值；根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整，得到调整后的机组组合深度学习模型。5.根据权利要求4所述基于数据驱动的机组组合决策方法，其特征在于，所述根据损失值对机组组合深度学习模型中的权重参数和偏置参数进行调整的步骤包括：根据损失值，计算机组组合深度学习模型中的权重参数的梯度和偏置参数的梯度；根据机组组合深度学习模型中的权重参数的梯度，对机组组合深度学习模型中的权重参数进行调整；根据机组组合深度学习模型中的偏置参数的梯度，对机组组合深度学习模型中偏置参数进行调整。6.根据权利要求4所述基于数据驱动的机组组合决策方法，其特征在于，所述根据误差建立损失函数的步骤中，损失函数的表达式为：式中，q为时间序列的长度，y
t
为t时刻当前神经网络模块b的输出值；(u
gt
,p
gt
)为训练样本中日负荷与机组组合方案之间映射关系的实际值。7.根据权利要求4所述基于数据驱动的机组组合决策方法，其特征在于，所述的深度学习算法采用adam算法，adam算法的权重更新表达式如下：式中，θ
t
为待更新参数变量，θ
t+1
为更新后的参数变量，δ为学习率，ε为平滑参数，和为经过误差修正后的梯度带权平均值和梯度带权有偏方差；和的计算表达式如下：式中，m
t
为梯度带权平均值，v
t
为梯度带权有偏方差，β1和β2为衰减因子；将和的计算表达式代入adam算法的权重更新表达式中，对模型的权重系数和偏置参数进行修正，计算表达式分别如下：
式中，w为长短时记忆网络模型和门控循环单元中各门间权重系数矩阵，b为长短时记忆网络模型偏置参数的集合；通过对上式进行求解，实现对长短时记忆网络模型的训练。8.一种基于数据驱动的机组组合决策系统，其特征在于，包括：深度学习模型建立模块，用于结合机组组合历史样本数据的特征，建立机组组合深度学习模型；深度学习模型训练模块，用于利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；机组组合方案求解模块，用于在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于：所述的处理器执行所述的计算机程序时实现如权利要求1至7中任意一项所述基于数据驱动的机组组合决策方法的步骤。10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于：所述的计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于数据驱动的机组组合决策方法的步骤。

技术总结
本发明公开了一种基于数据驱动的机组组合决策方法、系统、设备及介质，决策方法包括结合机组组合历史样本数据的特征，建立机组组合深度学习模型；利用训练样本对机组组合深度学习模型进行训练，训练样本包括日负荷、机组组合方案，日负荷与机组组合方案之间具有映射关系；在训练后的机组组合深度学习模型中输入负荷数据，获得机组组合方案的决策结果。本发明不研究机组组合的内在机理，而是基于深度学习方法，利用海量历史决策数据训练，直接构建已知输入量和决策结果间的映射关系。因而，本发明在面对不同类型的机组组合问题时，适应性更高，有助于电力调度系统应对各种复杂因素和突发状况的影响。发状况的影响。发状况的影响。

技术研发人员：许丹陈准郑陈达宋少群丁强戴赛李强潘毅崔晖李博张加力李宇轩胡晓静徐晓彤闫翠会门德月周明逸刘升胡静路怡燕京华盛灿辉张传成屈富敏李哲张瑞雯黄国栋韩彬胡晨旭杨晓楠王磊
受保护的技术使用者：国网福建省电力有限公司国家电网有限公司
技术研发日：2023.05.19
技术公布日：2023/8/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种可调式柔性灯带制造方法与流程 下一篇：一种适用于富水砂化白云岩突涌模拟的模型试验装置的制作方法

基于数据驱动的机组组合决策方法、系统、设备及介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

基于数据驱动的机组组合决策方法、系统、设备及介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表