一种基于IVMD-LSTM-EBLS的水文时间序列预测模型构建方法
未命名
07-19
阅读:104
评论:0
一种基于ivmd-lstm-ebls的水文时间序列预测模型构建方法
技术领域
1.本发明属于水文预测技术领域,尤其涉及一种基于深度学习的水文时间序列预测模型构建方法。
背景技术:
2.水文预测为水文情况的预防和调度提供了科学依据。水文时间序列是按照时间变化进行采集的有序且离散的水文要素合集,非常依赖于数值在时间上的先后顺序,具有非线性、突变性、多噪音等特点,因此基于传统机器学习及统计学的模型预测效果往往差强人意,高精度预测的理论和方法越来越受到重视。
3.长短时记忆网络(long and short-term memory,lstm))在处理具有较长时间步长及非线性序列数据方面优势明显,在时间预测方面已经取得了优异的成果。但是受到深层结构的影响,基于lstm的水文时间预测模型普遍存在易陷入局部最优的缺点,这主要是由于lstm训练时需要循环调整权重所造成的,因此单一模型不能完全捕捉径流序列非线性特征,研究成果表明混合模型有助于提高预测精度。
4.变分模态分解(variational mode decomposition,vmd)分解可以有效减少中心频率混叠的问题,使数据更加平稳,分解形成的多组模态数据可以使小样本数据集数据按照频率层次进行多次特征提取;但是传统的vmd分解把所有模态全部放到模型训练,不相关模态数据经过模型训练造成损失值偏差被放大,影响最终权重值和阈值的计算。
5.宽度学习系统(broad learning system,bls)可以直接计算权重,能够直接从训练数据中学习深层重要特征的优点,解决了纯深度学习组合模型易陷入局部最优的缺陷;但是,bls中输入层与特征节点的权重以及特征节点到增强节点的权重是随机初生成的,对于不同的学习任务,权重的生成完全独立于样本,这种方式缺少可解释性。
技术实现要素:
6.发明目的:针对水文时间序列预测存在多噪音、非平稳等问题,导致预测结果容易出现偏差,本发明提出一种基于ivmd-lstm-ebls的水文时间序列预测模型构建方法。改进的ivmd(improved variational mode decomposition,ivmd)分解模块使得分解得到的子信号更加趋于平稳,更利于模型进行特征提取,同时结合ebls(enhanced broad learning system,ebls)增强了模型与原始数据之间的关系,解决梯度爆炸现象的出现。
7.技术方案:为实现本发明的目的,本发明所采用的技术方案是:
8.一种基于ivmd-lstm-ebls的水文时间序列预测模型构建方法,包括如下步骤:
9.步骤1、数据准备:获取历史记录中水文时间序列数据,确定训练集和测试集;
10.步骤2、利用ivmd分解和重构训练集的原始水文时间序列:中心频率法和皮尔逊相关系数法确定分解模态数k;剩余指数最小化准则确定步长τ;
11.步骤3、数据重构:将ivmd分解后的一维模态分量imf数据,叠加重构为包括时间步长、样本数和特征数的三维数据,作为两层lstm模型的第一层输入数据;
12.步骤4、使用两层lstm模型对重构的三维数据进行特征提取,每一层lstm后增加dropout层,得到初步的水文时间序列数据特征;
13.步骤5、利用ebls对步骤4得到的数据特征进行深层特征提取,完成预测模型的构建,利用训练集对预测模型进行训练,得到预测模型最终权重值和阈值;
14.步骤6、将测试集输入训练完成的预测模型中,验证方法可行性和提出模型的性能。
15.进一步的,步骤2中利用ivmd分解和重构原始水文时间序列的过程为:
16.s2.1、利用vmd将原始水文时间序列分解成k个模态,并获得每个imf的中心频率值,分析中心频率,确定最终k值;
17.s2.2、引入残差指数法确定更新步长τ;当残差指数rei值最小时,采用当前τ的取值进行vmd分解得到的各模态分解信号叠加重构后最接近原始水文时间序列;
18.设置τ初始取值范围为[0,1],步长为0.01,对确定好k值的原始水文时间序列进行若干次vmd分解,计算对应当前τ值的rei值,得到rei取得最小值时τ的取值;
[0019]
s2.3、采用皮尔逊相关系数法,将k个imf分别与原始水文时间序列做皮尔逊相关系数分析,排除相关性最小的imf,剩余的imf进行重组获得新的时间序列数据。
[0020]
进一步的,利用ebls进行深层特征提取的过程为:
[0021]
s3.1、将前两层lstm提取的特征信息数据作为bls输入数据;利用lstm传输来的输入向量与输出门之间的权重作为bls的初始权重进行线性变换生成映射特征;
[0022]
s3.2、通过映射特征生成多个映射节点;
[0023]
s3.3、将映射节点进行线性变换生成增强节点;
[0024]
s3.4、映射节点和增强节点通过矩阵求逆计算权重值;结合bls记忆单元中输入门和遗忘门的权重值和阈值对矩阵求逆得到的权重值进行校正,得到最终权重值和阈值。
[0025]
有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:
[0026]
在仿真分析中发现,lstm与bls模型的耦合叠加仍受深层结构影响,出现梯度爆炸的问题,本发明引入ebls(增强bls)改进lstm用于水文时间序列预测。改进的ivmd分解模块使得分解得到的子信号更加趋于平稳,更利于模型进行特征提取,同时结合ebls增强了模型与原始数据之间的关系,解决梯度爆炸现象的出现。
[0027]
在运算效率方面,ivmd去除了荣誉模态对模型的影响,同时结合了ebls快速计算的优势,进一步提升了模型的运算效率。本发明模型不仅在预测数值的准确性、模型的高效性和运算效率方面均有明显的优势,且对于不同类型的小样本数据集水文时间序列数据均具备适用性,进一步提升了对极端天气情况下径流量剧烈变化的预测精度,具备极高可信度,可以为真实水文情况做出指导性的预防和调度建议。
附图说明
[0028]
图1是本发明预测模型整体流程图;
[0029]
图2是本发明预测模型ebls结构图;
[0030]
图3是本发明针对数据集ⅰ的ivmd分解结果图;
[0031]
图4是本发明针对数据集ⅱ的ivmd分解结果图;
[0032]
图5是本发明模型针对数据集ⅰ的预测结果对比图;
[0033]
图6是本发明模型针对数据集ⅱ的预测结果对比图。
具体实施方式
[0034]
下面结合附图对本发明的技术方案进行详细说明。
[0035]
本发明采用的技术方案为:一种基于ivmd-lstm-ebls的水文时间序列预测模型如图1所示,根据历史降水与径流变化预测未来水文情况,包括以下几个步骤:
[0036]
步骤1:数据准备:取历史记录中水文时间序列数据,确定训练集和测试集。
[0037]
步骤2:利用ivmd处理训练集的原始水文时间序列:中心频率法和皮尔逊相关系数法确定分解模态数k;剩余指数最小化准则确定tau值。
[0038]
ivmd相较于vmd的改进点在于:一是选取了最优k值,二是选取了最优更新步长,三是排除相关性最低的模态分量,只选取相关性高的模态分量放入模型训练。由于vmd分解模态数k和更新步长τ,对模型训练结果及降噪存在较大影响。因此,采用中心频率法对k值进行定位,具体步骤如下:
[0039]
(1)利用vmd将原始信号(原始水文时间序列)进行k次分解,k=2,3...,n,得到一维模态分量(intrinsic mode functions,imf)数据,导出每次分解时各个模态的中心频率。
[0040]
(2)分析中心频率,确定最终k值:当模态选取值较小时,vmd相当于自适应滤波器,导致信号中重要信息被过滤,影响后续模型预测精度;当模态选取较大时,相邻模态分量中心频率会相距较近,导致通频带重合或产生额外噪声从而造成过分解。
[0041]
(3)引入残差指数法确定更新步长τ。残差指数(residual error index,rei)取值的大小与τ值直接相关,当rei值最小时,采用当前τ的取值进行vmd分解得到的各模态分解信号叠加重构后最接近原始信号。
[0042]
设置τ初始取值范围为[0,1],步长为0.01,对确定好k值的原始信号不断进行vmd分解,计算对应当前τ值的rei值。将结果可视化,得到rei取得最小值时τ的取值。rei计算如下式:
[0043][0044]
其中,k表示分解模态数,n为分解信号长度,为第i个信号分解后的第k个模态分量,fi为第i个信号的原始信号。在确定最佳分解模态数k和更新步长τ后,使用ivmd确定针对数据集ⅰ、ⅱ的分解子序列如图3、4所示。
[0045]
最后,采用皮尔逊相关系数法,对最终k个模态的中心频率分别与原始信号做相关性分析,排除相关性最小的imf,剩余的imf进行重组获得新的时间序列数据。皮尔逊相关系数法见下式:
[0046][0047]
其中pearson表示皮尔逊相关系数,xi为模态分量信号,为模态分量信号数据均
值,yi为原始信号,为原始信号数据均值。
[0048]
在零假设成立的条件下,即假设两变量不存在相关性的前提下,计算出两个变量之间存在相关性的概率值(p值):若p值很小,说明两变量不存在相关性的概率很小;反之,则存在相关性的概率很小。通常需要在满足p值要求的前提下再考虑相关系数的大小。通常根据以下相关系数取值范围来判断变量之间的相关强度:0.8-1.0,极强相关;0.6-0.8,强相关;0.4-0.6,中等强度相关;0.2-0.4,弱相关;0.00-0.2,极弱相关或无相关。对ivmd分解后模态与原始水文时间序列数据做相关性分析,计算结果见表1和表2。
[0049]
表1分解模态与原始数据相关系数(数据集ⅰ)
[0050] imf0imf1imf2imf3imf4imf5p值17.51702.3231455.175.426868.97631.5232相关系数0.41350.62590.48450.78510.85030.8360
[0051]
对于数据集ⅰ,imf4的相关系数为0.8503、imf5的相关系数为0.8360,与原始数据具有极强相关度;imf1的相关系数为0.6259、imf3的相关系数为0.7851,与原始数据具有强相关度;imf0的相关系数为0.4135、imf2的相关系数为0.4845,与原始数据具有中等程度相关性。结合p值的大小可见,虽然imf4与原始数据具有极强相关性、imf0和imf2与原始数据具有中等强度相关性,但其p值过大,存在相关性的概率很小。因此对于数据集ⅰ,选择imf1、imf3与imf5作为主要训练模态。
[0052]
表2分解模态与原始数据相关系数(数据集ⅱ)
[0053] imf0imf1imf2imf3imf4p值16.72432.35456.45691.4141136.1080相关系数0.35020.62720.72060.84130.7643
[0054]
对于数据集ⅱ,imf3的相关系数为0.8413,与原始数据具有极强相关度;imf1的相关系数为0.6272、imf2的相关系数为0.7206、imf4的相关系数为0.7643,与原始数据具有强相关度;imf0的相关系数为0.3502,与原始数据具有弱相关性。结合p值的大小可见,虽然imf4与原始数据具有强相关性,但其p值过大,存在相关性的概率很小,而imf0本身与原始数据具有弱相关性。因此对于数据集ⅱ,选择imf1、imf2与imf3作为主要训练模态。
[0055]
步骤3:数据重构:将ivmd分解后的一维imf数据,叠加重构为包括时间步长、样本数和特征数的三维数据,作为两层lstm模型的第一层输入数据。
[0056]
步骤4:使用两层lstm模型对重构的三维数据进行特征提取:在每一层lstm后增加dropout层,以防止过拟合,得到初步的水文时间序列数据特征。
[0057]
步骤5:ebls(增强bls)深层特征提取,完成预测模型的构建,利用训练集对预测模型进行训练,得到预测模型最终权重值和阈值。
[0058]
bls中输入层与特征节点的权重以及特征节点到增强节点的权重是随机初生成的,对于不同的学习任务,权重的生成完全独立于样本,因此这种方式缺少可解释性。
[0059]
为了寻求针对权重可解释性方式,强化bls权重的学习能力,本模型提出一种增强的bls,ebls结构图如图2所示。结合bls快速计算的优势,取代深层网络结构中最后一层lstm的输出门,将lstm中输入向量与输出门之间的权重值作为bls的初始权重进行线性变换生成映射特征,通过映射特征生成多个映射节点,将映射节点进行线性变换生成增强节点,映射节点和增强节点通过矩阵求逆计算权重值,利用记忆单元中输入向量与遗忘门、输
入门之间的权重值进行直接计算得到最终权重值。计算方法如下式:
[0060]
zi=φ(xw
xoi
+β
xoi
),i=1,
…
,n
[0061]
其中,zi为最终权重值,φ为激活函数,x为输入向量,w
xoi
、β
xoi
为lstm模型中输入向量与输出门之间的权重值和阈值,n为特征节点的窗口个数。
[0062]
由于bls模型的初始权重是随机生成的,这种随机性完全独立于训练样本,生成的权重值与训练样本并无联系,若生成的权重值偏差较大,通常会增加模型的计算时间,甚至对最终预测结果产生较大影响。ebls模型的提出,有效减少了bls模型随机生成的初始权重对预测结果的影响,进一步提升了模型的运算效率。
[0063]
步骤6:最后,将测试集输入训练完成的预测模型中,验证方法可行性和提出模型的性能。
[0064]
为验证本发明提出的模型的有效性,本发明使用均方根误差(rmse)、平均绝对误差(mae)和确定性系数(ns)为评价指标,计算公式如下:
[0065][0066]
其中,yi表示实际值,表示预测值,表示真实值的平均值。
[0067]
为验证本发明模型各模块的有效性和适用性,采用月降水数据和月径流数据两个数据集,将本发明所提出的新模型与vmd-cnn-lstm和vmd-lstm-bls进行分析对比,以rmse、mae和ns为参考指标,实验结果如表3可见。
[0068]
表3本发明模型与消融模型在不同预测长度下的评价指标对比
[0069][0070]
对比表3的评价指标可见:对于数据集ⅰ,在提前1个月时间步长的情况下新模型相比于vmd-cnn-lstm和vmd-lstm-bls模型,在rmse方面减少了约44.68%和10.11%;在mae方面减少了约50.81%和13.38%;在nse方面提升了约15.30%和1.61%。在提前3个月时间步长的情况下,在rmse方面减少了约46.85%和6.04%;在mae方面减少了约49.85%和16.35%;在nse方面提升了约17.88%和2.69%。在提前6个月时间步长的情况下,在rmse方面减少了约27.44%和6.03%;在mae方面减少了约31.59%和5.83%;在nse方面提升了约12.33%和1.82%。数据集ⅰ的预测结果对比图如图5所示。对于数据集ⅱ,在提前1个月为时间步长的情况下本发明提出的组合模型相比于vmd-cnn-lstm和vmd-lstm-bls模型,在rmse方面减少了约67.31%和36.23%;在mae方面减少了约61.98%和31.95%;在nse方面提升了约28.36%和4.95%。在提前3天为时间步长的情况下,在rmse方面减少了约45.44%和7.73%;在mae方面减少了约44.35%和12.62%;在nse方面提升了约23.43%和1.73%。在提前6天为时间步长的情况下,在rmse方面减少了约38.36%和3.62%;在mae方面减少了约
32.08%和4.58%;在nse方面提升了约22.55%和1.02%。数据集ⅱ的预测结果对比图如图6所示。
[0071]
结合表3以及《水文情报预报规范》相关规定可见,vmd-cnn-lstm的nse指标达到0.7396以上,最高可达0.7796,预测精度达到乙级标准;vmd-lstm-bls的nse指标最高为0.9165,预测结果为甲级标准;本发明提出的ivmd-lstm-ebls模型在数据集ⅰ月降水数据方面nse评价指标仿真结果达到0.8629以上,在提前1个月的情况下,nse值达到0.9326,预测精度为甲级标准,具备最高可信度;在数据集ⅱ月径流方面,vmd-cnn-lstm的最高nse值为0.6824,达到丙级标准;vmd-lstm-bls的nse指标最高为0.9165,预测结果为甲级标准;本发明提出的ivmd-lstm-ebls模型nse评级指标的仿真结果达到0.8671以上,提前1天作为预测长度时,nse指标可达到0.9660,预测精度为甲级标准,具备最高可信度标准。
[0072]
尽管上述实施方式对本发明进行了详细地说明,在具体实施过程中,依照实际操作仍可对细节进行补充和同等替换。应当指出:这些对于本发明的权利要求进行细节的补充和同等替换后的技术方案,均视为本发明的保护范围。
技术特征:
1.一种基于ivmd-lstm-ebls的水文时间序列预测模型构建方法,其特征在于,所述方法包括如下步骤:步骤1、数据准备:获取历史记录中水文时间序列数据,确定训练集和测试集;步骤2、利用ivmd分解和重构训练集的原始水文时间序列:中心频率法和皮尔逊相关系数法确定分解模态数k;剩余指数最小化准则确定步长τ;步骤3、数据重构:将ivmd分解后的一维模态分量imf数据,叠加重构为包括时间步长、样本数和特征数的三维数据,作为两层lstm模型的第一层输入数据;步骤4、使用两层lstm模型对重构的三维数据进行特征提取,每一层lstm后增加dropout层,得到初步的水文时间序列数据特征;步骤5、利用ebls对步骤4得到的数据特征进行深层特征提取,完成预测模型的构建,利用训练集对预测模型进行训练,得到预测模型最终权重值和阈值;步骤6、将测试集输入训练完成的预测模型中,验证方法可行性和提出模型的性能。2.根据权利要求1所述基于ivmd-lstm-ebls的水文时间序列预测模型构建方法,其特征在于,步骤2中利用ivmd分解和重构原始水文时间序列的过程为:s2.1、利用vmd将原始水文时间序列分解成k个模态,并获得每个imf的中心频率值,分析中心频率,确定最终k值;s2.2、引入残差指数法确定更新步长τ;当残差指数rei值最小时,采用当前τ的取值进行vmd分解得到的各模态分解信号叠加重构后最接近原始水文时间序列;设置τ初始取值范围为[0,1],步长为0.01,对确定好k值的原始水文时间序列进行若干次vmd分解,计算对应当前τ值的rei值,得到rei取得最小值时τ的取值;s2.3、采用皮尔逊相关系数法,将k个imf分别与原始水文时间序列做皮尔逊相关系数分析,排除相关性最小的imf,剩余的imf进行重组获得新的时间序列数据。3.根据权利要求1所述基于ivmd-lstm-ebls的水文时间序列预测模型构建方法,其特征在于,利用ebls进行深层特征提取的过程为:s3.1、将前两层lstm提取的特征信息数据作为bls输入数据;利用lstm传输来的输入向量与输出门之间的权重作为bls的初始权重进行线性变换生成映射特征;s3.2、通过映射特征生成多个映射节点;s3.3、将映射节点进行线性变换生成增强节点;s3.4、映射节点和增强节点通过矩阵求逆计算权重值;结合bls记忆单元中输入门和遗忘门的权重值和阈值对矩阵求逆得到的权重值进行校正,得到最终权重值和阈值。
技术总结
本发明公开了一种基于IVMD-LSTM-EBLS的水文时间序列预测模型构建方法,根据历史降水与径流变化预测未来水文情况。所述方法包括:获取历史记录中水文时间序列数据;根据历史记录中时间序列的变化,利用IVMD进行分解和重构;根据重构后的水文时间序列建立新的特征集合;利用LSTM提取新特征集合的特征数据;使用EBLS对提取到的特征数据进行线性变换生成映射特征,进一步提取深层特征信息并计算最终权重。本发明可以有效提高时间序列数据预测精度,同时也能提升预测效率,提高资源利用率。提高资源利用率。提高资源利用率。
技术研发人员:赵芮晗 韩莹 闫加宁 曹允重 张凌珺
受保护的技术使用者:南京信息工程大学
技术研发日:2023.04.27
技术公布日:2023/7/18
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种变压器降温防护装置的制作方法 下一篇:一种垫片存取装置的制作方法
