基于变量筛选重构模型提高陆地水储量重构准确性方法
未命名
08-15
阅读:137
评论:0
1.本发明属于水文学技术领域,具体是一种基于变量筛选重构模型提高陆地水储量重构准确性方法。
背景技术:
2.随着全球气候的变化,世界许多地区的极端水文事件日益增多。在过去的几十年里,洪水和干旱是气候变化造成的两个最具破坏性的灾难。水文极端事件严重影响人们的生活,造成了巨大的人类灾难和经济损失。因此,准确监测干旱和洪水事件对于预测灾害的演变和减少潜在危害非常必要。
3.实际上,干旱和洪水事件由于其时间和空间变化的复杂性而难以表征。监测洪水和干旱事件的常用措施依赖于实地观测,以提供可靠的水文气象参数,例如径流(r)、降水量(p)、温度(t)和蒸散量(et)。尽管实地观测可以提供准确的信息,但这些方法在空间和时间上都受到限制,因为该方法只覆盖了一个小区域。相应地,遥感技术已被证明具有高效、低成本的优点。早期研究表明,干旱和洪水事件可以通过不同的光学卫星观测手段在区域和全球范围内进行监测,例如landsat、sentinel-2、modis,以及viirs。而上述方法仍存在一定的局限性。具体来说,光学卫星图像容易被云和云影污染,导致时空覆盖不完整。这些缺陷降低了光谱图像数据在极端水文事件中的可用性。
4.重力恢复和气候实验(gravity recovery and climate experiment,grace)卫星任务的发射为监测陆地水储量变化提供了新的手段。目前,基于grace的旱涝指数能够有效捕捉和识别关键信息,已广泛应用于区域和全球极端水文监测应用。例如,ran等利用grace衍生的干旱指数分析了2019年夏秋季长江流域中下游地区的干旱严重程度。zhao等评估了2002~2014年期间美国大陆的grace衍生干旱指数表现,研究结果表明与其他干旱监测方法相比,该方法在空间和时间更具有一致性。在洪水事件监测方面,sun等基于grace和降水计算的洪水潜力指数(flood potential index,fpi)识别长江流域洪水事件,发现fpi可以可靠地评估水文极端事件。gupta等评估了印度半岛河流流域的洪水潜力,发现fpi可以监测表现出不同水文特征的流域中不同程度的洪水。与光学卫星相比,grace观测技术可以避免云层造成的数据缺失。因此,基于grace衍生的监测指标可以更全面的识别干旱和洪水事件。
5.尽管grace数据迄今为止取得了许多巨大的成就,但仍然存在一些需要改进的不足之处。具体而言,grace卫星与其后续卫星(grace-fo)之间的差距导致时间序列的不连续性,从而限制了数据的进一步分析和利用。sun等使用三种机器学习模型重建了缺失的月度grace,证明这三种基于机器学习的模型对于重建grace观测值是可靠的。li等将机器学习与时间序列分解和统计分解技术相结合,重建新的全球长期(1979-2020)twsa数据。yang等提出了一种基于时间序列分解方法重建了grace和grace-fo twsa之间的间断数据。然而,这些研究并未考虑输入变量对预测模型准确性的影响。在这项工作中,通过使用伽玛测试(gamma test,gt),可以使用排列组合方法找到最相关的输入变量。这些选定的输入变量在
长短期记忆(long short-term memory,lstm)预测模型中进行训练。因此,本发明提出结合gt和lstm来重建grace和grace-fo间断期的twsa信号。
6.鄱阳湖是中国最大的淡水湖,由于区域气候的剧烈变化,鄱阳湖流域已成为受洪涝灾害影响最频繁的地区之一。在这项工作中,结合谷歌地球引擎(google earth engine,gee)平台和重建的twsa,分析了干旱和洪水的特征。gee是一个基于云的全球尺度地理空间分析平台,用于解决多种热点社会问题,包括干旱、洪水、水资源管理和气候监测。以往研究表明,gee是描述干旱和洪水特征的有效工具。
7.不同于已有的研究,本发明考虑对输入变量进行选择来提高重构grace/grace-fo间断期陆地水储量的准确性。
技术实现要素:
8.为了解决现有技术中的不足,本发明旨在构建新型变量筛选重构模型,该模型利用伽马测试选择最优的输入变量组合,其次将优化后的变量组合输入到长短期神经网络中重构grace/grace-fo间断期陆地水储量。
9.本发明基于变量筛选重构模型提高陆地水储量重构准确性方法,变量筛选重构模型结合了gt方法和lstm神经网络的混合算法,包括:
10.变量筛选,首先将气候、水文变量代入gt方法,计算输入变量组合的伽马统计量,并根据伽马统计量确定最佳输入变量组合;
11.模型训练,将变量筛选中得到的筛选变量的80%作为特征,将预设时间周期的grace数据作为标签,使用lstm神经网络通过网格点进行训练,得到训练后的模型参数;
12.模型预测,根据模型训练中训练得到的模型参数和筛选变量的20%作为测试数据集,通过网格点预测grace/grace-fo间断期twsa数据以及比较验证的twsa数据。
13.优选地,所述变量筛选中,gt方法的表达式为:
14.{x1(i),
…
,xm(i),yi}={(xi,yi):1≤i≤m}
15.其中,xi是输入向量,仅限于某个封闭的有界集标量yi是输出,m是模式的数量,m是输入参数的数量,输入x与其对应y的输出之间的关系可以表达为:
16.y=f(x)+r
17.其中,f是代表系统的某个平滑未知函数,r代表不确定的部分。
18.优选地,估计噪声变量r的方差var(r),从最邻近的均方距离δ和统计量γ上的点拟合线性回归线:
19.γ=aδ+γ
20.其中,a是梯度,并以此回归线的截距估计var(r),
21.该截距被称为伽马统计量,用γ表示。
22.优选地,所述模型训练中,lstm神经网络模型的架构包括hochreiter和schmidhuber,其表达式为:
23.i
t
=σ(w
xi
x
t
+r
iht-1
+bi)
24.f
t
=σ(w
xf
x
t
+rfh
t-1
+bf)
25.o
t
=σ(w
xo
x
t
+r
oht-1
+bo)
[0026][0027][0028]ht
=o
t
tanh(c
t
)
[0029]
其中,i
t
、f
t
、o
t
、c
t
和h
t
分别是时间t的输入、遗忘、输出门、候选记忆单元、单元状态向量和单元输出向量,w
xi
、w
xf
、w
xo
和w
xc
分别是来自输入、遗忘、输出门和候选记忆单元的输入权重参数,ri、rf、ro和rc分别是来自输入、遗忘、输出门和候选记忆单元的循环权重参数,bi、bf、bo和bc分别是来自输入、遗忘、输出门和候选记忆单元的偏置向量,σ表示门激活函数,tanh表示双曲正切函数。
[0030]
优选地,所述lstm神经网络模型的输入数据分别包括:蒸散量、植物冠层地表水、径流、降水、土壤水和温度。
[0031]
优选地,所述模型预测中,取60个以上连续月份的grace twsa数据作为训练数据集;取24个以上连续月份的grace-fo twsa数据作为测试数据集。
[0032]
优选地,所述模型训练中,所述预设时间周期设定为60个以上连续月份。
[0033]
优选地,所述模型预测中,比较验证的twsa数据时间周期设定为24个以上连续月份。
[0034]
本发明提出的方法,为重建缺失的twsa提供了有效手段,为间断期的洪涝灾害研究提供了可靠数据支撑。基于变量筛选重构模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构grace/grace-fo间断期陆地水储量准确性。本发明的技术方案适合在相关技术领域推广应用。
附图说明
[0035]
为了更清楚地说明本技术实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0036]
图1是本发明变量筛选重构模型流程图;
[0037]
图2是鄱阳湖流域位置及海拔示意图;
[0038]
图3是鄱阳湖流域上grace/graec-fo、lstm和变量筛选重构模型的时间序列和散点图,其中(a)grace/graec-fo、lstm和变量筛选重构模型的twsa时间序列;(b)lstm重构结果与验证数据grace-fo的散点图;(c)变量筛选重构模型重构结果与验证数据grace-fo的散点图;
[0039]
图4是模型预测结果与grace-fo数据之间pr、nse和rmse的空间分布图,其中(a-c)表示nvfrm和grace-fo数据之间的pr、nse和rmse,(d-f)表示lstm和grace-fo数据之间的pr、nse和rmse;
[0040]
图5是twsa数据与降雨数据的关系示意图,其中(a)鄱阳湖流域stl分解的twsa、降水和年际变化趋势,(b)twsa线性趋势的空间分布,(c)降水线性趋势的空间分布;
[0041]
图6是干旱严重程度指数分析示意图,其中(a)鄱阳湖流域dsi和降水异常图,(b)鄱阳湖流域dsi和scpdsi的时间序列图,(c)stl分解的年际趋势时间序列;
observation,diso),用于综合评价不同模型的优劣。根据定义,diso值越小模型表现越好。经过计算,变量筛选重构模型的diso值为0.09,lstm模型的diso值为1.41,变量筛选重构模型相比lstm在综合指标diso方面精度提高93%。这证明gt变量选择算法提高了模型预测精度,输入变量选择是基于数据驱动的twsa重构模型中的必要步骤。阴影部分的范围描述了grace和grace-fo之间数据差距的模型预测结果。
[0056]
模型预测结果和测试数据grace-fo之间的pr、nse和rmse的空间分布,如图4所示。
[0057]
lstm和变量筛选重构模型各项指标均表明鄱阳湖流域西部的预测效果最好(平均pr=0.86、nse=0.65和rmse=7.21cm),就整个流域而言,lstm和变量筛选重构模型也得出了较好的性能(平均pr=0.81、nse=0.56和rmse=8.04cm)。
[0058]
值得注意的是,图4中所标注区域的nvfrm(pr=0.86、nse=0.67和rmse=7.09cm)优于lstm的结果(pr=0.86、nse=0.64和rmse=7.34cm)。可以得出在鄱阳湖流域,变量筛选重构模型相比lstm、nse和rmse指标更优。
[0059]
总体而言,本发明基于变量筛选重构模型数据驱动模型的预测结果具有更好的性能。本发明预测grace和grace-fo之间的差距的twsa数据是可靠的。因此,本发明将预测的间断期数据整合到csr-m数据中,并基于重建连续的twsa数据分析鄱阳湖流域的旱涝特征。
[0060]
图5(a)显示了鄱阳湖流域stl分解的twsa、降水和年际趋势的时间变化。总体来看,2002-2020年降水量与twsa具有较好的一致性(pr=0.65)。鄱阳湖流域twsa以0.38cm/y的速度增加,降水增长的速率为0.14cm/y,twsa增加受到降水增加的部分影响。stl分解年际变化清楚地揭示了twsa时间序列的波动。如2003年、2011年和2019年出现年际下降趋势的时间序列,说明鄱阳湖流域可能发生干旱。此外,2010年、2012年和2016年出现了较高的年际趋势的时间序列,表明该地区可能发生了洪水。
[0061]
图5(b)和图5(c)分别描绘了2002-2020年鄱阳湖流域twsa和降水线性趋势的空间分布。可以明显看出鄱阳湖流域twsa呈上升趋势,且整个流域的线性趋势均大于0。北部流域增幅较大(~0.59cm/y),而流域南部增幅较低(~0.25cm/y)。其原因可能与降水在空间分布上趋势相关,降水在北部流域呈较大的增长趋势(~0.28cm/y),在南部流域呈较小上升趋势(~0.03cm/y)。因此,降水的强度和持续时间与流域内旱涝的发生密切相关。
[0062]
鄱阳湖流域dsi和降水异常如图6(a)所示。liu等将干旱事件定义为dsi值连续三个月小于-0.8为一次干旱事件。灰色阴影表示dsi捕获的研究期间流域中的主要干旱事件。此外,从降水异常可以得出,干旱事件发生前和干旱事件发生时的负异常较多,说明此时的降水量小于同期,且很容易引发干旱。
[0063]
图6(b)和图6(c)分别比较了鄱阳湖流域2002~2020年dsi和scpdsi的时间序列。除了2004~2010年期间,dsi和scpdsi之间的时间序列基本一致。dsi和scpdsi的时间序列(图6(b))和stl分解(图6(c))的年际趋势,相关系数分别为0.76和0.90。值得一提的是,dsi和scpdsi的年际变化趋势显示出较高的相关系数,这可能是由于stl分解排除了季节性和残差因素的影响。总体而言,dsi和scpdsi的干旱指数之间确定了很强的相关性,进一步证明了dsi指数的可靠性。
[0064]
图6(b)2002-2020年鄱阳湖流域dsi从-2到2波动。根据ds i干旱事件的定义,确认了鄱阳湖流域2002~2020年4次干旱事件,确定的干旱事件与干旱新闻报道和中国政府发布的气候公报中的干旱记录一致(http://www.cma.gov.cn/)。2003年8月~2004年4月是该
地区旱情持续时间最长的干旱,持续时间为11个月。2004年2月旱情最为严重,dsi为-2.2,达到极端干旱程度(d4)。在研究期间,dsi监测的最近干旱发生在2019年9月~2019年12月,2019年11月达到dsi峰值-1.7,发生极端干旱(d4)。
[0065]
图7揭示干旱在空间上的变化过程。可以得出,鄱阳湖流域11月干旱最为严重。9~11月干旱逐渐加剧,北部流域由中度干旱(d2)转为极端干旱(d4)。12月,旱情减弱,流域大部分转为中重度干旱,但北部流域仍有极端干旱(d4)。
[0066]
鄱阳湖流域fpi时间序列和stl分解的年际变化趋势如图8(a)所示,其特点是流域尺度季节性周期大,年际变化显著。图8(b)显示了2002~2020年研究期间fpi的最大月值。鄱阳湖流域6、7月份的fpi值分别为0.58和0.52,发生洪水的可能性较大。在此期间,有关部门要及时开展水资源管理,预防和减轻灾害带来的负面影响。为了更深入地了解fpi捕捉洪水事件的能力。本发明统计了研究期间每年fpi的最大值和发生时间。夏季(6~8月)的结果与图8(b)结果一致。
[0067]
值得注意的是,鄱阳湖流域2016~2020年的fpi为0.58、0.51、-0.50、0.52和0.31,除了2018年,其他年份均发生了较大洪水,洪水发生频率显著增加。
[0068]
通常,twsa和降水是决定洪水发生的关键因素。由于较高的twsa不能进一步储存额外的水,这可能导致雨季具有发生洪水的巨大潜力。本发明将重点关注最近一次2016年洪水的空间格局。
[0069]
如图9所示,2016年3月~2016年8月fpi每月空间变化。3~4月,该地区大部分地区的fpi值较低,但该流域南部的洪水风险较高,fpi值平均约0.8。5月,中部fpi值最高约为0.9,高洪水潜力风险区向鄱阳湖流域中部移动。6月进入雨季后,高洪水风险蔓延至全区,大部分地区fpi均在0.5以上。最终,鄱阳湖流域除北部地区外,7~8月fpi逐渐降低到0.2以下,洪水强度开始下降。
[0070]
本发明重点关注重建的间断期twsa监测plb的洪水事件。中国气候公报报道描述了2017年8月的洪水。因此,本发明基于gee平台sentinel-1提取了2017年5月~2017年9月鄱阳湖流域水体的空间分布,如图10所示。结合图11(a)可以看出,5~7月,水体面积不断扩大,7月达到峰值为12188km2。随后,7~9月,鄱阳湖水域面积不断缩小。
[0071]
图11显示了2017年5月~2017年9月plb的水域、twsa、降雨量和fpi的时间序列。从图11(d)可以看出,2017年8月fpi指数的幅度较大(0.32),这意味着该地区被洪水淹没。6月的过量降雨导致水体面积和twsa在7月达到峰值,而由于该地区无法储存过多的水,8月较小的降雨过程导致洪水泛滥。这也有力地证明了本发明中重建的twsa可以监测地区的洪水事件。
[0072]
本发明的方法,考虑对输入变量进行选择来提高重构grace/grace-fo间断期陆地水储量的准确性。本发明旨在构建新型变量筛选重构模型,该模型利用伽马测试选择最优的输入变量组合,其次将优化后的变量组合输入到长短期神经网络中重构grace/grace-fo间断期陆地水储量。该模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构grace/grace-fo间断期陆地水储量的准确性。
[0073]
对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明实施例的精神或范围的情况下,在其他实施例中实现。因此,本发明实施例将不会被限制于本文所示的这些实施例,而是要符合与本文所公开
的原理和新颖特点相一致的最宽的范围。
[0074]
以上仅为本发明实施例的较佳实施例而已,并不用以限制本发明实施例,凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
技术特征:
1.基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,变量筛选重构模型结合了gt方法和lstm神经网络的混合算法,包括:变量筛选,首先将气候、水文变量代入gt方法,计算输入变量组合的伽马统计量,并根据伽马统计量确定最佳输入变量组合;模型训练,将变量筛选中得到的筛选变量的80%作为特征,将预设时间周期的grace数据作为标签,使用lstm神经网络通过网格点进行训练,得到训练后的模型参数;模型预测,根据模型训练中训练得到的模型参数和筛选变量的20%作为测试数据集,通过网格点预测grace/grace-fo间断期twsa数据以及比较验证的twsa数据。2.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述变量筛选中,gt方法的表达式为:{x1(i),...,x
m
(i),y
i
}={(x
i
,y
i
):1≤i≤m}其中,x
i
是输入向量,仅限于某个封闭的有界集标量y
i
是输出,m是模式的数量,m是输入参数的数量,输入x与其对应y的输出之间的关系可以表达为:y=f(x)+r其中,f是代表系统的某个平滑未知函数,r代表不确定的部分。3.根据权利要求2所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,估计噪声变量r的方差var(r),从最邻近的均方距离δ和统计量γ上的点拟合线性回归线:γ=aδ+γ其中,a是梯度,并以此回归线的截距估计var(r),该截距被称为伽马统计量,用γ表示。4.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型训练中,lstm神经网络模型的架构包括hochreiter和schmidhuber,其表达式为:i
t
=σ(w
xi
x
t
+r
i
h
t-1
+b
i
)f
t
=σ(w
xf
x
t
+r
f
h
t-1
+b
f
)o
t
=σ(w
xo
x
t
+r
o
h
t-1
+b
o
))h
t
=o
t
tanh(c
t
)其中,i
t
、f
t
、o
t
、c
t
和h
t
分别是时间t的输入、遗忘、输出门、候选记忆单元、单元状态向量和单元输出向量,w
xi
、w
xf
、w
xo
和w
xc
分别是来自输入、遗忘、输出门和候选记忆单元的输入权重参数,r
i
、r
f
、r
o
和r
c
分别是来自输入、遗忘、输出门和候选记忆单元的循环权重参数,b
i
、b
f
、b
o
和b
c
分别是来自输入、遗忘、输出门和候选记忆单元的偏置向量,σ表示门激活函数,tanh表示双曲正切函数。5.根据权利要求4所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述lstm神经网络模型的输入数据分别包括:蒸散量、植物冠层地表水、径流、降
水、土壤水和温度。6.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型预测中,取60个以上连续月份的grace twsa数据作为训练数据集;取24个以上连续月份的grace-fo twsa数据作为测试数据集。7.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型训练中,所述预设时间周期设定为60个以上连续月份。8.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型预测中,比较验证的twsa数据时间周期设定为24个以上连续月份。
技术总结
本发明属于水文学技术领域,具体是一种基于变量筛选重构模型提高陆地水储量重构准确性方法。本发明变量筛选重构模型结合了GT方法和LSTM神经网络的混合算法,包括:变量筛选,模型训练,模型预测。本发明提出的方法,为重建缺失的TWSA提供了有效手段,为间断期的洪涝灾害研究提供了可靠数据支撑。基于变量筛选重构模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构GRACE/GRACE-FO间断期陆地水储量的准确性。储量的准确性。储量的准确性。
技术研发人员:郑伟 杨帅 沈祎凡 祝会忠
受保护的技术使用者:辽宁工程技术大学
技术研发日:2023.01.03
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
