多模型融合地质灾害分析及预警方法、设备及存储介质与流程
未命名
07-18
阅读:161
评论:0
1.本发明涉及智能灾害预警领域,更具体地,涉及多模型融合地质灾害分析及预警方法、设备及存储介质。
背景技术:
2.根据《地质灾害防治条例》,地质灾害包括自然因素或者人为活动引发的危害人民生命和财产安全的山体崩塌、滑坡、泥石流、地面塌陷、地裂缝、地面沉降等与地质作用有关的灾害。我国是世界上受地质灾害影响最严重的国家之一。广东省山地环境较多,地形复杂,森林覆盖率高,台风登录频次高,历年广受地质灾害影响,人身安全及个人财产受到严重威胁。
3.根据广东省现有历史灾害统计数据显示,2013年至2018年攻击发生地质灾害2929起,其中滑坡1444起,崩塌1365起,泥石流38起,地面沉降8起,未知类型74起。滑坡和崩塌占比约96%。粤北共计发生地质灾害1904起,珠三角地区913起,粤东地区90起,粤西地区22起。此外2020年全省发生地质灾害231处,其中,在册复发地质灾害40处,占比17%,新增地质灾害191处,占比83%,中型以上地质灾害3处,有人员伤亡的地质灾害7处,皆为新增地质灾害。广东省大部分新增的地质灾害并不属于在册地质灾害隐患点,且新增的地质灾害发灾前大都不在综合治理范围内。
4.带有地质灾害发生原因的数据共计2918起,其中发生原因由
‘
雨’和
‘
降水’导致的共计2821起,占比96.68%。推断绝大多数的地质灾害由于降水直接导致。记录灾害规模的共计2919起,按照灾害规模分类,小型灾害2826起,中型83起,大型8起,特大型2起。统计在表内灾害影响人数共计63914人,累计造成119人死亡,46人受伤,直接经济损失4.17亿元。
5.广东省地质灾害隐患排查表统计隐患点14867个,排查日期范围为2014年3月至2021年7月。隐患点类型以崩塌和滑坡为主共计占比约90%。隐患点主要分布在粤北及珠三角区域的部分地市,其中梅州市3215个,清远市1782个,韶关市1710个,肇庆市1362个,广州市1007个。截至到2021年7月,现存隐患点剩余3920个,自然消亡6059个,已治理3756个,已搬迁746个,正在治理386个,消除隐患点完成率约71%。
6.基于地质灾害易发、突发、频发的特点,人工监测、专家经验、物理模型等方法已无法实现全方位不休眠地进行监测,亟需运用高科技手段,提升地质灾害监测预警能力。在人工智能时代,应用机器学习方法进行预测更直接、更客观科学,也是未来预测灾害方法的趋势。机器学习是指基于对数据的初步认识以及学习目的的分析,选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策略,运用合适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。因此机器学习擅长从数据中发现一些人类难以用特定公式去量化的或模拟的规律,从而对某些行为或事件进行推测及判断。
7.当前预警主要基于区域短期降水值阈值预报模型,主要使用区域降水极值作为气象风险阈值进行各等级风险预警,人为判断因素较高。
技术实现要素:
8.本发明旨在克服上述现有技术的至少一种缺陷,提供多模型融合地质灾害分析及预警方法、设备及存储介质,用于解决现有的灾害预警主要使用区域降水极值作为气象风险阈值进行各等级风险预警,人为判断因素较高的问题。
9.本发明采用的技术方案包括:
10.第一方面,本发明提供一种多模型融合地质灾害分析及预警方法,包括:将区域的地形地貌栅格图转换为矢量数据,构建地区的地图网格,将地图网格与矢量数据相交,得到地区网格化数据;基于地区的历史灾害数据,对地区中的子地区的地质灾害数量进行统计;根据子地区的地质灾害数量与子地区的地形地貌数据,确定区域灾害风险系数;基于地区的历史灾害数据,确定灾害发生前的基站降水数据;通过特征筛选确定降水逐时段统计范围,根据降水逐时段统计范围构建灾害前降水特征,根据灾害前降水特征构建逐时段降水统计数据集;根据逐时段降水统计数据集,确定降水量对应的风险系数;将逐时段降水统计数据集划分为训练集和验证集,结合xgboost算法和lightgbm算法分别对灾害预测模型进行训练,得到若干个预测模型;输入降水数据利用若干个预测模型对灾害进行预测,确定若干个模型输出的平均置信度;结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警。
11.本发明提供的多模型融合地质灾害分析及预警方法,将降水量和地形地貌与地质灾害发生关联起来,构建特征后通过预测模型以及风险系数的加权融合方式能够得到灾害发生的可能性。该方案较传统地质灾害风险预测而言,可以有效地将导致灾害发生的特征进行量化分析,尤其是当数据集足够完备后优势更加突出。该方案还可用于结合其他可能的特征维度,判断挖掘其他可能导致地质灾害发生的因子并予以量化,对于预测及分析都具有一定帮助。
12.进一步,通过特征筛选确定降水逐时段统计范围,根据降水逐时段统计范围构建灾害前降水特征,具体包括:通过lasso算法筛选确定权重系数最大的特征为灾害前降水量,确定降水逐时段统计范围为灾害发生前3日、前7日和前15日,构建灾害前降水特征为灾害发生前15日逐日降水量、灾害发生前3日降水量总和、灾害发生前7日降水量总和,以及灾害发生前15日降水量总和。
13.通过特征筛选方法确定所构建的特征需要涉及的时段范围,构建更加精准的降水与灾害发生统计数据集。
14.进一步,结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警,具体包括:当平均置信度大于0.5时,利用对地区的灾害进行预警,具体包括:当平均置信度大于0.5时,利用确定预测结果;当平均置信度大于0.5时,利用0.5时,利用确定预测结果;其中,a和n为量化系数,a满足a∈(0,1),risk
rain
为降水量对应的风险系数,risk
region
为地区的区域灾害风险系数。
15.通过系数量化回归模型,使综合风险系数与灾害发生之间关系更强,达到了预测模型与风险系数融合预警的效果。
16.进一步,将逐时段降水统计数据集划分为训练集和验证集,具体包括:将逐时段降水统计数据集中的数据样本随机切分为5份数据集,其中4份作为训练集,1份作为验证集,轮流抽取随机切分的数据集作为验证集,并采用smote采样算法对每个随机切分的训练集进行上采样平衡正负样本数量。
17.进一步,子地区的地形地貌数据至少包括子地区的地表特征、地貌特征和土地利用特征;子地区的地表特征为水体、湿地、森林、人造地表、裸地、灌木地、耕地和草地中的一种;子地区的地貌特征为中海拔中起伏山地、中海拔大起伏山地、低海拔丘陵、低海拔中起伏山地、低海拔冲积台地、低海拔冲积平原、低海拔冲积洪积台地、低海拔冲积洪积平原、低海拔剥蚀台地、低海拔小起伏山地、低海拔海积冲积平原、低海拔海积台地、低海拔海积平原、低海拔熔岩堆积台地、水下三角洲、水下台地、水下岸坡和湖泊中的一种;子地区的土地利用特征为城镇用地、低覆盖度草地、高覆盖度草地、灌木林、海洋、旱地、河渠、湖泊、林地、裸土地、农村居民点、其他林地、其它利用土地、其它建设用地、沙地、疏林地、水库坑塘、水田、滩地、滩涂、盐碱地、沼泽地和中覆盖度草地中的一种。
18.进一步,根据子地区的地质灾害数量与子地区的地形地貌数据,确定区域灾害风险系数,具体包括:利用斯皮尔曼相关系数算法,根据子地区的地质灾害数量与子地区的地形地貌数据,对地形特征、地貌特征和土地利用特征进行风险百分比加权,得到区域灾害风险系数;根据逐时段降水统计数据集,确定降水量对应的风险系数,具体包括:利用斯皮尔曼相关系数算法,根据逐时段降水统计数据集,确定降水量对应的风险系数。
19.进一步,地质灾害类别至少包括崩塌、滑坡、泥石流和土地沉降。
20.进一步,方法还包括:采集地区的人口数量,结合地区网格化数据得到地区人口网格分布;根据地区人口网格分布确定地区的隐患点,根据地区的隐患点得到隐患点网格分布;根据人口网格分布、隐患点网格分布以及每种地形地貌的灾害风险系数,确定地图网格中隐患点数量偏高的网格。
21.本方案还可以基于人口以及网格化的数据得到隐患点高的网格,基于现有的数据对灾害进行分析和预警。
22.第二方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的多模型融合地质灾害分析及预警方法。
23.第三方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的多模型融合地质灾害分析及预警方法。
24.与现有技术相比,本发明的有益效果为:
25.本发明提供的多模型融合地质灾害分析及预警方法,将降水量和地形地貌数据与地区发生地质灾害的情况进行关联,基于特征筛选构建了降水特征后,通过两种算法分别训练预测模型,得到的预测模型结合风险系数的加权融合方式能够得到灾害发生的可能性。该方案较传统地质灾害风险预测而言,可以有效地将导致灾害发生的地质、地貌特征以及降水特征进行量化分析,尤其是当数据集足够完备后优势更加突出。该方案还可用于结合其他可能的特征维度,判断挖掘其他可能导致地质灾害发生的因子并予以量化,对于预测及分析都具有一定帮助。
附图说明
26.图1为本发明实施例1中方法步骤s110~s170的流程示意图。
27.图2为本发明实施例1中作为示例的网格分布示意图。
28.图3为本发明实施例1中作为示例的网格数据分布示意图。
29.图4为本发明实施例1中的预警界面示意图。
30.图5为本发明实施例1中作为示例的地区人口网格分布示意图。
31.图6为本发明实施例1中作为示例的隐患点网格分布示意图。
32.图7为本发明实施例1中作为示例的三维散点图。
具体实施方式
33.本发明附图仅用于示例性说明,不能理解为对本发明的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
34.实施例1
35.本实施例提供一种多模型融合地质灾害分析及预警方法,如图1所示,步骤包括:
36.s110、将区域的地形地貌栅格图转换为矢量数据,构建地区的地图网格,将地图网格与矢量数据相交,得到地区网格化数据;
37.在本步骤中,具体是利用现有的arcmap软件将某一地区的地形地貌栅格图转面处理成矢量数据,并通过图层与地形地貌特征表连接挂接属性。在构建地图网格时,结合地区的行政区划,可建立入1:10km网格,创建出来的网格id进行列序与经纬度计算,通过面转点与地区的行政区划进行属性挂接,并通过点与网格连接,使得网格带有行政区与经纬度属性。将网格与地区地形地貌矢量数据相交,计算输入要素的几何交集。所有图层和/或要素类中相叠置的要素或要素的各部分将被写入到输出要素类。
38.在具体的实施方式中,以某省份为例,可创建如图2所示的网格,在与地形地貌数据相交后,可得到如图3所示的网格化数据。
39.具体地,子地区的地形地貌数据至少包括子地区的地表特征、地貌特征和土地利用特征。
40.子地区的地表特征为水体、湿地、森林、人造地表、裸地、灌木地、耕地和草地中的一种。
41.子地区的地貌特征为中海拔中起伏山地、中海拔大起伏山地、低海拔丘陵、低海拔中起伏山地、低海拔冲积台地、低海拔冲积平原、低海拔冲积洪积台地、低海拔冲积洪积平原、低海拔剥蚀台地、低海拔小起伏山地、低海拔海积冲积平原、低海拔海积台地、低海拔海积平原、低海拔熔岩堆积台地、水下三角洲、水下台地、水下岸坡和湖泊中的一种。
42.子地区的土地利用特征为城镇用地、低覆盖度草地、高覆盖度草地、灌木林、海洋、旱地、河渠、湖泊、林地、裸土地、农村居民点、其他林地、其它利用土地、其它建设用地、沙地、疏林地、水库坑塘、水田、滩地、滩涂、盐碱地、沼泽地和中覆盖度草地中的一种。
43.s120、基于地区的历史灾害数据,对地区中的子地区的地质灾害数量进行统计;根据子地区的地质灾害数量与子地区的地形地貌数据,确定区域灾害风险系数。
44.在本步骤中,具体是使用地区的历史灾害仅存在县区经纬度的灾害数据,以区县
级(子地区)行政区划匹配各区县地形地貌土地利用各类特征,例如森林,灌木林,低海拔小起伏山地等数据。进一步统计各区县级发生历史地质灾害发生数,对相同区县发生地质灾害进行加和处理。地质灾害类别至少包括崩塌、滑坡、泥石流和土地沉降。
45.在确定区域灾害风险系数时,具体的实施方式是利用斯皮尔曼相关系数算法,根据逐时段降水统计数据集,确定降水量对应的风险系数。斯皮尔曼相关系数算法是通过计算两组变量的排序情况来估计两组变量的相关性,在两组排序集合中对应相减得到一个新的差分集合,然后由差分集合计算得到最终的系数,可以理解为经过排序后的两个随机变量的皮尔逊相关系数,体现为下列式子:
[0046][0047]
其中d是差分集合,n为两个元素的个数,dii为在i排行下两组集合对应的值的差值。
[0048]
s130、基于地区的历史灾害数据,确定灾害发生前的基站降水数据;
[0049]
在本步骤中,基于地区的历史灾害数据,在基站降水数据中统计距离每次灾害最近的基站降水数据,作为灾害发生前的基站降水数据。
[0050]
s140、通过特征筛选确定降水逐时段统计范围,根据降水逐时段统计范围构建灾害前降水特征,根据灾害前降水特征构建逐时段降水统计数据集;
[0051]
在本步骤中所构建的数据集将用于机器学习模型的训练,而机器学习在回归模型中,是通过定义的一个损失函数使用一个算法,如最小二乘法获得每个特征属性的权益系数,即权重,然后对权重优化的一个计算过程。然而在数据集较小或特征列较多的情况下,很难完成对回归斜率产生估计或复杂化模型,在特征列较多的情况下也容易产生过拟合以及非主要特征造成分箱等现象。分箱在验证集和随机拆分出的测试集上可以有效增加预测准确率、f1指数等指标,但在当前的业务场景下地形地貌可能产生的分箱效果或会直接导致某些未发生过地质灾害的地点永远处于“不预警”的状态,与实际运用场景不符。因此在训练前需要通过特征筛选的方式对特征进行缩减及筛选。在本实施例中,特征筛选的方法为lasso特征筛选法,使用lasso回归给预测回归斜率增加一个惩罚因子,尝试实现特征缩减及筛选。
[0052]
在本步骤中,通过lasso算法筛选确定权重系数最大的特征为灾害前降水量,确定降水逐时段统计范围为灾害发生前3日、前7日和前15日,构建灾害前降水特征为灾害发生前15日逐日降水量、灾害发生前3日降水量总和、灾害发生前7日降水量总和,以及灾害发生前15日降水量总和s150、根据逐时段降水统计数据集,确定降水量对应的风险系数。
[0053]
s150、将逐时段降水统计数据集划分为训练集和验证集,结合xgboost算法和lightgbm算法分别对灾害预测模型进行训练,得到若干个预测模型;
[0054]
在具体的实施方式中,划分数据集的方法采用5折交叉验证切分数据集的方法进行训练及和验证集的划分,具体是将逐时段降水统计数据集中的数据样本随机切分为5份数据集,其中4份作为训练集,1份作为验证集,轮流抽取随机切分的数据集作为验证集,并采用smote采样算法对每个随机切分的训练集进行上采样平衡正负样本数量。目的为降低模型在随机划分样本时产生不均衡导致单一模型对预测结果有偏差以及综合性的评定模型精度。由于数据量较小,为了防止偏向性,最终预测结果由五个模型分别预测数据集的平
均置信度生成。
[0055]
smote(synthetic minority oversampling technique)采样算法,即合成少数类过采样技术,是基于随机过采样算法的一种改进方案,由于随机过采样采取简单复制样本的策略来增加少数类样本,这样容易产生模型过拟合的问题,即使得模型学习到的信息过于特别而不够泛化,smote算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中,可简述为:在特征数量的维度上,选择两个相近少类样本连线中任意一点构建新的特征作为训练样本。算法流程如下:
[0056]
(1)对于少数类中每一个样本x,以欧氏距离为标准计算它到少数类样本集中所有样本的距离,得到其k近邻;
[0057]
(2)根据样本不平衡比例设置一个采样比例以确定采样倍率n,对于每一个少数类样本x,从其k近邻中随机选择若干个样本,假设选择的近邻为o;
[0058]
(3)对于每一个随机选出的近邻o,分别与原样本按照公式o
(new)
=o+rand(0,1)*(x-o) 构建新的样本,即为
[0059]
在本步骤中,结合xgboost算法和lightgbm算法分别对灾害预测模型进行训练,分别得到5个模型,共得到10个预测模型。
[0060]
使用xgboost算法对筛选后特征及发生灾害情况构建数据集进行验证。
[0061]
xgboost是梯度提升树模型的一种,以串行方式生成模型,取所有模型的和为输出。xgboost将损失函数作二阶泰勒展开,利用损失函数的二阶导数信息优化损失函数,根据损失函数是否减小来选择是否分裂节点。xgboost的损失函数为
[0062]
其中:m 为样本总数, t 为当前基学习器索引, t为当前基学习器叶子结点数,ij为第j个结点的样本索引集合, ωj为第 j 个结点的权重,如果样本 x在第 j 个结点上,则f(x)=ωj。
[0063]
对于每一种树结构q,它的叶子结点的权重可以求解得到:
[0064]
通过比较所有树结构的 obj
t ,选择最小obj
t 对应的结构就是当前t时刻的新学习器。为了提升分裂效率,以分裂前后的损失作为大小比较来定义分裂增益。
[0065]
即:
[0066]
当增益大于0时,及时产生分裂。当分裂无增益时,即为最优模型停止训练。
[0067]
在进行模型训练时,使用网格超参搜索方式对模型超参数进行测试,修改产生最优auc及racall的超参组合,调整包含:学习率,最大子树数,伽马值,最小子权重,子样本数在内的13类超参。
[0068]
最终选取超参:
[0069]
lightgbm超参:
[0070][0071][0072]
xgboost超参:
[0073][0074]
s160、输入降水数据利用若干个预测模型对灾害进行预测,确定若干个模型输出的平均置信度;
[0075]
在交叉验证结果融合时,采用多个训练模型平均置信度作为最终预测结果,平均置信度大于0.5取做综合预测结果为1。
[0076]
s170、结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警。
[0077]
经模拟测试,发现其未能完全量化降水量与业务风险等级正相关的线性关系,即当降水值达到一定量级时置信度不会单调增加。因此需结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警。如图4所示,为预警界面图。
[0078]
当平均置信度大于0.5时,利用确定预测结果;
[0079]
当平均置信度大于0.5时,利用确定预测结果;
[0080]
其中,a和n为量化系数,a满足a∈(0,1),risk
rain
为降水量对应的风险系数,risk
region
为地区的区域灾害风险系数。
[0081]
具体地,当a取0.71时,n取1.73时,r2较大,综合风险系数与灾害数线性关系较强,具体可见表1。
[0082]
表1
[0083][0084]
本方案将降水和地形地貌与地质灾害发生通过算法关联起来,使用关联性分析进行了多维度探究灾害发生的规律与致灾的原因。尝试使用多种机器学习算法,通过模型系数的加权融合方式得到一组性能较优的风险系数,该系数详细量化了灾害发生的可能性。该方案较传统地质灾害风险预测而言,可以有效地将导致灾害发生的特征进行量化分析,尤其是当数据集足够完备后优势更加突出。该方案还可用于结合其他可能的特征维度,判断挖掘其他可能导致地质灾害发生的因子并予以量化,对于预测及分析都具有一定帮助。
[0085]
在优选的实施方式中,方法还包括:
[0086]
t110、采集地区的人口数量,结合地区网格化数据得到地区人口网格分布;
[0087]
在本步骤中,人口基站统计逻辑为:以月份为单位统计基站方圆500米的连接该基站的人口平均数,以不同区域市场占有率为标准制定倍率系数计算实际人口数量。因每月份基站存在开放数量有区分,不同月份基站数量有所不同。
[0088]
以基站经纬度为坐标点位,使其落入划分的网格级地形地貌图例,可得到地区人
口分布情况,后续将使用该数据评价网格隐患点排查情况。如图5所示为作为示例的地区人口网格分布图。
[0089]
t120、确定地区的隐患点,根据地区的隐患点和地区人口网格分布得到隐患点网格分布;
[0090]
在本步骤中,将地区的隐患点的数量落入地区人口网格分布,得到隐患点网格分布。如图6所示为示例的隐患点网格分布。
[0091]
t130、根据人口网格分布、隐患点网格分布以及每种地形地貌的灾害风险系数,确定地图网格中隐患点数量偏高的网格。
[0092]
以图6作为示例,根据数据统计,隐患点所在网格共计1027个,即约50%的网格无现存隐患点。每个网格人口均值6743人,中位数660人,网格极值358259人。其中无人网格199个,占比约10%。
[0093]
在优选的实施方式中,通过地区人口网格分布和隐患点网格分布、地质灾害的发生情况,可构建三维散点图,将人口、风险系数和现存隐患点数量的关系进行展示。
[0094]
如图7所示为基于图5、6构建的作为示例的三维散点图,从散点图可分析出,整体趋势为风险系数越高,相对隐患点数量越高,并可以根据散点图选出隐患点偏高的网格点,用于后续进行灾害预警和综合性分析。
[0095]
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
技术特征:
1.一种多模型融合地质灾害分析及预警方法,其特征在于,包括:将区域的地形地貌栅格图转换为矢量数据,构建地区的地图网格,将地图网格与矢量数据相交,得到地区网格化数据;基于地区的历史灾害数据,对地区中的子地区的地质灾害数量进行统计;根据子地区的地质灾害数量与子地区的地形地貌数据,确定区域灾害风险系数;基于地区的历史灾害数据,确定灾害发生前的基站降水数据;通过特征筛选确定降水逐时段统计范围,根据降水逐时段统计范围构建灾害前降水特征,根据灾害前降水特征构建逐时段降水统计数据集;根据逐时段降水统计数据集,确定降水量对应的风险系数;将逐时段降水统计数据集划分为训练集和验证集,结合xgboost算法和lightgbm算法分别对灾害预测模型进行训练,得到若干个预测模型;输入降水数据利用若干个预测模型对灾害进行预测,确定若干个模型输出的平均置信度;结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警。2.根据权利要求1所述的多模型融合地质灾害分析及预警方法,其特征在于,通过特征筛选确定降水逐时段统计范围,根据降水逐时段统计范围构建灾害前降水特征,具体包括:通过lasso算法筛选确定权重系数最大的特征为灾害前降水量,确定降水逐时段统计范围为灾害发生前3日、前7日和前15日,构建灾害前降水特征为灾害发生前15日逐日降水量、灾害发生前3日降水量总和、灾害发生前7日降水量总和,以及灾害发生前15日降水量总和。3.根据权利要求2所述的多模型融合地质灾害分析及预警方法,其特征在于,结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警,具体包括:当平均置信度大于0.5时,利用确定预测结果;当平均置信度大于0.5时,利用确定预测结果;其中,a和n为量化系数,a满足a∈(0,1),risk
rain
为降水量对应的风险系数,risk
tegion
为地区的区域灾害风险系数。4.根据权利要求1所述的多模型融合地质灾害分析及预警方法,其特征在于,将逐时段降水统计数据集划分为训练集和验证集,具体包括:将逐时段降水统计数据集中的数据样本随机切分为5份数据集,其中4份作为训练集,1份作为验证集,轮流抽取随机切分的数据集作为验证集,并采用smote采样算法对每个随机切分的训练集进行上采样平衡正负样本数量。5.根据权利要求1~4任一项所述的多模型融合地质灾害分析及预警方法,其特征在
于,子地区的地形地貌数据至少包括子地区的地表特征、地貌特征和土地利用特征;子地区的地表特征为水体、湿地、森林、人造地表、裸地、灌木地、耕地和草地中的一种;子地区的地貌特征为中海拔中起伏山地、中海拔大起伏山地、低海拔丘陵、低海拔中起伏山地、低海拔冲积台地、低海拔冲积平原、低海拔冲积洪积台地、低海拔冲积洪积平原、低海拔剥蚀台地、低海拔小起伏山地、低海拔海积冲积平原、低海拔海积台地、低海拔海积平原、低海拔熔岩堆积台地、水下三角洲、水下台地、水下岸坡和湖泊中的一种;子地区的土地利用特征为城镇用地、低覆盖度草地、高覆盖度草地、灌木林、海洋、旱地、河渠、湖泊、林地、裸土地、农村居民点、其他林地、其它利用土地、其它建设用地、沙地、疏林地、水库坑塘、水田、滩地、滩涂、盐碱地、沼泽地和中覆盖度草地中的一种。6.根据权利要求5所述的多模型融合地质灾害分析及预警方法,其特征在于,根据子地区的地质灾害数量与子地区的地形地貌数据,确定区域灾害风险系数,具体包括:利用斯皮尔曼相关系数算法,根据子地区的地质灾害数量与子地区的地形地貌数据,对地形特征、地貌特征和土地利用特征进行风险百分比加权,得到区域灾害风险系数;根据逐时段降水统计数据集,确定降水量对应的风险系数,具体包括:利用斯皮尔曼相关系数算法,根据逐时段降水统计数据集,确定降水量对应的风险系数。7.根据权利要求1~4任一项所述的多模型融合地质灾害分析及预警方法,其特征在于,地质灾害类别至少包括崩塌、滑坡、泥石流和土地沉降。8.根据权利要求1~4任一项所述的多模型融合地质灾害分析及预警方法,其特征在于,方法还包括:采集地区的人口数量,结合地区网格化数据得到地区人口网格分布;根据地区人口网格分布确定地区的隐患点,根据地区的隐患点得到隐患点网格分布;根据人口网格分布、隐患点网格分布以及每种地形地貌的灾害风险系数,确定地图网格中隐患点数量偏高的网格。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~8任一项所述的多模型融合地质灾害分析及预警方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~8任一项所述的多模型融合地质灾害分析及预警方法。
技术总结
本发明提供多模型融合地质灾害分析及预警方法、设备及存储介质,方法包括:得到地区网格化数据;对地区中的子地区的地质灾害数量进行统计;确定区域灾害风险系数;通过特征筛选确定降水逐时段统计范围,构建逐时段降水统计数据集;划分为训练集和验证集,结合XGBoost算法和LightGBM算法分别对灾害预测模型进行训练;确定模型输出的平均置信度;结合平均置信度、地区的区域灾害风险系数以及降水量对应的风险系数对地区的灾害进行预警。该方法将降水量和地形地貌与地质灾害发生关联起来,构建特征后通过预测模型以及风险系数的加权融合方式能够得到灾害发生的可能性,可有效地将导致灾害发生的特征进行量化分析,尤其是当数据集足够完备后优势更加突出。足够完备后优势更加突出。足够完备后优势更加突出。
技术研发人员:李红泽 蔡建桥
受保护的技术使用者:联通(广东)产业互联网有限公司
技术研发日:2023.02.14
技术公布日:2023/5/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
