基于大数据和机器学习的复杂下垫面气象数据网格分析方法与系统与流程

未命名 07-23 阅读:126 评论:0


1.本发明涉及气象数据分析方法,更具体地说是指基于大数据和机器学习的复杂下垫面气象数据网格分析方法与系统。


背景技术:

2.气象数据监测是指气象监测机构通过气象监测系统对气象环境状况进行整体性监测和预警的活动,气象监测系统通过对反应气象质量的指标进行监测和上报,以确定该地降雨量、风速风向等气象环境数据。
3.气象数据监测都是以气象站点呈现,分布不均匀,往往只能代表站点周边很小区域范围。在实际应用中,无观测点的气象实况获取一直是个难题。通过气象实况观测数据网格化分析可以有效的解决上述问题。然而,当前的气象实况数据网格化分析多从纯数学插值算法考虑,缺乏物理考虑。
4.因此,有必要设计一种方法,实现解决气象实况数据网格化分析能力不足的问题。


技术实现要素:

5.本发明的目的在于克服现有技术的缺陷,提供基于大数据和机器学习的复杂下垫面气象数据网格分析方法与系统。
6.为实现上述目的,本发明采用以下技术方案:基于大数据和机器学习的复杂下垫面气象数据网格分析方法,包括:
7.基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;
8.将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;
9.输出所述分析结果至终端。
10.其进一步技术方案为:所述气象观测数据网格分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的。
11.其进一步技术方案为:所述分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的,包括:
12.获取站点历史气象观测报文和地理信息静态数据,并搭建样本集;
13.采用随机森林算法搭建框架;
14.利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型。
15.其进一步技术方案为:所述获取站点历史气象观测报文和地理信息静态数据,并
搭建样本集,包括:
16.获取站点历史报文,并通过站点历史报文获取每个站点经纬度;
17.利用每个站点经纬度结合对应的地理信息静态数据,以分区统计的方式获得每个站点的地理信息静态数据属性;
18.对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据;
19.利用质控后的站点气象观测数据基于每个站点的经纬度获取与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离;利用质控后的站点气象观测数据获取报文观测时间;
20.其中,所述样本集包括每个站点的地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间以及质控后的站点气象观测数据。
21.其进一步技术方案为:所述对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据,包括:
22.对所述站点历史报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控以及时间一致性质控,以得到质控后的站点气象观测数据。
23.其进一步技术方案为:所述利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型,包括:
24.将每个站点地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间为输入,所述站点气象观测为学习目标输入到随机森林算法所构建的框架内;
25.设置不纯度、损失函数参数,并对随机树数目、树的最大深度参数进行迭代测试,基于学习曲线确定框架的参数,以得到气象观测数据网格分析模型。
26.其进一步技术方案为:所述基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息,包括:
27.基于目标网格上每个网格点的经纬度,以分区统计的方式获得每个网格点地理信息静态数据属性;
28.对站点实况报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控和时间一致性质控;
29.利用质控后的站点气象观测,基于目标网格上每个网格点的经纬度分别获取与每个网格点的距离符合要求的若干个站点气象观测实况数据和对应空间距离;
30.利用质控后的站点实况气象观测获取实况报文观测时间,以得到观测时间信息。
31.本发明还提供了基于大数据和机器学习的复杂下垫面气象数据网格分析系统,包括:
32.获取单元,用于基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;
33.分析单元,用于将所述地理信息静态数据属性、若干个站点气象实况观测数据和
对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;
34.输出单元,用于输出所述分析结果至终端。
35.本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
36.本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
37.本发明与现有技术相比的有益效果是:本发明通过基于随机森林算法,使用了地理信息静态大数据集作为影响因子构建分析模型,用于基于气象站点观测的网格化分析,模型融入了局地属性对大气状况影响的物理机制,使用了多邻近观测为作为因子,实现随机森林算法在空间分析中的应用,在模型实施部署运行时,通过融合气象自动站实况数据、地理信息静态大数据集,实现了与监测同频率的气象实况网格分析,解决气象实况数据网格化分析能力不足的问题。
38.下面结合附图和具体实施例对本发明作进一步描述。
附图说明
39.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
40.图1为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的应用场景示意图;
41.图2为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的流程示意图;
42.图3为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的子流程示意图;
43.图4为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的子流程示意图;
44.图5为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的子流程示意图;
45.图6为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的子流程示意图;
46.图7为本发明实施例提供的地理信息静态数据属性的示意图;
47.图8为本发明实施例提供的匹配最近5个站点气象观测数据的示意图;
48.图9为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析系统的示意性框图;
49.图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
50.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
51.应当理解,当在本说明书和所附权利要求书中使用时,术语

包括



包含

指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
52.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的





一个





意在包括复数形式。
53.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语

和/或

是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
54.请参阅图1和图2,图1为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的应用场景示意图。图2为本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的示意性流程图。该基于大数据和机器学习的复杂下垫面气象数据网格分析方法应用于服务器中。该服务器与气象站以及终端进行数据交互,分析模型基于随机森林算法,使用了地理信息静态大数据集(如地形高度、坡度、土地利用各类型占比等)作为影响因子,使得算法融入了局地属性对大气状况影响的物理机制,使用了多邻近观测为作为因子,使得算法实现了随机森林算法在空间分析中的应用。在模型实施部署运行时,通过融合气象自动站实况数据(温度、湿度、气压、风向、风速数据)、地理信息静态大数据集,实现了与监测同频率的气象实况网格分析,可为后续数据化城市管理提供基础。
55.图2是本发明实施例提供的基于大数据和机器学习的复杂下垫面气象数据网格分析方法的流程示意图。如图2所示,该方法包括以下步骤s110至s130。
56.s110、基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息。
57.在本实施例中,目标网格的地理信息静态数据属性是基于30米分辨率下垫面覆盖数据、数字高程模型和数字表面模型,采用分区统计方式获得的数据。
58.与所述目标网格的距离符合要求的若干个站点气象实况观测数据是指与目标网格的距离最近的若干个站点气象观测数据,在本实施例中,选择的是五个,当然,于其他实施例,可以根据实际情况选择不同数目的邻近站点气象实况观测数据。
59.站点气象实况观测数据包括温度、湿度、气压、2分钟风向风速等。
60.在一实施例中,请参阅图3,上述的步骤s110可包括步骤s111~s114。
61.s111、基于目标网格上每个网格点的经纬度,以分区统计的方式获得每个网格点地理信息静态数据属性。
62.s112、对站点实况报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控和时间一致性质控;
63.s113、利用质控后的站点气象观测,基于目标网格上每个网格点的经纬度分别获取与每个网格点的距离符合要求的若干个站点气象观测实况数据和对应空间距离;
64.s114、利用质控后的站点气象观测获取实况报文观测时间,以得到观测时间信息。
65.在本实施例中,请参阅图7,利用目标网格点经纬度结合地理信息静态数据,以分区统计的方式获得每个网格点地理信息静态数据属性。地理信息静态数据包括:耕地、林地、草地、灌木、湿地、水体、建筑用地所占百分比,平均地形高度、内地形高度方差、坡度坡向共计11个。方法与站点地理信息静态数据匹配相似,求解网格点的距离符合要求的若干个站点气象观测数据和对应空间距离为计算方法与站点相似,如图8所示。
66.s120、将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果。
67.在本实施例中,分析结果是指目标网格的每个网格点的气象观测数据,形成平面分布图。
68.具体地,模型输入:网格点经纬度、观测时间、该网格点地理信息静态数据属性共11个,距离该网格点最近5个气象观测站点气象要素实况观测数据和相距距离。气象要素实况观测数据为温度、湿度、气压、2分钟风向风速中的一种。模型输出:该网格点气象观测数据。
69.其中,所述气象观测数据网格分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的。
70.在一实施例中,请参阅图4,所述气象观测数据网格分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的,包括步骤s121~s123。
71.s121、获取站点历史气象观测报文和地理信息静态数据,并搭建样本集。
72.在本实施例中,样本集是指每个站点的地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间以及质控后的站点气象观测数据。
73.具体地,站点历史气象观测报文数据来源为30.5
°
n-32.1
°
n,120.5
°
e-122.5
°
e气象自动站数据。时间范围从2018年1月1日-2022年12月31日,1小时更新频次,站点数741个。其中各个站点的历史数据报文具体包括自动站名称、自动站经纬度高度坐标、观测时间、自动站要素数等字段。
74.地理信息静态数据属性是基于30米分辨率下垫面覆盖数据、数字高程模型和数字表面模型,采用分区统计方式获得的数据。。
75.气象观测数据网格分析模型训练集包含模型输入和模型目标。模型输入:气象观测站点经纬度、观测时间、该气象观测站点地理信息静态数据属性共11个,该气象观测站点最近5个气象观测站点气象要素观测数据和相距距离。模型目标:该站点气象观测。
76.在一实施例中,请参阅图5,上述的步骤s121可包括步骤s1211~s1214。
77.s1211、获取站点历史报文,并通过站点历史报文获取每个站点经纬度。
78.在本实施例中,站点历史报文包括了温度、雨量、风向、风速、2分钟风向、两分钟风速、极大风向、极大风速等内容。
79.s1212、利用每个站点经纬度结合对应的地理信息静态数据,以分区统计的方式获得每个站点的地理信息静态数据属性。
80.在本实施例中,地理信息静态数据包括:耕地、林地、草地、灌木、湿地、水体、建筑用地所占百分比,平均地形高度、内地形高度方差、坡度坡向共计11个。
81.具体地,以站点经纬度为中心,以目标网格空间分辨率长度为边绘制正方形。基于高分辨率遥感影像采用随机森林机器学习模型获得的30米分辨率下垫面覆盖数据、数字高程模型和数字表面模型,计算绘制正方形内各个土地分类占比,其中下垫面覆盖数据为标称属性形式,原有21类土地类型,在计算过程中经过整合变为7类:耕地、林地、草地、灌木、湿地、水体、建筑用地。土地类型占比=正方形内这一分类的面积/正方形总面积。同样,基于高程数据和数字表面模型,计算获得网格地形平均高度、网格内地形高度方差、坡度坡向。
82.在本实施例中,如图7所示,基于站点经纬度、匹配站点地理信息静态数据属性。基于目标网格,匹配站点地理信息静态数据属性。以站点/网格经纬度为中心,以1000米长度为边绘制正方形进行分区统计(zonal-statistic)。基于modis卫星获得的30米空间分辨率土地利用分类数据,计算绘制正方形内各个土地分类占比。原21类土地类型占比经过整合变为7类:耕地、林地、草地、灌木、湿地、水体、建筑用地。同样,基于高程数据,可获得网格平均地形高度、网格内地形高度方差、坡度坡向。
83.s1213、对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据。
84.在本实施例中,站点气象观测数据为气象站点观测的温度、湿度、气压、两分钟风向风速。质控为对站点气象观测数据进行极值质控和时间一致性质控。
85.具体地,对所述站点历史报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控以及时间一致性质控,以得到质控后的站点气象观测数据。
86.具体地,包括以下步骤:
87.步骤一:基于历史气候资料,以每月历史极值为阈值。超过上下限数据判定为错误数据。
88.具体地,针对不同观测要素,基于历史气候资料,以每月历史极值为阈值,超过上下限数据判定为错误数据,则属于极值质控;
89.在本实施例中,对温度、湿度、气压、2分钟风向风速作数据清洗,进行极值质控。针对不同观测要素,基于中国气象局发布的上海常用地面气候资料,以每月历史极值为阈值,超过上下限数据判定为错误数据。
90.步骤二:基于不同观测要素,设置突变阈值,连续两个时次差异超过阈值判定为错误数据。
91.在本实施例中,设置突变阈值,相邻2小时差异超过阈值判定为错误数据,将温度设置为10℃,气压设置为10hpa,湿度设置为20%。
92.步骤三:基于真实大气客观情况,连续超过3小时数据无变化判定为错误数据。
93.具体地,基于真实大气客观情况,连续超过n时次(n依据观测分辨率设置)数据无变化判定为错误数据,则属于时间一致性质控。
94.在本实施例中,基于真实大气客观情况,连续超过3个时次数据无变化判定为错误数据。
95.s1214、利用质控后的站点气象观测数据基于每个站点的经纬度获取与所述站点
距离符合要求的若干个站点气象观测数据和对应空间距离;利用质控后的站点气象观测数据获取报文观测时间。
96.在本实施例中,如图8所示,基于观测站点经纬度信息,匹配最近5个站点气象观测数据(不包含本站)。在匹配最近5个站点气象观测数据时,搜索范围为10公里正方形区域,获取欧式距离最近5点,不足5点则用已获取临近点二次补足。
97.具体地,基于欧式空间距离,寻找最近5个观测站观测数据。在匹配最近5个站点气象观测时,搜索范围为10公里正方形区域,不足5点则用已获取临近点二次补足。
98.当然,不一定是选择最近的5个站点气象观测数据,还可以根据实际情况确定具体的数值。
99.s122、采用随机森林算法搭建框架。
100.具体地,所述随机森林算法为基于装袋法的集成算法,在此基础上引入了地理信息静态大数据集作为因子,实现了局地属性对大气状况影响的物理机制;引入了多邻近观测作为因子,实现了随机森林算法在空间插值上的应用。
101.s123、利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型。
102.在一实施例中,请参阅图6,上述的步骤s123可包括步骤s1231~s1232。
103.s1231、将每个站点地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间为输入,所述站点气象观测为学习目标输入到随机森林算法所构建的框架内;
104.s1232、设置不纯度、损失函数参数,并对随机树数目、树的最大深度参数进行迭代测试,基于学习曲线确定框架的参数,以得到气象观测数据网格分析模型。
105.在本实施例中,框架是指利用随机森林算法构建所得的模型。
106.具体地,所述随机森林算法为基于装袋法的集成算法,在此基础上引入了地理信息静态大数据集作为因子,实现了局地属性对大气状况影响的物理机制;引入了多邻近观测作为因子,实现了随机森林算法在空间插值上的应用。
107.集成学习思想是为了解决单个模型或者某一组参数的模型所固有的缺陷,从而整合起更多的模型,取长补短,避免局限性。随机森林就是集成学习思想下的产物,将许多棵决策树整合成森林,并合起来用来预测最终结果。总体上,随机森林在当前所有算法中,具有极好的准确率;能够有效地运行在大数据集上;能够处理具有高维特征的输入样本,而且不需要降维;能够评估各个特征在分类问题上的重要性,可以很好的适用于准备的数据集。
108.在本实施例中,将每一站点地理信息静态数据属性、基于每一站点经纬度获取与该站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间为输入,该站点气象观测为学习目标;训练时按照温度、湿度、气压、风向、风速分类训练,即每个要素都为单独的模型和模型参数,最终得到一种综合考虑物理机制和数学机制的插值分析算法,即气象观测数据网格分析模型。
109.s130、输出所述分析结果至终端。
110.输出所述分析结果至终端,以供用户调取和查看。
111.上述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,通过基于随机森林算法,使用了地理信息静态大数据集作为影响因子构建分析模型,用于基于气象站
点观测的网格化分析,模型融入了局地属性对大气状况影响的物理机制,使用了多邻近观测为作为因子,实现随机森林算法在空间分析中的应用,在模型实施部署运行时,通过融合气象自动站数据、地理信息静态大数据集,实现了与监测同频率的气象实况网格分析,解决气象实况数据网格化分析能力不足的问题。
112.图9是本发明实施例提供的一种基于大数据和机器学习的复杂下垫面气象数据网格分析系统300的示意性框图。如图9所示,对应于以上基于大数据和机器学习的复杂下垫面气象数据网格分析方法,本发明还提供一种基于大数据和机器学习的复杂下垫面气象数据网格分析系统300。该基于大数据和机器学习的复杂下垫面气象数据网格分析系统300包括用于执行上述基于大数据和机器学习的复杂下垫面气象数据网格分析方法的单元,该装置可以被配置于服务器中。具体地,请参阅图9,该基于大数据和机器学习的复杂下垫面气象数据网格分析系统300包括获取单元301、分析单元302以及输出单元303。
113.获取单元301,用于基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;分析单元302,用于将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;输出单元303,用于输出所述分析结果至终端。
114.在一实施例中,基于大数据和机器学习的复杂下垫面气象数据网格分析系统300还包括:
115.模型生成单元,用于通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架,以得到气象观测数据网格分析模型。
116.在一实施例中,所述模型生成单元包括:样本集生成子单元、建模子单元以及训练子单元。
117.样本集生成子单元,用于获取站点历史气象观测报文和地理信息静态数据,并搭建样本集;建模子单元,用于采用随机森林算法搭建框架;训练子单元,用于利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型。
118.在一实施例中,所述样本集生成子单元包括数据获取模块、属性获取模块、质控模块以及确地模块。
119.数据获取模块,用于获取站点历史报文,并通过站点历史报文获取每个站点经纬度;属性获取模块,用于利用每个站点经纬度结合对应的地理信息静态数据,以分区统计的方式获得每个站点的地理信息静态数据属性;质控模块,用于对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据;确定模块,用于利用质控后的站点气象观测数据基于每个站点的经纬度获取与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离;利用质控后的站点气象观测数据获取报文观测时间。
120.在一实施例中,所述质控模块,用于对所述站点历史报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控以及时间一致性质控,以得到质控后的站点气象观测数据。
121.在一实施例中,所述训练子单元包括:输入模块以及参数确定模块。
122.输入模块,用于将每个站点地理信息静态数据属性、与所述站点距离符合要求的
若干个站点气象观测数据和对应空间距离、报文观测时间为输入,所述站点气象观测为学习目标输入到随机森林算法所构建的框架内;参数确定模块,用于设置不纯度、损失函数参数,并对随机树数目、树的最大深度参数进行迭代测试,基于学习曲线确定框架的参数,以得到气象观测数据网格分析模型。
123.在一实施例中,获取单元包括统计子单元、质控子单元、距离确定子单元以及距离确定子单元。
124.统计子单元,用于基于目标网格上每个网格点的经纬度,以分区统计的方式获得每个网格点地理信息静态数据属性;质控子单元,用于对站点实况报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控和时间一致性质控;距离确定子单元,用于利用质控后的站点气象实况观测,基于目标网格上每个网格点的经纬度分别获取与每个网格点的距离符合要求的若干个站点气象观测实况数据和对应空间距离;时间确定子单元,用于利用质控后的站点气象观测获取实况报文观测时间,以得到观测时间信息。
125.需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于大数据和机器学习的复杂下垫面气象数据网格分析系统300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
126.上述基于大数据和机器学习的复杂下垫面气象数据网格分析系统300可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
127.请参阅图10,图10是本技术实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
128.参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
129.该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种基于大数据和机器学习的复杂下垫面气象数据网格分析方法。
130.该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
131.该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种基于大数据和机器学习的复杂下垫面气象数据网格分析方法。
132.该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
133.其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
134.基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;将所述地理信息静态数据属性、若干个站点气象观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分
processing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
149.本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
150.因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
151.基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象观测数据和对应空间距离以及观测时间信息;将所述地理信息静态数据属性、若干个站点气象观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;输出所述分析结果至终端。
152.其中,所述气象观测数据网格分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的。
153.在一实施例中,所述处理器在执行所述计算机程序而实现所述分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的步骤时,具体实现如下步骤:
154.获取站点历史气象观测报文和地理信息静态数据,并搭建样本集;采用随机森林算法搭建框架;利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型。
155.在一实施例中,所述处理器在执行所述计算机程序而实现所述获取站点历史气象观测报文和地理信息静态数据,并搭建样本集步骤时,具体实现如下步骤:
156.获取站点历史报文,并通过站点历史报文获取每个站点经纬度;利用每个站点经纬度结合对应的地理信息静态数据,以分区统计的方式获得每个站点的地理信息静态数据属性;对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据;利用质控后的站点气象观测数据基于每个站点的经纬度获取与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离;利用质控后的站点气象观测数据获取报文观测时间;
157.其中,所述样本集包括每个站点的地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间以及质控后的站点气象观测数据。
158.在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据步骤时,具体实现如下步骤:
159.对所述站点历史报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极
值质控以及时间一致性质控,以得到质控后的站点气象观测数据。
160.在一实施例中,所述处理器在执行所述计算机程序而实现所述利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型步骤时,具体实现如下步骤:
161.将每个站点地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测实况数据和对应空间距离、报文观测时间为输入,所述站点气象观测为学习目标输入到随机森林算法所构建的框架内;设置不纯度、损失函数参数,并对随机树数目、树的最大深度参数进行迭代测试,基于学习曲线确定框架的参数,以得到气象观测数据网格分析模型。
162.在一实施例中,所述处理器在执行所述计算机程序而实现所述基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象观测数据和对应空间距离以及观测时间信息步骤时,具体实现如下步骤:
163.基于目标网格上每个网格点的经纬度,以分区统计的方式获得每个网格点地理信息静态数据属性;对站点实况报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控和时间一致性质控;利用质控后的站点气象观测,基于目标网格上每个网格点的经纬度分别获取与每个网格点的距离符合要求的若干个站点气象观测实况数据和对应空间距离;利用质控后的站点气象观测获取实况报文观测时间,以得到观测时间信息。
164.所述存储介质可以是u盘、移动硬盘、只读存储器(read-only memory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
165.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
166.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
167.本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
168.该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
169.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

技术特征:
1.基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,包括:基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;输出所述分析结果至终端。2.根据权利要求1所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述气象观测数据网格分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的。3.根据权利要求2所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述分析模型是通过站点历史气象观测报文和地理信息静态数据构建样本集,以训练基于随机森林算法搭建的框架所得的,包括:获取站点历史气象观测报文和地理信息静态数据,并搭建样本集;采用随机森林算法搭建框架;利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气象观测数据网格分析模型。4.根据权利要求3所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述获取站点历史气象观测报文和地理信息静态数据,并搭建样本集,包括:获取站点历史报文,并通过站点历史报文获取每个站点经纬度;利用每个站点经纬度结合对应的地理信息静态数据,以分区统计的方式获得每个站点的地理信息静态数据属性;对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据;利用质控后的站点气象观测数据基于每个站点的经纬度获取与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离;利用质控后的站点气象观测数据获取报文观测时间;其中,所述样本集包括每个站点的地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间以及质控后的站点气象观测数据。5.根据权利要求4所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述对所述站点历史报文进行极值和时间一致性质控,以得到质控后的站点气象观测数据,包括:对所述站点历史报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控以及时间一致性质控,以得到质控后的站点气象观测数据。6.根据权利要求4所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述利用所述样本集对对随机森林算法所构建的框架进行训练,以得到气
象观测数据网格分析模型,包括:将每个站点地理信息静态数据属性、与所述站点距离符合要求的若干个站点气象观测数据和对应空间距离、报文观测时间为输入,所述站点气象观测为学习目标输入到随机森林算法所构建的框架内;设置不纯度、损失函数参数,并对随机树数目、树的最大深度参数进行迭代测试,基于学习曲线确定框架的参数,以得到气象观测数据网格分析模型。7.根据权利要求1所述的基于大数据和机器学习的复杂下垫面气象数据网格分析方法,其特征在于,所述基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息,包括:基于目标网格上每个网格点的经纬度,以分区统计的方式获得每个网格点地理信息静态数据属性;对站点实况报文中的温度、湿度、气压、两分钟风向风速作数据清洗,进行极值质控和时间一致性质控;利用质控后的站点气象观测,基于目标网格上每个网格点的经纬度分别获取与每个网格点的距离符合要求的若干个站点气象观测实况数据和对应空间距离;利用质控后的站点气象观测获取实况报文观测时间,以得到观测时间信息。8.基于大数据和机器学习的复杂下垫面气象数据网格分析系统,其特征在于,包括:获取单元,用于基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;分析单元,用于将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;输出单元,用于输出所述分析结果至终端。9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至7中任一项所述的方法。

技术总结
本发明实施例公开了基于大数据和机器学习的复杂下垫面气象数据网格分析方法与系统。所述方法包括:基于目标网格上每个网格点的经纬度,获取每个网格点的地理信息静态数据属性、与所述网格点的距离符合要求的若干个站点气象实况观测数据和对应空间距离以及观测时间信息;将所述地理信息静态数据属性、若干个站点气象实况观测数据和对应空间距离以及观测时间信息输入至气象观测数据网格分析模型中进行目标网格的气象观测数据的分析,以得到分析结果;输出所述分析结果至终端。通过实施本发明实施例的方法可解决气象实况数据网格化分析能力不足的问题。化分析能力不足的问题。化分析能力不足的问题。


技术研发人员:张赟程 王晓峰 麻炳欣 高彦青
受保护的技术使用者:王晓峰 上海市生态气象和卫星遥感中心
技术研发日:2023.03.07
技术公布日:2023/7/22
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐