基于社交媒体的台风定位方法
未命名
10-09
阅读:105
评论:0
1.本发明属于人工智能领域,特别涉及一种台风定位方法,可用于对自然灾害的防御。
背景技术:
2.自然灾害的频繁发生,对人们的生命财产安全造成了威胁,导致大量的人员伤亡和财产损失,台风定位逐渐成为特征工程和深度学习技术的研究热点。随着互联网的发展,社交媒体成为了一个信息共享的重要平台。在这个平台上,用户不断发布内容和分享地理信息,这种自愿的地理信息vgi为灾害管理等复杂问题的解决提供了新的信息源。所以如何从海量的社交媒体数据中准确、高效地提取和整合有价值的信息,特别是与台风相关的时空信息,实现利用社交媒体数据进行台风定位是亟待解决的问题。
3.现有利用社交媒体数据进行台风定位的方法,是先对社交媒体文本数据进行多个维度进行探索,再通过对包括情感分析、危机检测、实时消息、实体抽取,发送数量等特征进行抽取,并将特征量化后采用深度学习算法来进行轨迹定位预测。但这类方法在抽取特征时由于忽略很多抽象语义特征,未能捕捉数据的全局时空相关性,无法准确预测台风中心位置。
4.resch b,f,havas c.combining machine-learning topic models and spatiotemporal analysis of social media data for disaster footprint and damage assessment.cartography and geographic information science,2018,45(4):362-376中提出一种基于社交媒体数据进行灾害轨迹预测的主题机器学习和时空分析方法。其通过创建一个由多个网格单元组成的规则网格,可将所有与灾害相关的社交媒体数据例如每个区域的总发送量,总结在相应的网格单元中。每个网格单元大小为1公里
×
1公里,根据每个网格中的数据,先抽取社交媒体数据的发送量将其转换为人口数量,再采用一种空间数据分析算法方法进行热点分析,以研究灾害轨迹和其造成损害的局部空间自相关性,从而确定灾害的轨迹。但该方法存在以下两方面的不足:
5.一是由于其通常使用文本抽取的中间特征如发送数量和情感指数,忽略了文本的本身时空信息和丰富的语义特征,故导致提取的特征不够准确和全面,无法实现高粒度的事件位置预测;
6.二是由于其未能充分利用社交媒体数据的全局时空相关性,缺乏有效的机制来捕捉数据之间的时空关系,因而限制了定位模型对于时空相关性的捕捉和预测能力。
技术实现要素:
7.本发明的目的在于针对已有方法的不足,提出一种基于社交媒体的台风定位方法,以通过时空网格编码和语义特征的时空重构,提高社交媒体数据的特征提取准确性,通过构建卷积神经网络模型捕获数据,提高全局时空相关性的捕捉和预测能力。
8.为实现上述目的,本发明的技术方案包括如下步骤:
9.(1)从社交媒体平台获取台风期间受台风影响区域中,带有时空信息的社交媒体文本数据集s;
10.(2)从气象局公开平台获取台风生成期间的实时轨迹数据集track;
11.(3)根据社交媒体数据的时空信息,按照时空网格编码方法将原始社交媒体文本数据集s转化为时空编码数据集sc:
12.sc={(t1,(x1,y1),tc1),
…
,(ti,(xi,yi),tci),
…
,(tn,(xn,yn),tcn)}
13.其中ti是文本数据,(xi,yi)表示每条数据的空间网格编码其中0≤xi≤3,0≤yi≤3,tci表示时间编码的结果;
14.(4)根据台风轨迹数据集track进行时间编码,得到时间编码的台风轨迹数据集trackc:
15.trackc={(la1,ln1,tc1),...,(lai,lni,tci),...,(lam,lnm,tcm)}
16.其中tci是时间编码值,tcm是最后一个时间编码值;
17.(5)利用bert语言模型提取时空编码数据sc中每条数据的文本ti的十六维语义特征,得到语义特征数据集w:
[0018][0019]
其中,其中,表示对文本ti提取的语义特征的第j维;
[0020]
(6)根据语义特征数据集w,对同一时空编码的文本语义特征求和与特征空间重构,得到重构语义特征数据集c:
[0021]
c={w0,..w
tc
,...,w
l
}
[0022]
其中表示tc时间编码下的空间重构语义特征,l是时间编码tc的最大值,表示在时间编码tc,空间编码(x,y)的重构语义特征,由语义特征数据集w中将同一时空编码下的所有语义特征求和后重构为4x4矩阵大小;
[0023]
(7)根据时空编码的方法,计算同一个时间编码下每一个空间网格中心到台风中心的距离数据集:
[0024]
d={d0,
…
,d
tc
,
…
,d
l
}
[0025]
其中表示在时间编码tc下所有时空网格中心到台风中心的距离,表示在时间编码为tc、空间编码为(x,y)所表示区域的中心到台风中心的距离;
[0026]
(8)构建由五层三维卷积层和两层卷积-长短期记忆人工神经层交叉连接构成的卷积神经网络模型g,并以均方根误差rmse函数作为该网络的损失函数;
[0027]
(9)将数据集c作为特征数据,数据集d作为真实值,并将重构语义特征数据集c和
台风中心距离数据集d组合成台风距离语义数据集b,再将该数据集b按3∶7划分为训练集train和测试集test;
[0028]
(10)将训练集train的特征数据输入到卷积神经网络g,通过反向传播法对其进行迭代训练,直到损失函数收敛,得到训练好的卷积神经网络模型网络;
[0029]
(11)将测试集test中的特征数据输入到训练好的卷积神经网络,得到对于每个时空网格中心到台风中心的距离预测值
[0030][0031]
其中表示时空编码为[tc,(x,y)]所表示空间中心距离台风中心的预测值;
[0032]
(12)根据每个时空网格中心到台风中心的距离预测值使用基于位置服务的时空网格定位算法对台风进行定位,确定预测的台风中心的纬度和经度位置。
[0033]
本发明与现有发明比较,优点如下:
[0034]
第一,本发明通过时空网格编码的方法将数据集s进行编码和语义特征的时空重构得到重构语义特征数据集c,可充分利用数据集的抽象语义特征,更大程度提取台风轨迹相关的数据特征,解决了现有技术在特征抽取时因忽略抽象语义特征而导致数据缺失的问题。
[0035]
第二,本发明构建了由三维卷积和卷积-长短期记忆人工神经层交叉相连的卷积神经网络g,并利用该卷积神经网络g预测时空网格中心到台风中心的距离,能够更好捕获数据特征的全局时空相关性,提高定位的精度,解决了现有技术因对数据的时空关系捕获能力差而导致定位不准确的问题。
附图说明
[0036]
图1是本发明的实现流程图;
[0037]
图2是本发明中进行台风定位的示意图;
[0038]
图3是本发明仿真实验结果示意图。
具体实施方式:
[0039]
下面结合附图对本发明进行详细说明:
[0040]
本实例所述基于社交媒体的台风定位方法,可以在台风来临期间,利用社交媒体数据来对台风中心位置进行预测。下面我们以2012年桑迪台风为例,介绍如何使用基于社交媒体的台风定位方法。
[0041]
参照图1,本实例的具体实现步骤如下:
[0042]
步骤1:获取带有时空信息的社交媒体数据。
[0043]
从社交平台twitter中获取桑迪台风期间的带有时间戳和gps信息的文本社交媒体数据集:
[0044]
s={(t1,la1,ln1,tc1),(t2,la2,ln2,tc2),...,(tn,lan,lnn,tcn)}},
[0045]
其中,ti表示文本数据,是受台风影响区域用户发布社交媒体数据与台风相关的文本数据;
[0046]
lai表示经度和lni表示纬度,是受台风影响区域用户发布社交媒体数据的gps数据,是其纬度范围为[40.5
°
n,41
°
n],经度范围为[-74
°
w,-73.5
°
w];其中n是纬度单位南纬,w是经度单位西经。
[0047]
tci表示时间戳,是受台风影响区域用户发布社交媒体数据的时间,其时间区间在飓风生成到飓风结束之间,即2012年10月22日15点到2012年10月29日21点;
[0048]
n表示数据集s的数量,是台风生成到结束时间内受影响区域用户发布的所有与台风有关的社交媒体的数量。
[0049]
步骤2:获取台风实时轨迹数据集。
[0050]
从气象局公开平台获取台风生成期间的实时轨迹数据集track,表示如下:
[0051]
track={(la1,ln1,t1),...,(lai,lni,ti),...,(lam,lnm,tm)}
[0052]
其中lai,lni表示在ti时刻台风中心的经度和纬度信息,ti表示时间戳,其值为台风的生成时间从2012年10月22日15点到2012年10月29日21点结束,每个值ti和t
i+1
的间隔为30s,因此台风轨迹数据集track的长度m为20880。
[0053]
步骤3:对社交媒体数据集进行时空编码。
[0054]
该步骤是根据时间戳t和gps信息lai和lni表示纬度分别对数据进行时空编码,实现如下:
[0055]
(3.1)以台风起始时间为时间编码的起始时间,将数据集s的时间戳t转为秒数表示后,按照30秒为时间间隔进行划分,得到每条数据的时间编码tc:
[0056][0057]
其中1350889200是本实例以2012年10月22日15点是台风起始时间在计算机中的秒数值;
[0058]
(3.2)依据数据集s的经纬度数据lai和lni,以数据集s所表示的空间其纬度区间为[40.5
°
n,41
°
n],经度区间为[-74
°
w,-73.5
°
w],将其划分为4x4的空间网格,其中每个网格的高度宽度为
[0059]
(3.3)将数据集s的每条数据的经纬度信息lni和lai划分到对应的网格,得到空间编码(xi,yi):
[0060][0061]
(3.4)将数据集s中每条数据进行空间编码和时间编码,得到数据集s中每条数据的空间编码(xi,yi)和时间编码tci,将其和每一条数据的文本数据ti组合起来构成时空编码数据集sc:
[0062]
sc={(t1,(x1,y1),tc1),
…
,(ti,(xi,yi),tci),
…
,(tn,(xn,yn),tcn)}。
[0063]
步骤4:对台风轨迹数据集进行时间编码。
[0064]
该步骤根据时间戳t对数据进行时空编码,实现如下:
[0065]
(4.1)根据台风轨迹数据集track的时间戳t对数据以台风起始时间2012年10月22日15点为时间编码的起始时间,将数据集track的时间戳t转为秒数表示后,按照30秒为时
间间隔进行划分,得到台风轨迹数据集track中每条数据的时间编码tc:
[0066][0067]
其中1350889200是本实例以2012年10月22日15点是台风起始时间在计算机中的秒数值;
[0068]
(4.2)将数据集track中每条数据进行空间编码和时间编码,得到每条数据的时间编码tci,将其和条数据的台风中心的经度和纬度信息组合起来构成时间编码的台风轨迹数据集trackc:
[0069]
trackc={(la1,ln1,tc1),...,(lai,lni,tci),...,(lam,lnm,tcm)}。
[0070]
步骤5:利用bert模型提取文本数据的语义特征。
[0071]
该步骤将提取时空编码数据集sc中文本数据的语义特征,实现如下:
[0072]
(5.1)利用现有已预训练完成的bert模型对时空编码数据中的文本进行分词和编码并提取得到768维度的语义特征
[0073]
(5.2)利用主成分分析法将语义特征降低到16维度的语义特征
[0074][0075]
例如,将时空编码数据集sc中的一个文本数据“people that hate rainy weat her obviously don’t have rear-drive cars”利用bert模型提取和降维后得到16维度输出[0.27990687,-0.2208395,0.3265599,0.1997981,0.17458375,-1.1405083,0.39390883,0.01827345,-0.26899743,-0.60412407,0.12131958,0.5419242,-0.2532862,-0.2393016,-0.11166136,0.3595541];
[0076]
(5.3)对时空编码数据集sc中每条数据的文本ti执行步骤(5.1)和步骤(5.2),得到语义特征数据集w:
[0077][0078]
其中,其中,表示对文本ti提取的语义特征的第j维。
[0079]
步骤6:根据时空编码对语义特征进行重构。
[0080]
该步骤将根据语义特征数据集w,对同一时空编码的文本语义特征进行空间重构,实现如下:
[0081]
(6.1)将数据集w中相同时空编码[tc,(x,y)]的所有语义特征(6.1)将数据集w中相同时空编码[tc,(x,y)]的所有语义特征的每个维度累加求和,得到时空编码为[tc,(x,y)]整体语义特征
[0082][0083]
其中,表示的第j维数据,k为时空编码为[tc,(x,y)]的文本语义特征数量;
[0084]
(6.2)将(6.1)中得到的同一时空编码[tc,(x,y)]的整体语义特征按照重构为4x4的空间重构语义特征
[0085][0086]
(6.3)将时间编码tc相同的空间重构语义特征按照空间编码划分4*4网格的顺序,对再次进行重构,得到重构语义特征w
tc
:
[0087][0088]
(6.4)将语义特征数据集w中所有同一时间编码文本语义特征按照步骤(6.1)-(6.3)进行求和与两次重构,得到重构语义特征数据集c:
[0089]
c={w0,..w
tc
,
…
,w
l
}。
[0090]
步骤7:根据时空编码计算每个网格中心到台风中心的距离。
[0091]
该步骤根据时空编码计算每个网格中心到台风中心的距离,实现如下:
[0092]
(7.1)计算在时间编码为tc、空间编码为(i,j)所表示区域的中心到该时间编码下台风中心的距离
[0093][0094]
其中la
tc
,ln
tc
表示时空编码tc时刻的台风中心的经度和纬度,表示空间编码(x,y)所并表示区域中心的经度和纬度;
[0095]
(7.2)对所有时间编码为tc的网格按步骤(7.1)计算网格中心到台风中心的距离并将组合成矩阵d
tc
:
[0096][0097]
(7.3)计算每一个时间编码,得到网格中心到台风中心的距离数据集d:
[0098]
d={d0,
…
,d
tc
,
…
,d
l
}
[0099]
其中l表示最后一个时间编码,在本实例中l的值为20879。
[0100]
步骤8:构建卷积神经网络模型g。
[0101]
(8.1)设置五层三维卷积层的参数:
[0102]
第一层三维卷积层a,包含32个卷积核,卷积核大小为3x16x16;
[0103]
第二层三维卷积层b,包含16个卷积核,卷积核大小为3x8x8;
[0104]
第三层三维卷积层c,包含8个卷积核,卷积核大小为3x4x4;
[0105]
第四层三维卷积层d,包含8个卷积核,卷积核大小为3x4x4;
[0106]
第五层三维卷积层e,包含1个卷积核,卷积核大小为3x4x4;
[0107]
(8.2)设置两层卷积-长短期记忆人工神经层的参数:
[0108]
第一层卷积-长短期记忆人工神经层f,包含16个卷积核,卷积核大小为16x16;
[0109]
第二层卷积-长短期记忆人工神经层g,包含16个卷积核,卷积核大小为4x4;
[0110]
(8.3)将五层三维卷积层和两层卷积-长短期记忆人工神经层,按顺序a、b、c、f、d、g、e交叉连接构成卷积神经网络模型g;
[0111]
(8.4)选用修正线性单元relu作为卷积神经网络g的激活函数,并采用平方根均方误差rmse作为该网络的损失函数
[0112]
relu(x)=max(0,x)
[0113][0114]
步骤9:组合台风距离语义数据集b,并划分为训练集和测试集。
[0115]
将数据集c作为特征数据,将数据集d作为真实值,并将重构语义特征数据集c和台风中心距离数据集d组合成台风距离语义数据集b;
[0116]
再将数据集b按3:7划分为训练集train和测试集test。
[0117]
步骤10:训练卷积神经网络g。
[0118]
(10.1)随机初始化卷积神经网络的参数,同时在本实例中初始学习率为0.0001,损失函数收敛阈值为0.001;
[0119]
(10.2)将训练集train的特征数据输入卷积神经网络g的输入层,通过网络的卷积层、激活函数进行前向传播,得到预测结果,再将预测结果与训练集train的真实值进行比较,计算卷积神经网络的损失函数;
[0120]
(10.3)通过反向传播算法,计算损失函数对网络参数的梯度,并将计算得到的梯度与学习率相乘,以对网络参数进行更新,并使用adam优化器,根据梯度的一阶矩估计和二阶矩估计来自适应地调整学习率,同时利用动量技巧来加速优化过程;
[0121]
(10.4)重复步骤(10.2)到步骤(10.3)不断迭代,直到损失函数收敛,得到训练好的卷积神经网络g。
[0122]
步骤11:预测每个时空网格到台风中心的距离。
[0123]
将测试集test中的特征数据输入到训练好的卷积神经网络,得到对于每个时空网格中心到台风中心的距离预测值
[0124][0125]
其中表示时空编码为[tc,(x,y)]所表示空间中心距离台风中心的预测值。
[0126]
本实例中时间戳为2012年10月25日18时,时间编码为9000的空间网格,通过神经卷积网络预测获得的每个网格中心到台风中心距离r
9000
:
[0127][0128]
步骤12:确定台风中心的经度和纬度。
[0129]
本步骤是根据每个时空网格中心到台风中心的距离预测值使用基于位置服务的时空网格定位算法对台风进行定位,实现如下:
[0130]
(12.2)以每个时空网格的中心为圆心,按卷积神经网络输出的距离预测值为半径画圆,得到所有圆的交点数据集e,如图2中以网格中心b
1,1
、b
1,2
、b
1,4
和b
2,4
为圆心做圆,每个圆的交点为图中黑色圆点;
[0131]
(12.2)利用k-means聚类算法找出数据集e中交点数最多的簇:
[0132]
将数据集e中的交点分为k个交点簇,通过统计每个簇中的交点数量,找到交点数最多的簇;
[0133]
将交点数最多的簇的质心作为时间编码tc时刻的台风中心。
[0134]
在本实例中,将图2中黑色圆点利用聚类方法分析得到最大簇,即黑色虚线框所包含的交点,则该簇的质心为预测的台风中心位置,即图2中黑色三角形的位置。
[0135]
本发明的效果可通过以下仿真实验进一步说明:
[0136]
一,仿真实验条件:
[0137]
本实验使用的操作系统ubuntu16.04,深度学习框架为pytorch1.0.1,硬件条件为cpu为八核intel xeon e5-2630 v4,内存32g,gpu为nvidia tesla p100,显存16g;
[0138]
实验数据为来自2012年美国桑迪台风期间受台风影响区域用户发布台风相关社交媒体数据和2012年美国桑迪台风轨迹数据。
[0139]
二,仿真实验内容与结果:
[0140]
在上述仿真实验条件下用本发明进行台风中心轨迹预测,结果如图3,其中实折线为真实的台风中心移动轨迹,虚折线为本发明仿真实验预测台风中心轨迹。
[0141]
从图3可以看出,本发明预测的台风轨迹路线和真实台风轨迹路线趋势一致,轨迹大致吻合,同时能在真实台风中心位置移动方向发生变化时刻,预测的台风轨迹的移动方向也同样做出改变。当台风中心位置距离受影响区域远时,台风轨迹的预测效果较差。当飓风中心举行受影响区域更近时预测效果更好,这是因为用户可以更强烈地感受到灾难的影响,因此可以在语义特征中捕捉到更多人对台风的直观反应。
[0142]
同时从图3还可看出,在轨迹的拐点处预测轨迹和真实轨迹最接近,但之后预测轨迹和真实轨迹之间距离增加,这是因为在拐点处台风的轨迹发生了明显的方向变化,模型在这个时刻需要调整台风轨迹预测的方向,会引起距离增加,但调整之后误差距离会逐渐减小。
技术特征:
1.一种基于社交媒体数据的台风定位方法,其特征在于,包括如下步骤:(1)从社交媒体平台获取台风期间受台风影响区域中,带有时空信息的社交媒体文本数据集s;(2)从气象局公开平台获取台风生成期间的实时轨迹数据集track;(3)根据社交媒体数据的时空信息,按照时空网格编码方法将原始社交媒体文本数据集s转化为时空编码数据集s
c
:s
c
={(t1,(x1,y1),tc1),...,(t
i
,(x
i
,y
i
),tc
i
),...,(t
n
,(x
n
,y
n
),tc
n
)}其中t
i
是文本数据,(x
i
,y
i
)表示每条数据的空间网格编码其中0≤x
i
≤3,0≤y
i
≤3,tc
i
表示时间编码的结果;(4)根据台风轨迹数据集track进行时间编码,得到时间编码的台风轨迹数据集track
c
:track
c
={(la1,ln1,tc1),...,(la
i
,ln
i
,tc
i
),...,(la
m
,ln
m
,tc
m
)}其中tc
i
是时间编码值,tc
m
是最后一个时间编码值;(5)利用bert语言模型提取时空编码数据s
c
中每条数据的文本t
i
的十六维语义特征,得到语义特征数据集w:其中,其中,表示对文本t
i
提取的语义特征的第j维;(6)根据语义特征数据集w,对同一时空编码的文本语义特征求和与特征空间重构,得到重构语义特征数据集c:c={w0,..w
tc
,...,w
l
}其中表示tc时间编码下的空间重构语义特征,l是时间编码tc的最大值,表示在时间编码tc,空间编码(x,y)的重构语义特征,由语义特征数据集w中将同一时空编码下的所有语义特征求和后重构为4x4矩阵大小;(7)根据时空编码的方法,计算同一个时间编码下每一个空间网格中心到台风中心的距离数据集:d={d0,...,d
tc
,...,d
l
}其中表示在时间编码tc下所有时空网格中心到台风中心的距离,表示在时间编码为tc、空间编码为(x,y)所表示区域的中心到台风中心的距离;(8)构建由五层三维卷积层和两层卷积-长短期记忆人工神经层交叉连接构成的卷积神经网络模型g,并以均方根误差rmse函数作为该网络的损失函数;(9)将数据集c作为特征数据,数据集d作为真实值,并将重构语义特征数据集c和台风
中心距离数据集d组合成台风距离语义数据集b,再将该数据集b按3∶7划分为训练集train和测试集test;(10)将训练集train的特征数据输入到卷积神经网络g,通过反向传播法对其进行迭代训练,直到损失函数收敛,得到训练好的卷积神经网络模型网络;(11)将测试集test中的特征数据输入到训练好的卷积神经网络,得到对于每个时空网格中心到台风中心的距离预测值格中心到台风中心的距离预测值其中表示时空编码为[t,(x,y)]所表示空间中心距离台风中心的预测值;(12)根据每个时空网格中心到台风中心的距离预测值使用基于位置服务的时空网格定位算法对台风进行定位,确定预测的台风中心的纬度和经度位置。2.根据权利要求1所述的方法,其特征在于,步骤(1)获取的社交媒体文本数据集s,表示如下:s={(t1,la1,ln1,t1),...,(t
i
,la
i
,ln
i
,t
i
),...,(t
n
,la
n
,ln
n
,t
n
)}其中t
i
表示文本数据,la
i
表示经度,ln
i
表示纬度信息,t
i
表示社交媒体信息发出的时间戳,n表示数据集的长度。3.根据权利要求1所述的方法,其特征在于,步骤(2)从气象局公开平台获取台风生成期间的实时轨迹数据集track,表示如下:track={(la1,ln1,t1),...,(la
i
,ln
i
,t
i
),...,(la
m
,ln
m
,t
m
)}其中t
i
表示时间戳,la
i
,ln
i
表示在t
i
时刻台风中心的经度和纬度信息,m表示台风轨迹数据集的长度。4.根据权利要求1所述的方法,其特征在于,步骤(3)中按照时空网格编码方法将原始社交媒体文本数据集s转化为时空编码数据集s
c
,实现如下:(3a)依据数据集s的时间戳t按照30秒为时间间隔进行划分,得到时间编码tc:其中t
min
表示数据集s中的起始时间戳;(3b)依据数据集s的经纬度数据,将数据集s中所表示空间范围划分为4*4的空间网格,并将数据集s的经纬度划分到对应的网格,得到空间编码(x,y):其中表示网格的宽度,表示网格的高度,tweet
lat-max
和tweet
lat-min
表示数据集s中纬度的最大和最小值,tweet
long-max
和tweet
long-min
表示数据集s中经度的最大和最小值。(3c)将数据集s中每条数据进行空间编码和时间编码,得到每一条数据的空间编码(x
i
,y
i
)和时间编码tc
i
,将其和每一条数据的文本数据t
i
组合起来构成时空编码数据集s
c
:
s
c
={(t1,(x1,y1),tc1),...,(t
i
,(x
i
,y
i
),tc
i
),...,(t
n
,(x
n
,y
n
),tc
n
)}。5.根据权利要求1所述的方法,其特征在于,步骤(6)中将语义特征数据集w中相同时空编码[tc,(x,y)]的所有语义特征求和后重构为4x4矩阵,得到重构语义特征w
tc
,实现如下:(6a)将数据集w中相同时空编码[tc,(x,y)]的所有语义特征进行和得到整体语义特征特征其中表示时空编码为[tc,(x,y)]的第i条数据的文本语义特征表示时空编码为[tc,(x,y)]的第i条数据的文本语义特征表示时空编码为[tc,(x,y)]的第i条数据的文本语义特征表示的第j维数据,k为时空编码为[tc,(x,y)]的文本语义特征数量。(6b)将所有时间编码为tc的整体语义特征按照重构为4x4的空间重构语义特征按照重构为4x4的空间重构语义特征6.根据权利要求1所述的方法,其特征在于,步骤(6)中计算每个时空网格中心距离台风中心的距离公式如下:其中la
tc
,ln
tc
表示tc时刻的台风中心的经度和纬度,表示空间编码(x,y)所并表示区域中心的经度和纬度。7.根据权利要求1所述的方法,其特征在于,步骤(8)中构成卷积神经网络模型g,中的五层三维卷积层和两层卷积-长短期记忆人工神经层的结构参数如下:第一层三维卷积层a,包含32个卷积核,卷积核大小为3x16x16;第二层三维卷积层b,包含16个卷积核,卷积核大小为3x8x8;第三层三维卷积层c,包含8个卷积核,卷积核大小为3x4x4;第四层三维卷积层d,包含8个卷积核,卷积核大小为3x4x4;第五层三维卷积层e,包含1个卷积核,卷积核大小为3x4x4;第一层卷积-长短期记忆人工神经层f,包含16个卷积核,卷积核大小为16x16;第二层卷积-长短期记忆人工神经层g,包含16个卷积核,卷积核大小为4x4;上述五层三维卷积层和两层卷积-长短期记忆人工神经层按顺序a、b、c、f、d、g、e相连。8.根据权利要求1所述的方法,其特征在于,步骤(8)中设置卷积神经网络模型g的损失函数,表示如下:
其中d
tc
为数据集d中时间编码为tc的距离,r
tc
为模型输出的预测值。9.根据权利要求1所述的方法,其特征在于,步骤(10)中对卷积神经网络模型g进行迭代训练,实现如下:(10a)将训练集train的特征数据输入网络,进行前向传播计算预测结果,并根据预测结果与训练集train的真实值的差异计算损失函数;(10b)使用反向传播算法计算损失函数对网络参数的梯度,利用该梯度和学习率相乘得到的结果来更新网络参数,并使用adam优化算法自适应调整学习率;(10c)重复10a到10b,不断进行前向传播,反向传播和参数更新的迭代过程,直到损失函数收敛,停止迭代得到训练好的卷积神经网络g。10.根据权利要求1所述的方法,其特征在于,步骤(12)中根据每个时空网格中心到台风中心的距离预测值使用基于位置服务的时空网格定位算法对台风进行定位,实现如下:(12a)以每个时空网格的中心为圆心,按卷积神经网络输出的距离预测值为半径画圆,得到所有圆交点的数据集e;(12b)利用k-means聚类算法找出数据集e中交点数最多的簇,该簇质心的经纬度就是时间编码tc时刻,台风中心的经纬度。
技术总结
本发明公开了一种基于社交媒体数据的台风定位方法,主要解决现有技术在处理海量、复杂的社交媒体数据时,台风定位准确性低的问题。其实现方案为:获取社交媒体数据中的时空信息,并将其编码为时空编码数据集;利用BERT模型提取时空编码数据集的文本语义特征,根据时空编码对语义特征进行语义和空间重构,得到重构语义特征数据集;构建基于三维卷积层和卷积-长短期记忆人工神经层的卷积神经网络,利用重构语义特征数据集预测每个网格中心到台风中心的距离;通过基于位置服务的时空网格定位算法,利用卷积神经网络的预测结果确定台风中心的纬度和经度位置。本发明通过对社交媒体数据特征重构提高了对台风的定位的准确度,可用于对自然灾害的防御。用于对自然灾害的防御。用于对自然灾害的防御。
技术研发人员:王静 温嘉伟 赵辉 杨烁 姚勇
受保护的技术使用者:西安电子科技大学
技术研发日:2023.06.14
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
