【技术实现步骤摘要】
基于社交媒体的台风定位方法
[0001]本专利技术属于人工智能领域,特别涉及一种台风定位方法,可用于对自然灾害的防御。
技术介绍
[0002]自然灾害的频繁发生,对人们的生命财产安全造成了威胁,导致大量的人员伤亡和财产损失,台风定位逐渐成为特征工程和深度学习技术的研究热点。随着互联网的发展,社交媒体成为了一个信息共享的重要平台。在这个平台上,用户不断发布内容和分享地理信息,这种自愿的地理信息VGI为灾害管理等复杂问题的解决提供了新的信息源。所以如何从海量的社交媒体数据中准确、高效地提取和整合有价值的信息,特别是与台风相关的时空信息,实现利用社交媒体数据进行台风定位是亟待解决的问题。
[0003]现有利用社交媒体数据进行台风定位的方法,是先对社交媒体文本数据进行多个维度进行探索,再通过对包括情感分析、危机检测、实时消息、实体抽取,发送数量等特征进行抽取,并将特征量化后采用深度学习算法来进行轨迹定位预测。但这类方法在抽取特征时由于忽略很多抽象语义特征,未能捕捉数据的全局时空相关性,无法准确预测台风中心位置。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种基于社交媒体数据的台风定位方法,其特征在于,包括如下步骤:(1)从社交媒体平台获取台风期间受台风影响区域中,带有时空信息的社交媒体文本数据集S;(2)从气象局公开平台获取台风生成期间的实时轨迹数据集Track;(3)根据社交媒体数据的时空信息,按照时空网格编码方法将原始社交媒体文本数据集S转化为时空编码数据集S
c
:S
c
={(T1,(x1,y1),tc1),...,(T
i
,(x
i
,y
i
),tc
i
),...,(T
n
,(x
n
,y
n
),tc
n
)}其中T
i
是文本数据,(x
i
,y
i
)表示每条数据的空间网格编码其中0≤x
i
≤3,0≤y
i
≤3,tc
i
表示时间编码的结果;(4)根据台风轨迹数据集Track进行时间编码,得到时间编码的台风轨迹数据集Track
c
:Track
c
={(La1,Ln1,tc1),...,(La
i
,Ln
i
,tc
i
),...,(La
m
,Ln
m
,tc
m
)}其中tc
i
是时间编码值,tc
m
是最后一个时间编码值;(5)利用BERT语言模型提取时空编码数据S
c
中每条数据的文本T
i
的十六维语义特征,得到语义特征数据集W:其中,其中,表示对文本T
i
提取的语义特征的第j维;(6)根据语义特征数据集W,对同一时空编码的文本语义特征求和与特征空间重构,得到重构语义特征数据集C:C={W0,..W
tc
,...,W
l
}其中表示tc时间编码下的空间重构语义特征,l是时间编码tc的最大值,表示在时间编码tc,空间编码(x,y)的重构语义特征,由语义特征数据集W中将同一时空编码下的所有语义特征求和后重构为4x4矩阵大小;(7)根据时空编码的方法,计算同一个时间编码下每一个空间网格中心到台风中心的距离数据集:D={D0,...,D
tc
,...,D
l
}其中表示在时间编码tc下所有时空网格中心到台风中心的距离,表示在时间编码为tc、空间编码为(x,y)所表示区域的中心到台风中心的距离;(8)构建由五层三维卷积层和两层卷积
‑
长短期记忆人工神经层交叉连接构成的卷积神经网络模型G,并以均方根误差RMSE函数作为该网络的损失函数;(9)将数据集C作为特征数据,数据集D作为真实值,并将重构语义特征数据集C和台风
中心距离数据集D组合成台风距离语义数据集B,再将该数据集B按3∶7划分为训练集Train和测试集Test;(10)将训练集Train的特征数据输入到卷积神经网络G,通过反向传播法对其进行迭代训练,直到损失函数收敛,得到训练好的卷积神经网络模型网络;(11)将测试集Test中的特征数据输入到训练好的卷积神经网络,得到对于每个时空网格中心到台风中心的距离预测值格中心到台风中心的距离预测值其中表示时空编码为[t,(x,y)]所表示空间中心距离台风中心的预测值;(12)根据每个时空网格中心到台风中心的距离预测值使用基于位置服务的时空网格定位算法对台风进行定位,确定预测的台风中心的纬度和经度位置。2.根据权利要求1所述的方法,其特征在于,步骤(1)获取的社交媒体文本数据集S,表示如下:S={(T1,La1,Ln1,t1),...,(T
i
,La
i
,Ln
i
,t
i
),...,(T
n
,La
n
,Ln
n
,t
n
)}其中T
i
表示文本数据,La
i
表示经度,Ln
i
表示纬度信息,t
i
表示社交媒体信息发出的时间戳,n表示数据集的长度。3.根据权利要求1所述的方法,其特征在于,步骤(2)从气象局公开平台获取台风生成期间的实时轨迹数据集Track,表示如下:Track={(La1,Ln1,t1),...,(La
i
,Ln
i
,t
i
),...,(La
m
,Ln
m
,t
m
)}其中t
i
表示时间戳,La
i
,Ln
i
表示在t
i
【专利技术属性】
技术研发人员:王静,温嘉伟,赵辉,杨烁,姚勇,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。