基于注意力机制的强对流天气物理特征量预测方法及系统技术方案

技术编号:33618486 阅读:16 留言:0更新日期:2022-06-02 00:37
本发明专利技术公开了一种基于注意力机制的强对流天气物理特征量预测方法及系统,其中方法主要体现在搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过解码编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果。本发明专利技术有效解决了多维度、多输入的时空序列预测问题。题。题。

【技术实现步骤摘要】
基于注意力机制的强对流天气物理特征量预测方法及系统


[0001]本专利技术涉及气象
,具体的说,涉及一种基于注意力机制的强对流天气物理特征量预测方法及系统。

技术介绍

[0002]自从人类诞生以来,天气就影响着人们的日常生活。天气塑造了各种大气事件,并对农业、交通、旅游、航空等现实生产生活系统产生“雪球效应”,在这一领域中,数据科学家试图预测天气系统的下一个状态,随着时空序列(spatio

temporalseris)模型的成功,业界为天气数值预报(NWP)创建了新的解决方案,与传统方法相比,这些解决方案具有明显的优势。与传统的数值天气预报的物理模型相比,深度学习模型可以在接收数据的几分钟内提供结果,利用多年采集的大量历史数据,并使用成本较低的模型进行准确预测。在众多大气事件中强对流天气对人类社会的影响最大,强对流天气是空气强烈垂直运动而导致出的天气现象,强对流天气(SCW)通常包括暴风雨、闪电、冰雹、对流阵风、短时强降雨、龙卷风,其对世界大部分地区的生命和财产构成严重威胁。由于小尺度的对流系统快速变化并与环境进行复杂的相互作用,预测强对流天气的物理参数仍然是当今业务气象领域天气数值预报任务下的一个具有挑战性且有重大意义的问题。强对流的物理特征包含位势高度(Geopotential)、温度(Temperature)、风的u分量(U

wind)、风的v分量(V

wind)、相对湿度(Relativehumidity)、比湿(Specifichumidity)、垂直速度(Verticalvelocity)、涡度(Vorticity)、势涡度(Potentialvorticity)、比云液态含水量(Specificcloudliquidwatercontent)等。
[0003]强对流天气物理特征量的预测问题是一个多时间、多空间的序列预测问题(以下简称时空序列预测)。在多时间序列领域,经典的机器学习算法在时间序列应用中取得了巨大的成功。在现有技术中,有人成功地训练了神经网络(NNs)进行每个区域的能量预测。同样,有人在多步和递归方式下建立了递归神经网络(RNN)和卷积神经网络(CNN),与统计模型相比表现出了巨大的成功。在预测非平稳时间序列数据的一个更具挑战性的任务中,还可以结合统计方法和深度学习模型来预测M4数据集。此外,随着时间序列预测新方法的发展,人们可以将多时间序列与注意机制相结合,或在时间上进行扩张的随机卷积,以产生准确的长期预测。然而,所有这些方法都集中在单一目标序列的下一个值的预测上。例如,使用多个输入序列的协变量来预测多个时间序列。然而,在时空序列预测中,有多个具有时空协方差的时空协方差需要预测。
[0004]此外,以前关于时空序列的研究中,包括ConvLSTM在内,没有利用天气的数字数据集,如卫星图像、数值和气象站的观测。这些工作都集中在降水预测上。降水预测旨在准确、及时地预测相对较短时期内所在地区的降雨强度。输入和输出是一系列的雷达图像,它本质是解决了一个图像转换问题,而不是一个时空序列预测问题,它集中于一个数据源。然而,天气是一个受许多参数影响的混沌系统,如植被、地理轮廓和人为因素。因此,更少的信息数量并不足以建模这种混沌行为。
[0005]天气数值预报问题属于多时空序列预测问题。在预测网络中引入ConvLSTM模型,该网络由一个编码器和一个由堆叠的ConvLSTM构建的解码器组成。该模型可以捕捉时空协方差矩阵,并在Moving

MNIST数据集和预测一个区域的降雨强度方面表现出很高的性能。此外,现有技术中还使用了这种架构来跟踪飓风。后来,现有技术中引入了轨迹门控递归单元(Traj

GRU)来学习输入雷达图像之间的位置不变运动,显示出更高的性能。然而,现有技术中提出的网络架构必须采用一维张量来预测一维输出。此外,现有技术中通过下采样和TrajGRU单元与输出卷积之间的上采样层改进了预测体系结构,忽略了多维输入问题。
[0006]注意力机制(AttentionMechanism)在深度学习中可谓发展迅猛,尤其是近几年,随着它在自然语言处理、语音识别、计算机视觉等领域的广泛应用,更是引起大家的高度关注。注意力机制源于对人类视觉的研究,是一种人类不可或缺的复杂认知功能,人具有关注一些信息的的同时忽略其他信息的选择能力。注意力机制符合人类看图片的逻辑,当我们看到一张图片时,往往没有看清图片的全部内容,而是将注意力集中在图片的某个重要部分。重点关注部分,就是一般所说的注意力集中部分,而对这一部分投入更多的注意力资源,以获取更多需要关注的目标细节信息,忽略其他无用信息。这种利用有限的注意力资源从大量信息中筛选出高价值信息的手段应用中深度学习中,可以极大的提升自然语言处理、图像处理的效率和性能。
[0007]为了实现人类动作识别,现有技术开发了具有完全连接的NNs和LSTMs的时空注意机制。例如,在时间序列预测中实现了一种双重注意机制。又有技术实现了一种多层次的注意机制,融合辅助信息和多个地理感觉时间序列数据来预测空气质量。对于流量预测,有人实现了一种对LSTM输出的关注机制,它接受了过去不同时期的输入。虽然这些工作成功地实现了注意机制,但输入是单个或多个时间序列,而不是三维张量。有人实现了一种注意机制来进一步改进ConvLSTM,它以三维张量作为输入;然而,性能几乎没有提高。最近,CNN关注LSTM(Conv+LSTM)与ConvLSTM在时间展开的架构和时间连接体系结构。他们根据不同的输入观察到损失的变化,例如,特征、解释模型决策的位置。与Conv+LSTM相比,ConvLSTM表现出高性能。然而,他们只为Conv+LSTM模型获得了可解释的结果,它们的解释是在特征和位置层面上,而不是在模型的激活上。
[0008]因此,现有技术需要一种提高预测准确性还能融合大气中自然流动的方法来解决强对流天气的物理特征量预测问题,并且需要一种可以充分融合多种天气参数、更好的学习空间相关性来实现气象时空序列预测的方法。

技术实现思路

[0009]本专利技术针对现有技术存在的不足,提供了基于注意力机制的强对流天气物理特征量预测方法及系统。本专利技术通过加入更多的通道数(大气参数作为辅助信息)以优化预测结果,引入了基于注意力的递归网络结构,用于时空序列,解决多维度、多输入的时空序列预测问题。
[0010]本专利技术的具体技术方案如下:根据本专利技术的第一技术方案,提供了一种基于注意力机制的强对流天气物理特征量预测方法,包括:获取气象参数文件;获取筛选出强对流天气的历史记录;提取并融合数据,制作数据集;搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入
数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于注意力机制的强对流天气物理特征量预测方法,其特征在于,包括以下步骤:获取气象参数文件;获取筛选出强对流天气的历史记录;提取并融合数据,制作数据集;搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;基于所述模型,预测强对流各天气因子的下一次观测数值。2.按照权利要求1所述的方法,其特征在于,所述提取并融合数据,制作数据集,包括以下步骤:提取强对流天气数据和提取普通天气数据;其中,强对流天气数据根据所述强对流天气的历史记录在所述气象参数文件中定位到该强对流事件所对应发生时段的所有天气参数,并根据该事件的经纬度坐标运用点扩散方法,将所述事件的经纬度坐标点向外扩散形成第一经纬范围,基于所述第一经纬范围在气象参数文件中剪裁出对应的气象参数,作为所述数据集的正样本;普通天气数据根据普通天气的历史记录在所述气象参数文件中定位到该普通事件所对应发生时段的所有天气参数,并根据该普通事件随机选择一个与所述第一经纬范围一样大的第二经纬范围,基于所述第二经纬范围在所述气象参数文件中剪裁出对应的气象参数,作为所述数据集的负样本。3.按照权利要求2所述的方法,其特征在于,所述第一经纬范围的大小为1.75
°×
1.75
°
。4.按照权利要求1所述的方法,其特征在于,基于所述模型,预测强对流各天气因子的下一次观测数值,包括以下步骤:将最新一次观测强对流天气的数据作为输入数据输入模型,得出预测结果。5.按照权利要求1所述的方法,其特征在于,所述配置好的参数文件包括全局开始日期、全局结束日期、数据步长、数据间隔时长、训练集验证集测试集的比例、下采样的模式、数据集所包含的物理特征,需要预测的物理特征。6.按照权利要求1所述的方法,其特征在于,所述获取气象参数文件,包括以下步骤:基于历史数据库,以预设周期获取若干气象参数...

【专利技术属性】
技术研发人员:文立玉罗飞廖文龙舒红平卫霄飞唐正全曹亮刘魁
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1