【技术实现步骤摘要】
基于探空物理参数的LSTM网络实现的雷电潜势预报方法
[0001]本专利技术涉及雷电潜势预测领域,具体来讲是一种利用探空物理参数与LSTM网络模型实现高准确率雷电潜势预测的方法。
技术介绍
[0002]雷电临近预报通常采用雷达回波反射率跟踪外推、实时监测大气电场变化作出0
‑
2h,甚至更短时间内的短时临近预报。由于雷暴天气过程大多数是中小尺度天气系统造成,发生发展十分迅速,局地性较强,开展0
‑
12h的雷电潜势预报可作为临近预报的补充,扩大预警时间范围,提前雷电发生的预判时间。目前,采用雷达回波反射率跟踪外推、大气电场监测等开展5~30min的雷电短时临近预报取得了很好效果。然而,鉴于雷暴强对流天气过程具有发生迅速、局地性较强等特点,补充雷电潜势预报,有利于增加预警时间提前量,提高防雷减灾能力。
[0003]雷暴在天气学上泛指深厚湿对流现象,其发生的早期需要满足静力不稳定、水汽和抬升触发3个基本条件。近年来,国内外许多学者通过分析常规探空观测的物理量参数与雷暴活动的相关性,开展了雷 ...
【技术保护点】
【技术特征摘要】
1.一种基于探空物理参数的LSTM网络实现的雷电潜势预报方法,其特征在于;包括雷暴预测模型的建立、数据处理以及模型超参数选取;所述雷暴预测模型的建立如下;选取LSTM循环神经网络作为雷暴天气状态预测模型,预测模型由输入层、隐藏层、输出层组成,其中核心的设计是隐藏层,包括LSTM cell结构、Denselayers全连接网络、Sigmiod连接,设置2层全连接网络,增加模型训练深度,同时向前操作,将上一时刻的信息以记忆流的形态不断向后传递,影响每个新输入数据的处理和每个阶段的输出;输入层包括数据预处理、数据集生成等,输入数据包含若干个与雷暴活动相关的大气物理量特征,输出层是一个用于预测雷暴的神经元;使用的是深度学习框架pytorch中的Sequential将LSTM cell结构、Dense layers全连接网络、Sigmiod网络层进行线性堆叠;具体过程如下:(1)模型隐藏层设置构建LSTM网络模型,输入数据维度为物理量参数个数,通过2层全连接依次构建64、128的Dense层网络,最后经过一个Sigmiod激活,将预测结果范围统一到[0,1];为防止过度拟合,使用Dropout正则化方法应用全连接网络中;(2)模型参数设置在进行训练之前,需要配置模型的优化器、损失函数、指标列表;本文选择二分类交叉熵BCELoss损失函数获得模型的输出误差,选择自适应性矩估计优化器(Adam)反向传播更新隐藏层的参数权重和偏置;其中,N是总样本数,y
i
是第i个样本的所属类别,p
i
是第i个样本的预测值,一般来说,它是一个概率值;(3)模型训练设置每次训练包含的样本数为batchsize,训练轮数为epoch,并为模型指定测试数据,输出每一次训练的记录;(4)模型预测训练后的模型需要在测试集上进行验证,基于探空物理量参数实现雷暴天气过程判别预测,本质为二分类问题,因此使用分类准确率作为评测指标;假定实际预测分类为y,模型输出分类为则准确率取值为:2.根据权利要求1所述基于探空物理参数的LSTM网络实现的雷电潜势预报方法,其特征在于;所述数据处理如下;(1)关联度分析:使用灰色关联度分析方法筛选与雷暴活动相关性较好的物理量参数;物理量参数来源于Micaps系统提供的T
‑
lnp探空数据,对数列进行无量纲化处理,按照下式进行关联度分析:析:
其中ρ为分辨系数,通常取0.5;ξ
i
为参考数列Y与比较数列X
i
在k时刻的关联系数,r
i
为对应的关联度,越接近1,关联度越大,说明比较序列与参考序列关系越密切;(2)数据集处理及生成:1、数据标准化;选取大风指数、Charba修正指数、静力能对流稳定度等23个物理量参数作为研究样本特征(Features),统计当日08时或20时以后12h内、100km范围内闪电次数,规定该范围内发生10次以上的闪电,则记录标签(Label)为“1”,反之为“0”;由于不同大气物理量参数间的量纲不同、数量级差别大,为了防止深度学习反向传播优化过程出现梯度消失、或爆炸,同时加快梯度下降求最优解的速度,采用标准差标准化方法将数据处理成均值为0,标准差为1的标准正态分布;即X=(x
‑
μ)/σ,其中μ、σ分别为原参数均值、标准差,该方法广泛用于SVM、Logistic regression、Neural networks等机器学习算法;2、数据集生成;基于时间序列的预测,根据前12*序列长度(sequence_length)小时的大气物理量参数预测未来是否出现雷暴天气过程,即依次输入前sequence_length个时次的样本特征实现标签数据的预测;具体将标准化处理后的大气物理量参数和雷暴发生情况进行预处理,构建大小为(m,sequence_length,j)的数据集,其中m为数据条数,j为大气物理量参数和标签数;拆分样本特征、标签数据集大小分别为(m,sequence_length,23)、(m,sequence_length,1),进一步随机打乱后将数据进行分割,80%作为训练数据集用于训练模型、20%作为验证数...
【专利技术属性】
技术研发人员:吴安坤,丁旻,吴仕军,张弛,杨群,张淑霞,李迪,陈春,
申请(专利权)人:贵州省气象灾害防御技术中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。