一种基于动态卷积神经网络的雷达回波外推方法技术

技术编号:15704336 阅读:429 留言:0更新日期:2017-06-26 07:00
本发明专利技术公开了一种基于动态卷积神经网络的雷达回波外推方法,包括:离线卷积神经网络训练:对给定的训练图像集,通过数据预处理得到训练样本集,初始化动态卷积神经网络模型,并利用训练样本集训练动态卷积神经网络,经过网络前向传播计算输出值、后向传播更新网络参数的过程使动态卷积神经网络收敛。在线雷达回波外推:通过数据预处理将测试图像集转化为测试样本集,利用测试样本集对经过训练的动态卷积神经网络进行测试,将输入图像序列中的最后一幅雷达回波图像与网络前向传播中获得的概率向量相卷积,得到预测的雷达回波外推图像。

【技术实现步骤摘要】
一种基于动态卷积神经网络的雷达回波外推方法
本专利技术属于大气探测中地面气象观测
,尤其涉及一种基于动态卷积神经网络的雷达回波外推方法。
技术介绍
临近预报主要指0~3小时的高时空分辨率的天气预报,主要预报对象包括强降水、大风、冰雹等灾害性天气。目前,很多预报系统都采用数值预报模式,但是由于数值预报存在预报起转延迟(spin-up),其短时临近预报能力有限。新一代多普勒天气雷达具有很高的灵敏度和分辨率,其数据资料的空间分辨率能够达到200~1000m,时间分辨率能够达到2~15min。此外,多普勒天气雷达还具有合理的工作模式、全面的状态监控和故障警报、先进的实时标校系统和丰富的雷达气象产品算法,能够大大提高短时临近预报的可靠性。如今,新一代多普勒天气雷达已经成为临近预报的最有效工具之一,利用多普勒天气雷达进行临近预报主要基于雷达回波外推技术,即根据当前时刻雷达观测结果,推测雷达回波未来的位置和强度,以实现对强对流系统的跟踪预报。传统的的雷达回波外推方法是质心跟踪法和基于最大相关系数的交叉相关法(TrackingRadarEchoesbyCorrelation,TREC),但是传统方法都存在一定的不足,质心跟踪法仅适用于回波较强、范围较小的风暴单体,对于大范围降水的预报不可靠;TREC一般将回波视为线性变化的,而现实情况中回波变化更为复杂,同时此类方法易受矢量场中的无序矢量干扰。此外,现有的方法对雷达资料的利用率低,而历史雷达资料包含当地天气系统变化的重要特征,具有很高的研究价值。为提高雷达回波外推的时效性,并从大量的历史雷达资料中研究雷达回波的变化规律,将机器学习方法引入雷达回波外推中。卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为深度学习的重要分支,广泛应用于图像处理,模式识别等领域。该网络最大的特点在于采用局部连接、权值共享、下采样的方法,对输入图像的形变、平移和翻转具有较强的适应性。针对雷达回波图像之间存在的强时间相关性,设计基于输入的动态卷积神经网络,该网络能够根据输入的雷达回波图动态的变化权值参数,进而预测外推图像。利用历史雷达资料训练动态卷积神经网络,使网络更加充分地提取回波特征,学习回波变化规律,对于提高雷达回波外推准确性,优化临近预报效果具有重要意义。
技术实现思路
专利技术目的:本专利技术所要解决的技术问题是针对现有的雷达回波外推方法的外推时效短,对雷达资料利用率不足,提出了一种基于动态卷积神经网络的雷达回波外推方法,实现对雷达回波强度等高平面显示CAPPI(ConstantAltitudePlanPositionIndicator,CAPPI)图像的外推预测,包括以下步骤:步骤1,训练离线卷积神经网络:输入训练图像集,对训练图像集进行数据预处理,得到训练样本集,设计动态卷积神经网络结构,并初始化网络训练参数;利用训练样本集训练动态卷积神经网络,输入的有序图像序列经过动态卷积神经网络前向传播得到一幅预测图像,计算预测图像和对照标签之间的误差,通过反向传播更新网络的权值参数和偏置参数,重复此过程直到达到训练结束条件,得到收敛的动态卷积神经网络;步骤2,在线雷达回波外推:输入测试图像集,对测试图像集进行数据预处理,得到测试样本集,然后将测试样本集输入步骤1中获得的动态卷积神经网络中,经过网络前向传播计算概率向量,并将输入图像序列中的最后一幅雷达回波图像与得到的概率向量相卷积,得到预测的雷达回波外推图像。本专利技术步骤1包括以下步骤:步骤1-1,数据预处理:输入训练图像集,对训练图像集中的每一幅图像进行规范化处理,将每一幅图像转化为280×280的浮点数图像,得到浮点数图像集合,对浮点数图像集合进行划分,构造包含TrainsetSize组样本的训练样本集;步骤1-2,初始化动态卷积神经网络:设计动态卷积神经网络结构,构造用于生成概率向量的子网络,再构造用于图像外推的概率预测层,为离线神经网络训练阶段提供动态卷积神经网络初始化模型;步骤1-3,初始化动态卷积神经网络训练参数:令网络学习率λ=0.0001,训练阶段每次输入的样本数量BatchSize=10,训练样本集的最大批训练次数当前批训练次数BatchNum=1,网络训练的最大迭代次数IterationMax=40,当前迭代次数IterationNum=1;步骤1-4,读取训练样本:采用批训练的方式,每次训练从步骤1-1获得的训练样本集中读取BatchSize组训练样本,每组训练样本为{x1,x2,x3,x4,y},共包含5幅图像,其中{x1,x2,x3,x4}作为输入图像序列,y为对应的对照标签;步骤1-5,前向传播:在子网络中提取步骤1-4获得的输入图像序列特征,得到水平概率向量HPV和垂直概率向量VPV;在概率预测层中,将输入图像序列中的最后一幅图像依次与VPV、HPV相卷积,得到前向传播的输出预测图像;步骤1-6,反向传播:在概率预测层中反向求得概率向量的误差项,根据概率向量的误差项从后至前逐层计算子网络层中各个网络层的误差项,进而计算各个网络层中误差项对权值参数和偏置参数的梯度,利用得到的梯度更新动态卷积神经网络的参数;步骤1-7,离线训练阶段控制:对离线神经网络训练阶段进行整体控制,分为以下三种情况:若训练样本集中仍存在未使用过的训练样本,即BatchNum<BatchMax,则返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;若训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且当前网络迭代次数小于最大迭代次数,即IterationNum<IterationMax,则令BatchNum=1,返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;若训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且网络迭代次数达到最大迭代次数,即IterationNum=IterationMax,则结束离线神经网络训练阶段,得到训练好的动态卷积神经网络模型。本专利技术步骤1-1数据预处理包括以下步骤:步骤1-1-1,采样:训练图像集中的图像按时间顺序排列,并且等时间间隔分布,时间间隔为6分钟,共包含NTrain幅图像,通过如下公式确定TrainsetSize:其中,Mod(NTrain,4)表示NTrain对4取模,[N]表示不大于N的最大整数,求得TrainsetSize后,通过采样保留训练图像集中前4×TrainsetSize+1幅图像,采样时通过删除训练图像集中最后的图像使图像数量满足要求;步骤1-1-2,规范化图像:对采样得到的图像进行图像变换,归一化操作,将原始分辨率为2000×2000的彩色图像转换成分辨率为280×280的浮点数图像;步骤1-1-3,构造训练样本集:利用步骤1-1-2获得的浮点数图像集构造训练样本集,将浮点数图像集中每四个相邻的图像,即第{4N+1,4N+2,4N+3,4N+4}幅图像作为一组输入序列,第[4×(N+1)+1]幅图像经过裁剪,保留中央分辨率为240×240的部分作为对应样本的对照标签,对于第N组样本其构造方式如下:上式中,G4N+1表示浮点数图像集中的第4N+1幅图像,N为正整数,并有N∈本文档来自技高网
...
一种基于动态卷积神经网络的雷达回波外推方法

【技术保护点】
一种基于动态卷积神经网络的雷达回波外推方法,其特征在于,包括以下步骤:步骤1,训练离线卷积神经网络:输入训练图像集,对训练图像集进行数据预处理,得到训练样本集,设计动态卷积神经网络结构,并初始化网络训练参数;利用训练样本集训练动态卷积神经网络,输入的有序图像序列经过动态卷积神经网络前向传播得到一幅预测图像,计算预测图像和对照标签之间的误差,通过反向传播更新网络的权值参数和偏置参数,重复此过程直到达到训练结束条件,得到收敛的动态卷积神经网络;步骤2,在线雷达回波外推:输入测试图像集,对测试图像集进行数据预处理,得到测试样本集,然后将测试样本集输入步骤1中获得的动态卷积神经网络中,经过网络前向传播计算概率向量,并将输入图像序列中的最后一幅雷达回波图像与得到的概率向量相卷积,得到预测的雷达回波外推图像。

【技术特征摘要】
1.一种基于动态卷积神经网络的雷达回波外推方法,其特征在于,包括以下步骤:步骤1,训练离线卷积神经网络:输入训练图像集,对训练图像集进行数据预处理,得到训练样本集,设计动态卷积神经网络结构,并初始化网络训练参数;利用训练样本集训练动态卷积神经网络,输入的有序图像序列经过动态卷积神经网络前向传播得到一幅预测图像,计算预测图像和对照标签之间的误差,通过反向传播更新网络的权值参数和偏置参数,重复此过程直到达到训练结束条件,得到收敛的动态卷积神经网络;步骤2,在线雷达回波外推:输入测试图像集,对测试图像集进行数据预处理,得到测试样本集,然后将测试样本集输入步骤1中获得的动态卷积神经网络中,经过网络前向传播计算概率向量,并将输入图像序列中的最后一幅雷达回波图像与得到的概率向量相卷积,得到预测的雷达回波外推图像。2.根据权利要求1所述的方法,其特征在于,步骤1包括以下步骤:步骤1-1,数据预处理:输入训练图像集,对训练图像集中的每一幅图像进行规范化处理,将每一幅图像转化为280×280的浮点数图像,得到浮点数图像集合,对浮点数图像集合进行划分,构造包含TrainsetSize组样本的训练样本集;步骤1-2,初始化动态卷积神经网络:设计动态卷积神经网络结构,构造用于生成概率向量的子网络,再构造用于图像外推的概率预测层,为离线神经网络训练阶段提供动态卷积神经网络初始化模型;步骤1-3,初始化动态卷积神经网络训练参数:令网络学习率λ=0.0001,训练阶段每次输入的样本数量BatchSize=10,训练样本集的最大批训练次数当前批训练次数BatchNum=1,网络训练的最大迭代次数IterationMax=40,当前迭代次数IterationNum=1;步骤1-4,读取训练样本:采用批训练的方式,每次训练从步骤1-1获得的训练样本集中读取BatchSize组训练样本,每组训练样本为{x1,x2,x3,x4,y},共包含5幅图像,其中{x1,x2,x3,x4}作为输入图像序列,y为对应的对照标签;步骤1-5,前向传播:在子网络中提取步骤1-4获得的输入图像序列特征,得到水平概率向量HPV和垂直概率向量VPV;在概率预测层中,将输入图像序列中的最后一幅图像依次与VPV、HPV相卷积,得到前向传播的输出预测图像;步骤1-6,反向传播:在概率预测层中反向求得概率向量的误差项,根据概率向量的误差项从后至前逐层计算子网络层中各个网络层的误差项,进而计算各个网络层中误差项对权值参数和偏置参数的梯度,利用得到的梯度更新动态卷积神经网络的参数;步骤1-7,离线训练阶段控制:对离线神经网络训练阶段进行整体控制,分为以下三种情况:若训练样本集中仍存在未使用过的训练样本,即BatchNum<BatchMax,则返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;若训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且当前网络迭代次数小于最大迭代次数,即IterationNum<IterationMax,则令BatchNum=1,返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;若训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且网络迭代次数达到最大迭代次数,即IterationNum=IterationMax,则结束离线神经网络训练阶段,得到训练好的动态卷积神经网络模型。3.根据权利要求2所述的方法,其特征在于,步骤1-1数据预处理包括以下步骤:步骤1-1-1,采样:训练图像集中的图像按时间顺序排列,并且等时间间隔分布,时间间隔为6分钟,共包含NTrain幅图像,通过如下公式确定TrainsetSize:其中,Mod(NTrain,4)表示NTrain对4取模,表示不大于的最大整数,求得TrainsetSize后,通过采样保留训练图像集中前4×TrainsetSize+1幅图像,采样时通过删除训练图像集中最后的图像使图像数量满足要求;步骤1-1-2,规范化图像:对采样得到的图像进行图像变换,归一化操作,将原始分辨率为2000×2000的彩色图像转换成分辨率为280×280的浮点数图像;步骤1-1-3,构造训练样本集:利用步骤1-1-2获得的浮点数图像集构造训练样本集,将浮点数图像集中每四个相邻的图像,即第{4N+1,4N+2,4N+3,4N+4}幅图像作为一组输入序列,第[4×(N+1)+1]幅图像经过裁剪,保留中央分辨率为240×240的部分作为对应样本的对照标签,对于第N组样本其构造方式如下:上式中,G4N+1表示浮点数图像集中的第4N+1幅图像,N为正整数,并有N∈[0,TrainsetSize-1],Crop(·)表示裁剪操作,裁剪后保留原图像中央大小为240×240的部分,最终得到包含TrainsetSize组训练样本的训练样本集;其中,步骤1-1-2包括以下步骤:步骤1-1-2-1,图像转化:将步骤1-1-1采样得到的图像转化为灰度图像,通过裁剪保留原始图像中央分辨率为560×560的部分,将裁剪后的图像分辨率压缩为280×280,得到分辨率为280×280的灰度图;步骤1-1-2-2,数据归一化:将步骤1-1-2-1中获得的灰度图中的每一个像素点的值从[0~255]映射到[0~1],通过归一化之后得到分辨率为280×280的浮点数图像。4.根据权利要求3所述的方法,其特征在于,步骤1-2包括以下步骤:步骤1-2-1,构造子网络:子网络由10个网络层构成,从前至后依次为卷积层C1、下采样层S1、卷积层C2、下采样层S2、卷积层C3、下采样层S3、卷积层C4、下采样层S5、卷积层C5以及分类器层F1;步骤1-2-2,构造概率预测层:概率预测层中构造动态卷积层DC1和动态卷积层DC2,将子网络输出的垂直概率向量VPV作为动态卷积层DC1的卷积核,水平概率向量HPV作为动态卷积层DC2的卷积核;其中,步骤1-2-1包括以下步骤:步骤1-2-1-1,构造卷积层:确定以下内容:卷积层的输出特征图数量OutputMaps、卷积核k以及偏置参数bias,对于卷积核,需要确定卷积核的宽度KernelSize,卷积核的数量KernelNumber,该值为该卷积层输入与输出特征图数量的乘积,卷积核的分辨率为KernelSize×KernelSize,并根据Xavier初始化方法构造卷积核;对于偏置参数,其数量与该层的输出特征图数量相同;对于卷积层lC,lC∈{C1,C2,C3,C4,C5},该层的输出特征图宽度为的值由卷积层lC的输入特征图分辨率和卷积核的宽度共同决定,即表示卷积层lC的上一层卷积层的输出特征图宽度;对于卷积层C1,令C1层的输出特征图数量OutputMapsC1=12,C1层输出特征图的宽度OutputSizeC1=272,C1层卷积核宽度KernelSizeC1=9,C1层偏置参数biasC1均初始化为零,C1层的卷积核kC1的数量KernelNumberC1=48,卷积核中每一个参数的初始值为rand(·)用于生成随机数;对于卷积层C2,令C2层输出特征图数量OutputMapsC2=32,C2层输出特征图的宽度OutputSizeC2=128,C2层卷积核宽度KernelSizeC2=9,C2层偏置参数均初始化为零,C2层的卷积核kC2的数量KernelNumberC2=384,卷积核中每一个参数的初始值为对于卷积层C3,令C3层输出特征图数量OutputMapsC3=32,C3层输出特征图的宽度OutputSizeC3=56,C3层卷积核宽度KernelSizeC3=9,C3层偏置参数均初始化为零,C3层的卷积核kC3的数量KernelNumberC3=1024,卷积核中每一个参数的初始值为对于卷积层C4,令C4层输出特征图数量OutputMapsC4=32,C4层输出特征图的宽度OutputSizeC4=20,C4层卷积核宽度KernelSizeC4=9,C4层偏置参数均初始化为零,C4层的卷积核kC4的数量KernelNumberC4=1024,卷积核中每一个参数的初始值为对于卷积层C5,令C5层输出特征图数量OutputMapsC5=32,C5层输出特征图的宽度OutputSizeC5=4,C5层卷积核宽度KernelSizeC5=7,C5层偏置参数均初始化为零,C5层的卷积核kC5的数量KernelNumberC5=1024,卷积核中每一个参数的初始值为步骤1-2-1-2,构造下采样层:下采样层中不包含需要训练的参数,将下采样层S1、S2、S3和S4的采样核均初始化为对于下采样层lS,lS∈{S1,S2,S3,S4},其输出特征图数量与其上一层的卷积层的输出特征图数量保持一致,输出特征图宽度为其上一层的卷积层的输出特征图宽度的1/2,公式表达如下:步骤1-2-1-3,构造分类器层:分类器层由一个全连接层F1构成,F1层的权值参数为水平权值参数矩阵WH和垂直权值参数矩阵WV,大小均为41×512,令权值参数矩阵中的每一个参数的初始值为偏置参数为水平偏置参数BH和垂直偏置参数BV,均初始化为41×1的一维零向量。5.根据权利要求4所述的方法,其特征在于,步骤1-5包括以下步骤:步骤1-5-1,子网络计算概率向量:在子网络中通过卷积层和下采样层的交替处理提取输入的图像序列特征,在分类器层中通过Softmax函数处理,得到水平概率向量HPV和垂直概率向量VPV;步骤1-5-2,计算概率预测层输出图像:步骤1-5-1得到的HPV和VPV作为概率预测层的卷积核,将输入图像序列中的最后一幅图像依次与VPV、HPV相卷积,得到前向传播的输出预测图像。6.根据权利要求5所述的方法,其特征在于,步骤1-5-1包括以下步骤:步骤1-5-1-1,判断网络层类型:用l表示当前所处的子网络中的网络层,l初始值为C1,判断网络层l的类型,若l∈{C1,C2,C3,C4,C5},则l为卷积层,执行步骤1-5-1-2,若l∈{S1,S2,S3,S4},则l为下采样层,执行步骤1-5-1-4;步骤1-5-1-2,处理卷积层:此时有l=lC,lC∈{C1,C2,C3,C4,C5},首先计算lC层的第j个输出特征图将lC层的输入特征图分别与该层的对应卷积核相卷积,将卷积结果求和,求和结果加上lC层的第j个偏置参数再经过ReLU激活函数处理,得到计算公式如下所示:其中,为lC层的第i个输入特征图与第j个输出特征图相对应的卷积核,n为当前卷积层的前一下采样层的输出特征图个数,表示lC层的第i个输入特征图,同时也是lC-1层的第i个输出特征图,*表示矩阵卷积,若lC=C1,则lC-1层为输入层;依次计算所有的输出特征图,得到lC层的输出特征图将l更新为l+1,并返回步骤1-5-1-1判断网络类型,进行下一个网络层的操作;步骤1-5-1-3,处理下采样层:此时有l=lS,lS∈{S1,S2,S3,S4},将步骤1-5-1-2得到的卷积层的输出特征图分别与相卷积,再以步长为2进行采样,采样得到lS层的输出特征图计算公式如下所示:上式中,Sample(·)表示步长为2的采样处理,lS-1表示当前下采样层的前一卷积层,表示lS层的输出特征图中的第j个输出特征图,得到lS层的输出特征图后,将l更新为l+1,并返回步骤1-5-1-1判断网络类型,进行下一个网络层的操作;步骤1-5-1-4,计算F1层概率向量:若网络层l为分类器层,即l=F1,通过矩阵变换,将C5的32幅分辨率为4×4的输出特征图以列顺序展开,得到分辨率为512×1的F1层的输出特征向量aF1,分别计算水平权值参数矩阵WH与aF1的外积、垂直权值参数矩阵WV与aF1的外积,将计算结果分别与水平偏置参数BH、垂直偏置参数BV求和,经Softmax函数处理后得到水平概率向量HPV和垂直概率向量VPV,具体计算公式如下:将其垂直概率向量VPV转置,得到最终的垂直概率向量;步骤1-5-2包括以下步骤:步骤1-5-2-1,预测DC1层垂直方向:将输入层的最后一幅输入图像与垂直概率向量VPV相卷积,得到分辨率为240×280的DC1层输出特征图aDC1;步骤1-5-2-2,预测DC2层垂直方向:将DC1层输出特征图aDC1与水平概率向量HPV相卷积,得到前向传播的输出预测图像,其分辨率为240×240。7.根据权利要求6所述的方法,其特征在于,步骤1-6包括以下步骤:步骤1-6-1,计算概率预测层误差项:将步骤1-5-2-2获得的预测图像与输入的训练样本中的对照标签求差,计算DC2层、DC1层的误差项,最终求得水平概率向量的误差项δHPV和垂直概率向量的误差项δVPV;步骤1-6-2,计算子网络误差项:根据水平概率向量的误差项δHPV和垂直概率向量的误差项δVPV,从后至前依次计算分类层F1,卷积层C5、C4、C3、C2、C1和下采样层S4、S3、S2、S1的误差项,求得的任一层误差项矩阵的分辨率与该层的输出特征图的分辨率相一致;步骤1-6-3,计算梯度:根据步骤1-6-2获得的误差项计算子网络各个网络层的误差项对该层权值参数和偏置参数的梯度值;步骤1-6-4,更新参数:将步骤1-6-3获得的各网络层的权值参数和偏置参数的梯度值乘上动态卷积神经网络的学习率,得到各网络层权值参数和偏置参数的更新项,将原权值参数和偏置参数分别与该更新项求差,得到更新后的权值参数和偏置参数。8.根据权利要求7所述的方法,其特征在于,步骤1-6-1包括以下步骤:步骤1-6-1-1,计算动态卷积层DC2误差项:将步骤1-5-2-2获得的预测图像与该组样本的对照标签求差,得到大小为240×240的误差项矩阵δDC2;步骤1-6-1-2,计算动态卷积层DC1误差项:通过零填充将DC2层的误差项矩阵δDC2拓展为240×320,将水平概率向量旋转...

【专利技术属性】
技术研发人员:李骞施恩顾大权
申请(专利权)人:中国人民解放军理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1