基于密集卷积神经网络的遥感飞机识别方法技术

技术编号:18972720 阅读:24 留言:0更新日期:2018-09-19 03:46
本发明专利技术提出一种基于密集卷积神经网络的联合监督识别方法,利用密集卷积网络结构的特征重用,密集连接等优势,产生高度参数化的高效率模型。并且改进损失函数,将原有的softmax损失函数改为使用softmax损失和中心损失的联合监督,通过联合监督,不仅扩大了不同类之间特征差异,而且减少了同类别的类内特征变化。从而解决飞机识别时遇到遮挡、噪声、模糊情况识别率低的问题。

Remote sensing aircraft recognition method based on dense convolution neural network

The invention proposes a joint supervised identification method based on dense convolution neural network, which utilizes the advantages of dense convolution network structure, such as feature reuse, dense connection, etc., to produce a highly parameterized high efficiency model. In addition, the loss function is improved, and the original loss function is replaced by the joint supervision of the soft Max loss and the central loss. Through the joint supervision, not only the difference between different features is enlarged, but also the change of the same kind of features is reduced. It solves the problem of low recognition rate when encountering occlusion, noise and blur in aircraft recognition.

【技术实现步骤摘要】
基于密集卷积神经网络的遥感飞机识别方法
:本文专利技术涉及遥感飞机图像的飞机机型识别技术。是一种基于密集卷积神经网络的联合监督识别方法。
技术介绍
:遥感飞机目标的识别无论在民用还是军用领域都有巨大研究意义,可实现飞机精确定位识别,用来监控民用飞机以及精确军事打击。但是遥感图像存在信息量大,图像不清晰且受环境因素影响较大的问题,卷积神经网络作为解决这一问题的方法引起广泛关注,它会经过不断训练调整权重参数自动提取图像中的感兴趣特征,从而实现精确的遥感飞机识别。目前飞机目标种类繁多,数据量巨大,且采集的图像受环境、气象等条件干扰较大,因此研究面向实际应用的飞机识别方法是必要的。传统飞机识别算法主要有模板匹配和支持向量机。早期模板匹配算法原理是计算模板图像与目标图像之间的相似性实现目标识别,其识别准确率较高,但是计算量较大,对于遮挡、模糊、旋转等异常情况的鲁棒性较差。后来随着机器学习的发展提出支持向量机算法,其识别准确率有一定提升,且鲁棒性较模板匹配更优,但是支持向量机的核函数、带宽等很难确定。近年来卷积神经网络(CNN)因其卓越的性能已成为机器视觉领域领头羊,能够经过多层卷积网络以及反向传播后提取出需要的特征再进行飞机的识别。基于此,本专利技术提出一种基于密集卷积神经网络的联合监督识别方法,利用密集卷积网络结构的特征重用,密集连接等优势,产生高度参数化的高效率模型。损失函数使用softmax损失和中心损失的联合监督,通过联合监督,不仅扩大了不同类之间特征差异,而且减少了同类别的类内特征变化。从而解决飞机识别时遇到遮挡、噪声、模糊情况识别率低的问题。
技术实现思路
:如今使用深度学习方法实现对遥感飞机识别的成为飞机识别研究热点。大部分基于深度学习飞机识别算法的损失函数为softmax损失函数,针对受到天气、噪声、模糊等异常影响的遥感飞机图像,传统softmax函数的缺点主要有三个方面:一是从聚类的角度来讲,其提取到的特征在很多情况下类内间距要大于类间间距,不利于特征区分;二占据的面积大,我们期望每类占据较小的部分,因为飞机类别很多,期望模型能识别出在训练数据标签中没有的分类;三是softmax会使得模型过度自信,分类结果基本非1即0。因此为解决以上问题本专利技术采取基于密集卷积神经网络的联合监督遥感飞机识别方法,该方法主要包括以下步骤:步骤一:将密集卷积神经网络结构在自建遥感飞机数据库上训练,训练样本为五类遥感飞机图像,并且经过旋转、加噪声、加不同程度遮挡以及不同像素运动模糊的预处理。密集卷积神经网络结构如图2所示,网络第一层卷积层;之后是最大池化层P1;随后是网络的核心部分密集连接的3个密集块D1、D2、D3,每个密集块中包含两个卷积层;且密集块之间使用过渡层T1、T2来降低输出维数;再是池化层P2以及全连接层F;最后使用联合监督方法输出识别结果。步骤二:初始化参数设置,网络训练中学习率lr设置在0.009~0.02范围内,batchsize设置为ξ,也就是每训练ξ个样本就调整一次权值。本专利技术采用的联合监督就是将softmax损失函数与中心损失函数加权求和,并且用λ平衡两个损失函数,α控制中心的学习率,λ设置在0.008~0.03范围内,α设置在0.2~0.5范围内。步骤三:如图2所示首先将一张178×178像素的遥感图像经过第一个卷积层得到16个89×89的特征图;随后经过最大池化P1得到16个46×46的特征图;其次经过3个密集块D1、D2、D3后得到80个46×46的特征图。由于密集连接特性,80由16+16×4得到;然后经过包含卷积层、池化层的过渡层T1得到40个23×23的特征图;同理在经过14个密集块和一个过渡层后得到196个6×6特征图。最后经过平均池化层得到196个1×1的特征图送到全连接层。步骤四:将全连接层输出的1×10向量输入到联合监督的损失函数L中如公式1,且Ls代表softmax损失函数,Lc代表中心损失函数。其中:xi代表d维空间中第i个深层特征,属于第yi类;d:特征空间的维度;W:全连接层的参数矩阵(W={d×n},d行n列)。Wj:W的第j列;m:批处理的大小;n:类别数;b:偏置。Cyi代表第yi类深层特征的类心。λ用于平衡两个损失函数。如果将λ设置为0,那么可以看作是这种联合监督的一个特例,表示仅用softmax损失函数。步骤五:计算联合损失并与图3中设定阈值比较,未达到要求则对联合损失求偏导计算反向传播误差,方程如下步骤六:得到误差后更新权值与深度特征类心的方程如下,且训练过程中深度特征类心的更新采用一种基于小批量训练集更新深层特征类心的训练方法。而且为了避免少量误标样本造成的大扰动,我们使用α来控制中心的学习率。计算Lc对xi的梯度和的Cyi更新方程:其中如果条件满足则δ(条件)=1,如果不满足则δ(条件)=0。α在[0,1]范围内。之后则如图3所示,循环进行权值以及类心调整如以下方程,直到达到要求后输出损失函数计算结果。步骤七:网络测试。为了验证本专利技术方法的有效性,在自建测试集中验证本专利技术提出算法对于噪声、模糊、遮挡三种异常情况的鲁棒性,通过前向传播算法预测遥感飞机识别结果。附图说明图1:基于密集卷积神经网络的联合监督飞机识别方法训练过程图图2:密集卷积神经网络结构示意图图3:结合softmax损失函数与中心损失的联合监督算法流程图本专利技术与现有技术相比具有的优点或积极效果:1、密集卷积神经网络的优势:它比传统卷积网络需要更少的参数,因为不需要重新学习冗余特征图,相同卷积层数情况下训练速度更快且识别精度较高。密集卷积网络明确区分了添加到网络的信息和保留的信息,它是通过特征重用来利用网络的潜力,产生易于训练和高度参数化的精简模型。2、联合监督的优势:通过联合监督在softmax损失函数基础上根据中心损失公式最小化深度特征与深度特征类心距离,惩罚距离深度特征类心远的特征。从而有效地将同一类的深层特征拉到了其深度特征类心附近。通过联合监督,不仅扩大了五类遥感飞机之间特征差异,而且减少了每类飞机的类内特征变化,因此通过联合监督能提高密集卷积网络的判别能力,提高识别准确率。具体实施方式:步骤一:将密集卷积神经网络结构在自建遥感飞机数据库上训练,训练样本为五类遥感飞机图像,并且经过旋转、加噪声、加不同程度遮挡以及不同像素运动模糊的预处理。密集卷积神经网络结构如图2所示,网络第一层卷积层;之后是最大池化层P1;随后是网络的核心部分密集连接的3个密集块D1、D2、D3,每个密集块中包含两个卷积层;且密集块之间使用过渡层T1、T2降低输出维数;再是池化层P2以及全连接层F;最后使用联合监督方法输出识别结果。步骤二:初始化参数设置,网络训练中学习率lr设置在0.009~0.02范围内,batchsize设置为ξ,也就是每训练ξ个样本就调整一次权值。本专利技术采用的联合监督就是将softmax损失函数与中心损失函数加权求和,并且用λ平衡两个损失函数,α控制中心的学习率,λ设置在0.008~0.03范围内,α设置在0.2~0.5范围内。步骤三:如图2所示首先将一张178×178像素的遥感图像经过第一个卷积层得到16个89×89的特征图;随后经过最大池化P1得到16个46×46的特征图;其次经过本文档来自技高网...

【技术保护点】
1.一种基于密集卷积神经网络的联合监督遥感飞机识别方法,其特征在于包括以下步骤:步骤一:将密集卷积神经网络结构在自建遥感飞机数据库上训练,训练样本为十类遥感飞机图像,并且经过旋转、加噪声、加不同程度遮挡以及不同像素运动模糊的预处理;网络第一层是卷积层,之后是最大池化层,随后是网络的核心部分密集连接的3个密集块,每个密集块中包含两个卷积层,且密集块之间使用过渡层降低输出维数,再是池化层以及全连接层,最后使用联合监督方法输出识别结果;步骤二:初始化参数设置,网络训练中学习率lr设置在0.009~0.02范围内,batchsize设置为ξ,也就是每训练ξ个样本就调整一次权值,本专利技术采用的联合监督就是将softmax损失函数与中心损失函数加权求和,并且用λ平衡两个损失函数,α控制中心的学习率,λ设置在0.008~0.03范围内,α设置在0.2~0.5范围内;步骤三:首先将一张178×178像素的遥感图像经过第一个卷积层得到16个89×89的特征图,随后经过最大池化得到16个46×46的特征图,其次经过3个密集块后得到80个46×46的特征图,由于密集连接特性,80由16+16×4得到,然后经过包含卷积层、池化层的过渡层得到40个23×23的特征图,同理在经过14个密集块和一个过渡层后得到196个6×6特征图,最后经过平均池化层得到196个1×1的特征图送到全连接层;步骤四:将全连接层输出的1×10向量输入到联合监督的损失函数L中,如公式1,且Ls代表softmax损失函数,Lc代表中心损失函数;...

【技术特征摘要】
1.一种基于密集卷积神经网络的联合监督遥感飞机识别方法,其特征在于包括以下步骤:步骤一:将密集卷积神经网络结构在自建遥感飞机数据库上训练,训练样本为十类遥感飞机图像,并且经过旋转、加噪声、加不同程度遮挡以及不同像素运动模糊的预处理;网络第一层是卷积层,之后是最大池化层,随后是网络的核心部分密集连接的3个密集块,每个密集块中包含两个卷积层,且密集块之间使用过渡层降低输出维数,再是池化层以及全连接层,最后使用联合监督方法输出识别结果;步骤二:初始化参数设置,网络训练中学习率lr设置在0.009~0.02范围内,batchsize设置为ξ,也就是每训练ξ个样本就调整一次权值,本发明采用的联合监督就是将softmax损失函数与中心损失函数加权求和,并且用λ平衡两个损失函数,α控制中心的学习率,λ设置在0.008~0.03范围内,α设置在0.2~0.5范围内;步骤三:首先将一张178×178像素的遥感图像经过第一个卷积层得到16个89×89的特征图,随后经过最大池化得到16个46×46的特征图,其次经过3个密集块后得到80个46×46的特征图,由于密集连接特性,80由16+16×4得到,然后经过包含卷积层、池化层的过渡层得到40个23×23的特征图,同理在经过14个密集块和一个过渡层后得到196个6×6特征图,最后经过平均池化层得...

【专利技术属性】
技术研发人员:于丽刘坤于晟焘
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1