基于深度可变形卷积神经网络的SAR图像目标识别方法技术

技术编号:18896447 阅读:26 留言:0更新日期:2018-09-08 11:53
本发明专利技术公开了一种基于深度可变形卷积神经网络的SAR图像目标识别方法,主要解决现有技术目标识别速度慢,准确率低的问题,其步骤为:1)对于SAR图像目标切片数据进行数据扩增,构建目标与场景的合成图像集合,进而得到训练样本集和测试样本集;2)构建基于像素级的峰值特征模块与连通区域标记模块;3)构建深度可变形卷积神经网络并对其进行训练;4)依据得到的峰值图像标记结果,画出目标检测结果图,将目标送入网络,得到输出的分类标签,完成SAR图像目标识别。本发明专利技术利用多层网络结构提取输入图像的特征,提高了SAR目标识别中检测速度和识别准确率,可用于遥感目标的目标检测、目标识别和侦查监视。

SAR image target recognition method based on deep deformable convolution neural network

The invention discloses a target recognition method for SAR image based on depth deformable convolution neural network, which mainly solves the problems of slow speed and low accuracy of target recognition in the prior art. The steps are as follows: 1) data amplification of target slice data of SAR image, construction of synthetic image set of target and scene, and then training. Training sample set and test sample set; 2) Constructing peak feature module and connected area labeling module based on pixel level; 3) Constructing depth deformable convolution neural network and training it; 4) Drawing the target detection result graph according to the result of peak image labeling, sending the target into the network, getting the output classification label. SAR image target recognition is completed. The invention uses multi-layer network structure to extract the characteristics of input image, improves the detection speed and recognition accuracy in SAR target recognition, and can be used for remote sensing target detection, target recognition and reconnaissance monitoring.

【技术实现步骤摘要】
基于深度可变形卷积神经网络的SAR图像目标识别方法
本专利技术属于遥感图像处理领域,特别涉及一种SAR图像目标检测与识别方法,可用于遥感目标的目标检测、目标识别和侦查监视。
技术介绍
机载和星载合成孔径雷达SAR可以在全天候的白天和夜间条件下运行,并且可以完成获得高分辨率图像和目标信息,获取大面积数据的任务。SAR图像同时包含形状和散射信息,可以很好地表示物体,因此特别适用于目标识别、侦查、监视等任务中。由于其散射/成像机制和散斑,SAR图像的解译与理解同视觉图像存在很大差异,通过人眼搜索大规模SAR图像中的小目标通常是耗时且不切实际的。MIT林肯实验室将SAR图像的自动目标识别ATR标准体系结构划分为三个阶段:检测、判别和分类。检测使用恒虚警率CFAR检测器从SAR图像中提取候选目标;其结果中可能不仅包含坦克、装甲车、导弹发射装置等目标,还可能包含建筑物、树木、桥梁等虚假警报杂物。在判别阶段,选择合适的特征训练鉴别器来消除误报问题;最后,分类器被用来将每个输入分类为特定的目标类型,目前的三种主流模式为:模板匹配、基于模型的方法和机器学习。基于模型的方法通过对另一个子空间的对象表示以获取区分性特征,而模板匹配法则使用不同的分类规则。这些传统算法忽略了人类学习系统,即通过识别信息来学习对象的分层表示。与人类学习系统多层结构相同的深度学习已经被引入到各个领域,然而对于SAR图像而言,由于其用于针对特定目标学习深层结构的SAR图像数量非常有限,导致将深度卷积网络直接应用会导致严重过拟合,且卷积神经网络对于几何变换的模拟能力十分有限。例如,Chen等人在2016年《IEEETRANSACTIONSONGEOSCIENCEANDREMOTESENSING》上发表了一篇题为“TargetClassificationUsingtheDeepConvolutionalNetworksforSARImages”的文章,公开了一种基于深度卷积神经网络的SAR图像目标识别方法,利用五层卷积层结构实现SAR图像目标识别。该方法在对SAR图像进行预测时未考虑网络的过拟合情况,对数据几何变换的模拟能力不强,同时存在训练参数过多的问题,导致最终目标识别在训练阶段效率偏低,识别准确率达不到理想数值。
技术实现思路
本专利技术的目的在于针对上述现有技术存在的缺陷,提出一种基于深度可变形卷积神经网络的SAR目标识别方法,以提高SAR目标识别效率和识别准确率。本专利技术的技术思路是:通过提取图像的峰值特征并经过改进,在合成的SAR目标背景图中快速寻找到目标所在位置,完成目标检测过程;通过使用可变形卷积网络对处理好的数据集进行训练及对数据偏移量的学习保证深度卷积网络的稳定性,进而提高识别准确率。其实现方案包括如下:(1)对于SAR图像目标切片数据进行数据扩增:(1a)对于俯视角为17度的数据,在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片;(1b)对于俯视角为15度的SAR图像目标切片,将每一类目标图像以中心像素点为中心,切取88×88的切片;(2)将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中,共获得50幅不同场景下的合成图像;(3)构建网络训练样本集和测试样本集:(3a)对于10类地物目标,每一类均使用2200幅经过数据扩增的俯视角为17度的目标切片图像,共计22000幅训练图像构成训练样本集,每一个训练样本均有各自的参考标签;(3b)使用5000幅经过数据扩增的俯视角为17度及2425幅俯视角为15度的目标切片图像,共计7425幅测试图像构成测试样本集,每一个测试样本均有各自的参考标签;(4)构建基于像素级的峰值特征提取模块:(4a)对SAR图像使用中值滤波器进行噪声去除,并对中值滤波后SAR图像依次进行膨胀、腐蚀、像素值归一化和阈值分割;(4b)对SAR图像进行计数滤波,并对计数滤波后的SAR图像进行膨胀处理,得到峰值特征提取模块;(5)构建连通区域标记模块:(5a)使用8连通区域判定准则,通过一次对图像的遍历,记录下每一行或列中连续的序列和标记的等价对;(5b)对标记前的峰值图像利用(5a)得到的等价对进行重新标记,完成连通区域标记模块;(6)构建一个包括7层结构的深度可变形卷积神经网络模型,即第1层为网络输入层,第2层为第一卷积层,第3层为第二卷积层,第4层为第三卷积层,第5层为第四卷积层,第6层为全局均值池化层,第7层为输出层;(7)对深度可变形卷积神经网络模型进行训练:将训练样本集与训练样本集标签作为深度可变形卷积神经网络模型的输入,对深度可变形卷积神经网络模型进行若干次迭代有监督训练,设置初始学习率为2×e-4,数据迭代次数为20;设置训练集与测试集批块的大小为25,调整深度卷积神经网络的超参数并防止过拟合,得到训练好的深度可变形卷积神经网络模型;(8)依据(5b)中得到的峰值图像标记结果,画出目标检测结果图,框出检测到的目标,将这些目标送入(7)得到的深度可变形卷积神经网络,得到输出的实际分类标签,完成SAR图像目标识别。本专利技术与现有技术相比,具有以下优点:1.本专利技术由于在可变形卷积单元中对卷积核的每个采样点位置都增加了一个偏移的变量,使得卷积核可以在当前位置附近任意采样,而不再局限于传统卷积网络中的规则格点,削弱了规则格点采样的局制,使得卷积层具有对几何变换进行建模的能力,大幅提升了SAR图像目标识别的准确率。2.本专利技术采用全局均值池化层对于众多基于神经网络的机器学习算法所使用的全连接层进行替代,使得原本数量庞大的参数得以省略,可以大大减小网络规模,避免过拟合,有效地提升了SAR图像目标识别的效率。3.本专利技术基于像素级峰值特征进行特征改进与参数设计,可以快速确定目标所在区域,且无需变换滑窗的尺度,更节约了批量处理SAR合成图像所需要的时间,方法不基于学习机制,因此省去对训练集训练的时间,大大提升了检测的效率。4.本专利技术通过在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片,对SAR图像目标切片数据实现数据扩增,可以大大增加每一类训练图像的数量,使得训练数据集得到有效扩充,有效地提升所训练出的可变形卷积网络模型稳定性。附图说明图1是本专利技术的实现流程图;图2是用本专利技术对MSTAR数据集的合成SAR图像进行目标检测的仿真图。具体实施方案以下结合附图和具体实施例,对本专利技术作进一步的详细描述。参照图1,本专利技术基于深度可变形卷积神经网络的运动目标识别方法,包括如下步骤:步骤1,对于SAR图像目标切片数据进行数据扩增。1a)对于俯视角为17度的数据:首先,随机选取一张128×128的原始目标切片,在该目标切片上随机选取(x,y)坐标点,x,y均为10到30间的随机数;然后,以(x,y)坐标点作为扩充切片的左上角坐标,向右扩增88个像素点,向下扩增88个像素点,获取88×88大小的目标切片;1b)对于俯视角为15度的SAR图像目标切片,将每一类目标图像以中心像素点为中心,切取88×88的切片。步骤2,构建目标与场景的合成图像集合。将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中,共获得50幅不同场景下的合成图像。步骤3,构建训练样本集和测试样本集。3a)对于10类本文档来自技高网
...

【技术保护点】
1.一种基于深度可变形卷积神经网络的SAR图像目标识别方法,其特征在于,包括:(1)对于SAR图像目标切片数据进行数据扩增:(1a)对于俯视角为17度的数据,在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片;(1b)对于俯视角为15度的SAR图像目标切片,将每一类目标图像以中心像素点为中心,切取88×88的切片;(2)将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中,共获得50幅不同场景下的合成图像;(3)构建网络训练样本集和测试样本集:(3a)对于10类地物目标,每一类均使用2200幅经过数据扩增的俯视角为17度的目标切片图像,共计22000幅训练图像构成训练样本集,每一个训练样本均有各自的参考标签;(3b)使用5000幅经过数据扩增的俯视角为17度及2425幅俯视角为15度的目标切片图像,共计7425幅测试图像构成测试样本集,每一个测试样本均有各自的参考标签;(4)构建基于像素级的峰值特征提取模块:(4a)对SAR图像使用中值滤波器进行噪声去除,并对中值滤波后SAR图像依次进行膨胀、腐蚀、像素值归一化和阈值分割;(4b)对SAR图像进行计数滤波,并对计数滤波后的SAR图像进行膨胀处理,得到峰值特征提取模块;(5)构建连通区域标记模块:(5a)使用8连通区域判定准则,通过一次对图像的遍历,记录下每一行或列中连续的序列和标记的等价对;(5b)对标记前的峰值图像利用(5a)得到的等价对进行重新标记,完成连通区域标记模块的构建;(6)构建一个包括7层结构的深度可变形卷积神经网络模型,即第1层为网络输入层,第2层为第一卷积层,第3层为第二卷积层,第4层为第三卷积层,第5层为第四卷积层,第6层为全局均值池化层,第7层为输出层;(7)对深度可变形卷积神经网络模型进行训练:将训练样本集与训练样本集标签作为深度可变形卷积神经网络模型的输入,对深度可变形卷积神经网络模型进行若干次迭代有监督训练,设置初始学习率为2×e‑4,数据迭代次数为20;设置训练集与测试集批块的大小为25,调整深度卷积神经网络的超参数并防止过拟合,得到训练好的深度可变形卷积神经网络模型;(8)依据(5b)中得到的峰值图像标记结果,画出目标检测结果图,框出检测到的目标,将这些目标送入(7)得到的深度可变形卷积神经网络,得到输出的实际分类标签,完成SAR图像目标识别。...

【技术特征摘要】
1.一种基于深度可变形卷积神经网络的SAR图像目标识别方法,其特征在于,包括:(1)对于SAR图像目标切片数据进行数据扩增:(1a)对于俯视角为17度的数据,在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片;(1b)对于俯视角为15度的SAR图像目标切片,将每一类目标图像以中心像素点为中心,切取88×88的切片;(2)将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中,共获得50幅不同场景下的合成图像;(3)构建网络训练样本集和测试样本集:(3a)对于10类地物目标,每一类均使用2200幅经过数据扩增的俯视角为17度的目标切片图像,共计22000幅训练图像构成训练样本集,每一个训练样本均有各自的参考标签;(3b)使用5000幅经过数据扩增的俯视角为17度及2425幅俯视角为15度的目标切片图像,共计7425幅测试图像构成测试样本集,每一个测试样本均有各自的参考标签;(4)构建基于像素级的峰值特征提取模块:(4a)对SAR图像使用中值滤波器进行噪声去除,并对中值滤波后SAR图像依次进行膨胀、腐蚀、像素值归一化和阈值分割;(4b)对SAR图像进行计数滤波,并对计数滤波后的SAR图像进行膨胀处理,得到峰值特征提取模块;(5)构建连通区域标记模块:(5a)使用8连通区域判定准则,通过一次对图像的遍历,记录下每一行或列中连续的序列和标记的等价对;(5b)对标记前的峰值图像利用(5a)得到的等价对进行重新标记,完成连通区域标记模块的构建;(6)构建一个包括7层结构的深度可变形卷积神经网络模型,即第1层为网络输入层,第2层为第一卷积层,第3层为第二卷积层,第4层为第三卷积层,第5层为第四卷积层,第6层为全局均值池化层,第7层为输出层;(7)对深度可变形卷积神经网络模型进行训练:将训练样本集与训练样本集标签作为深度可变形卷积神经网络模型的输入,对深度可变形卷积神经网络模型进行若干次迭代有监督训练,设置初始学习率为2×e-4,数据迭代次数为20;设置训练集与测试集批块的大小为25,调整深度卷积神经网络的超参数并防止过拟合,得到训练好的深度可变形卷积神经网络模型;(8)依据(5b)中得到的峰值图像标记结果,画出目标检测结果图,框出检测到的目标,将这些目标送入(7)得到的深度可变形卷积神经网络,得到输出的实际分类标签,完成SAR图像目标识别。2.根据权利要求1所述的方法,其特征在于,步骤(1a)中对于俯视角为17度的数据,在每一类128×128的原始目标切片中扩增获取8...

【专利技术属性】
技术研发人员:白静叶维健徐航李超贤张景森李晓宇焦李成侯彪
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1