一种快速舰船目标检测方法、存储介质及计算设备技术

技术编号:26304966 阅读:24 留言:0更新日期:2020-11-10 20:01
本发明专利技术公开了一种快速舰船目标检测方法、存储介质及计算设备,构建结构依次为输入层、特征提取层、特征融合层和输出层的特征金字塔全卷积网络及双分支模块,确定舰船数据集,将生成的训练集输入到构建的特征金字塔全卷积网络中,生成目标检测结果。本发明专利技术能够快速准确的将图像中的舰船检测出来;检测结果精准快速,嵌入设备要求低,在军事、民用等各个方面都有着非常高的实际应用价值。

【技术实现步骤摘要】
一种快速舰船目标检测方法、存储介质及计算设备
本专利技术属于图像处理
,具体涉及一种基于特征金字塔和区域中心矫正的快速舰船目标检测方法、存储介质及计算设备。
技术介绍
随着各国航空航天技术和传感器技术的飞速发展,人类可获取的遥感影像数据规模不断增大,影像质量不断增强。相比传统的低分辨率遥感影像,高分辨率遥感影像背景布局复杂,能够表达更多地纹理结构和空间布局等精细信息。高分辨率遥感影像中典型的地物目标为飞机、舰船和建筑等,这些目标颜色、形状等外观不尽相同,且具有方向和位置变化大等特点。高分辨率遥感影像目标检测广泛应用于军事监测,资源勘探等多个领域。如何对大数据量的高分辨率遥感影像进行目标识别已经成为遥感科学与
的重要研究内容。但高分辨率图像的语义复杂性给目标检测的研究带来了巨大的挑战,随着中国科技的日益提高,航母舰队等舰船的规模也在日益壮大,为保护国家安全、维护社会稳定,面向舰船的目标检测将在军事领域起着至关重要的作用,实时且精准的定位可以使的我国军方及时的了解到敌方舰船的动向,从而制定正确的作战计划。海上舰船作为海上检测和战时打击的重要目标,能否快速准确地识别海战场舰船目标的战术意图,为指挥员决策提供支持,极大地关系到战斗成败。这使得对于遥感影像中舰船的的检测精度与速度亟待提升。基于数据集HRSC2016,现阶段针对舰船的具有较高MAP的目标检测方法如R2CNN、RC1&RC2、RRPN、R2PN、RetinaNet-H、RRD、RetinaNet-R、RoI-Transformer、R3Det等,在改变输入图片的大小,或提高GPU性能的情况下,因其采用的主干网络(如Resnet101、Resnet50等)过深或中间处理处理过程过于繁琐,其每秒处理的图片数即帧率(FPS)均低于25。但通过实验发现,卷积层数较少的主干网络(如Resnet18、Resnet34等)的性能尚未得到充分挖掘,故通过加强训练的方法,充分挖掘主干网络的性能,使得通过卷积层较少的主干网络即可获得与深卷积网络的相似的甚至更高的性能。且由于是一阶段、主干网络较浅,故本方法在GPU为GTX1080配置下的FPS平均在48,且具有很高的MAP(88.4%)。
技术实现思路
本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于特征金字塔和区域中心矫正的快速舰船目标检测方法、存储介质及计算设备,通过强化训练分类分支、对定位分支通过拟合少量目标框,加强网络拟合能力,在浅层网络的上便可获得高性能。本专利技术采用以下技术方案:一种快速舰船目标检测方法,包括以下步骤:S1、构建结构依次为输入层、特征提取层、特征融合层和输出层的特征金字塔全卷积网络及双分支模块,输入层由Resnet模型的首个卷积层和池化层组成;特征提取层由四层卷积组成的Resnet模型,每层由多个全卷积模块串联而成;特征融合层由从Resnet的四层特征与通过两个步长为2的卷积得到的一层特征通过前层特征上采样与后层特征级联的策略融合而成;输出层由几个单卷积层串联构成,设置特征金字塔全卷积网络的参数;S2、确定舰船数据集,数据集中每张图像包含目标或背景,原始数据集中每张图像的标签有所有目标的类别及目标框的表示参数;将每张图像调整大小为512*512,再将每个像素点除以255进行归一化后,再通过减均值除以标准差进行标准化后处理为训练集;通过图像的目标框标签生成大小为128*128*1的分割掩码图1,框内像素点值为1,框外像素点值为0;通过图像的目标框标签生成大小为128*128*1的分割掩码图2,框内由目标中心向框内边界的像素点的值为由1到0,框外像素点值为0;通过图像的目标框标签生成大小为128*128*5的目标标签信息,框内的每个点的5个通道分别为中心点的x轴坐标、中心点的y轴坐标、目标的宽、目标的高、目标与x轴负方向的偏转角;S3、将步骤S2生成的训练集输入到步骤S1构建的特征金字塔全卷积网络中,将从分类分支第一个通道输出的特征图作为网络预测的分割掩码图,取大于设定阈值的点作为可信点,分支第二个通道输出的特征图的每个像素点值将作为定位分支对应点5个通道所对应预测框的分数,从定位分支输出的特征图的第一、二、三、四、五个通道作为网络预测的目标框,第七、八个通道用于目标的中心矫正,每个通道输出的特征与对应标签通过对应的损失函数生成损失值从而更新网络;使用Adam优化算法,迭代地更新网络权重值,直到损失函数收敛,训练特征金字塔全卷积网络及双分支模块;S4、生成目标检测结果。具体的,步骤S1中,Resnet模型中四层多个串联全卷积模块中,有两种全卷积模块,第一种全卷积模块名为BasicBlock,BasicBlock中第一和第二个卷积的卷积核大小为3×3个像素,第三个降采样卷积的卷积核大小为1×1个像素,第一和第三个卷积的步长在第二、三、四层为2×2个像素;第二个卷积的步长为1×1个像素;第二种全卷积模块名为Bottleneck,Bottleneck的第二个卷积的卷积核大小为3×3个像素,第一、第三和第四个卷积的卷积核大小为1×1个像素,第一和第三个卷积的步长为1×1个像素,第二和第四个卷积的步长在第二、三、四层为2×2个像素。具体的,步骤S1中,输入层与特征提取层与Resnet模型相同;对从特征提取层获取的四层特征进行卷积的卷积核均设置为:核大小为1×1个像素,步长为1×1个像素、输出通道数为64;对图像进行卷积的两个步长为2的卷积参数均设置为:核大小为3×3个像素,步长为2×2个像素、填充为1×1个像素,输出通道数为64;特征融合层中,对前三个级联的多层特征进行卷积的卷积核参数均设置为:核大小为3×3个像素,步长为1×1个像素,填充为1×1个像素,输出通道数为64;输出层中,对最后一个级联的多层特征进行卷积的卷积核设置为:核大小为3×3个像素,步长为1×1个像素,填充为1×1个像素,输出通道数为128;输出层中,对于分类分支的卷积核设置为:核大小为1×1个像素,步长为1×1个像素,输出通道数为2;输出层中,对于定位分支的卷积核设置为:核大小为1×1个像素,步长为1×1个像素,输出通道数为7;上采样方法为2倍上采样的最近邻算法。进一步的,特征提取层选择不同的全卷积模块,若选择BasicBlock,则从第一、二、三、四层提取出的特征图的通道分别为64、128、256、512;若选择Bottleneck,则从第一、二、三、四层提取出的特征图的通道分别为256、512、1024、2048。进一步的,特征融合层将由Resnet得来的四个特征由核大小为1×1、步长为1×1的卷积核卷积为64通道的特征;四个特征与由图像经由两层卷积得来的特征构成五个待融合特征,每次融合前根据每层的尺度对前一层特征进行上采样。进一步的,总损失Loss用于更新网络参数,具体为:Loss=Lossclass1+Lossclass2+Lossxywht输出层中,对于分类分支的卷积核输出的2通道,第一个通道用于生成分割掩码图本文档来自技高网
...

【技术保护点】
1.一种快速舰船目标检测方法,其特征在于,包括以下步骤:/nS1、构建结构依次为输入层、特征提取层、特征融合层和输出层的特征金字塔全卷积网络及双分支模块,输入层由Resnet模型的首个卷积层和池化层组成;特征提取层由四层卷积组成的Resnet模型,每层由多个全卷积模块串联而成;特征融合层由从Resnet的四层特征与通过两个步长为2的卷积得到的一层特征通过前层特征上采样与后层特征级联的策略融合而成;输出层由几个单卷积层串联构成,设置特征金字塔全卷积网络的参数;/nS2、确定舰船数据集,数据集中每张图像包含目标或背景,原始数据集中每张图像的标签有所有目标的类别及目标框的表示参数;调整每张图像的大小,再将每个像素点进行归一化,再通过减均值除以标准差进行标准化后处理为训练集;通过图像的目标框标签生成大小为128*128*1的分割掩码图1,框内像素点值为1,框外像素点值为0;通过图像的目标框标签生成大小为128*128*1的分割掩码图2,框内由目标中心向框内边界的像素点的值为由1到0,框外像素点值为0;通过图像的目标框标签生成大小为128*128*5的目标标签信息,框内的每个点的5个通道分别为中心点的x轴坐标、中心点的y轴坐标、目标的宽、目标的高、目标与x轴负方向的偏转角;/nS3、将步骤S2生成的训练集输入到步骤S1构建的特征金字塔全卷积网络中,将从分类分支第一个通道输出的特征图作为网络预测的分割掩码图,取大于设定阈值的点作为可信点,分支第二个通道输出的特征图的每个像素点值将作为定位分支对应点5个通道所对应预测框的分数,从定位分支输出的特征图的第一、二、三、四、五个通道作为网络预测的目标框,第七、八个通道用于目标的中心矫正,每个通道输出的特征与对应标签通过对应的损失函数生成损失值从而更新网络;使用Adam优化算法,迭代地更新网络权重值,直到损失函数收敛,训练特征金字塔全卷积网络及双分支模块;/nS4、生成目标检测结果。/n...

【技术特征摘要】
1.一种快速舰船目标检测方法,其特征在于,包括以下步骤:
S1、构建结构依次为输入层、特征提取层、特征融合层和输出层的特征金字塔全卷积网络及双分支模块,输入层由Resnet模型的首个卷积层和池化层组成;特征提取层由四层卷积组成的Resnet模型,每层由多个全卷积模块串联而成;特征融合层由从Resnet的四层特征与通过两个步长为2的卷积得到的一层特征通过前层特征上采样与后层特征级联的策略融合而成;输出层由几个单卷积层串联构成,设置特征金字塔全卷积网络的参数;
S2、确定舰船数据集,数据集中每张图像包含目标或背景,原始数据集中每张图像的标签有所有目标的类别及目标框的表示参数;调整每张图像的大小,再将每个像素点进行归一化,再通过减均值除以标准差进行标准化后处理为训练集;通过图像的目标框标签生成大小为128*128*1的分割掩码图1,框内像素点值为1,框外像素点值为0;通过图像的目标框标签生成大小为128*128*1的分割掩码图2,框内由目标中心向框内边界的像素点的值为由1到0,框外像素点值为0;通过图像的目标框标签生成大小为128*128*5的目标标签信息,框内的每个点的5个通道分别为中心点的x轴坐标、中心点的y轴坐标、目标的宽、目标的高、目标与x轴负方向的偏转角;
S3、将步骤S2生成的训练集输入到步骤S1构建的特征金字塔全卷积网络中,将从分类分支第一个通道输出的特征图作为网络预测的分割掩码图,取大于设定阈值的点作为可信点,分支第二个通道输出的特征图的每个像素点值将作为定位分支对应点5个通道所对应预测框的分数,从定位分支输出的特征图的第一、二、三、四、五个通道作为网络预测的目标框,第七、八个通道用于目标的中心矫正,每个通道输出的特征与对应标签通过对应的损失函数生成损失值从而更新网络;使用Adam优化算法,迭代地更新网络权重值,直到损失函数收敛,训练特征金字塔全卷积网络及双分支模块;
S4、生成目标检测结果。


2.根据权利要求1所述的方法,其特征在于,步骤S1中,Resnet模型中四层多个串联全卷积模块中,有两种全卷积模块,第一种全卷积模块名为BasicBlock,BasicBlock中第一和第二个卷积的卷积核大小为3×3个像素,第三个降采样卷积的卷积核大小为1×1个像素,第一和第三个卷积的步长在第二、三、四层为2×2个像素;第二个卷积的步长为1×1个像素;第二种全卷积模块名为Bottleneck,Bottleneck的第二个卷积的卷积核大小为3×3个像素,第一、第三和第四个卷积的卷积核大小为1×1个像素,第一和第三个卷积的步长为1×1个像素,第二和第四个卷积的步长在第二、三、四层为2×2个像素。


3.根据权利要求1所述的方法,其特征在于,步骤S1中,输入层与特征提取层与Resnet模型相同;对从特征提取层获取的四层特征进行卷积的卷积核均设置为:核大小为1×1个像素,步长为1×1个像素、输出通道数为64;对图像进行卷积的两个步长为2的卷积参数均设置为:核大小为3×3个像素,步长为2×2个像素、填充为1×1个像素,输出通道数为64;特征融合层中,对前三个级联的多层特征进行卷积的卷积核参数均设置为:核大小为3×3个像素,步长为1×1个像素,填充为1×1个像素,输出通道数为64;输出层中,对最后一个级联的多层特征进行卷积的卷积核设置为:核大小为3×3个像素,步长为1×1个像素,填充为1×1个像素,输出通道数为128;输出层中,对于分类分支的卷积核设置为:核大小为1×1个像素,步长为1×1个像素,输出通道数为2;输出层中,对于定位分支的卷积核设置为:核大小为1×1个像素,步长为1×1个像素,输出通道数为7;上采样方法为2倍上采样的最近邻算法。


4.根据权利要求3所述的方法,其特征在于,特征提取层选择不同的全卷积模块,若选择BasicBlock,则从第一、二、三、四层提取出的特征图的...

【专利技术属性】
技术研发人员:唐旭杨钰群马晶晶张向荣焦李成
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1