当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于多层神经网络的SAR图像舰船目标检测方法技术

技术编号:34018431 阅读:14 留言:0更新日期:2022-07-02 16:20
本发明专利技术公开一种基于多层神经网络的SAR图像舰船目标检测方法,包括步骤:将包含SAR图像及其所对应的舰船目标真实值的SAR图像数据集划分成训练集、验证集、测试集;对所述训练集进行预处理,包括SAR图像的尺寸标准化、数据增强和先验框聚类;使用所述验证集和所述预处理过的训练集构建一个基于多层神经网络的SAR图像舰船目标检测方法SSTD

【技术实现步骤摘要】
一种基于多层神经网络的SAR图像舰船目标检测方法


[0001]本专利技术属于SAR图像舰船目标检测
,涉及基于神经网络的SAR图像舰船目标检测方法,尤其是一种基于多层神经网络的SAR图像舰船目标检测方法。

技术介绍

[0002]SAR(Synthetic Aperture Radar),即合成孔径雷达,是一种主动式的对地观测系统,可安装在飞机、卫星、宇宙飞船等飞行平台上,全天时、全天候对地实施观测,并具有一定的地表穿透能力。因此,SAR系统在灾害监测、环境监测、海洋监测、资源勘查、农作物估产、测绘和军事等方面的应用上具有独特的优势,可发挥其他遥感手段难以发挥的作用。SAR图像是一种由合成孔径雷达通过合成孔径原理和高频电磁波对一片区域进行主动感知生成的高分辨率图像,由于SAR成像受外界影响较小,可以对一片区域进行远距离、全天候的监视。一定数量的SAR图像及其所对应的舰船目标真实值(ground truth)构成一个SAR图像数据集。SAR图像舰船目标检测(synthetic aperture radar image ship target detection)以SAR图像为单位,对SAR图像中的舰船目标进行检测,是在沿海地区进行舰船检测的重要手段。SAR图像舰船目标检测方法可以根据SAR图像数据集中的数据,挖掘出SAR图像中舰船目标的图像特征,据此对新的SAR图像进行舰船目标检测。SAR图像中非舰船目标干扰较多,因此SAR图像舰船目标检测方法依靠有效的图像特征提取和筛选能力,否则会影响SAR图像舰船目标检测的准确度(accuracy)。
[0003]SAR图像舰船目标检测准确度的小幅提升也会带来巨大的经济社会、军事效益。在日常环境下,SAR图像舰船目标检测在舰船寻找与救助、渔船监视、领土保卫、反走私及偷渡等方面发挥着重要的作用;在战场环境下,大部分现代舰船都装备了电子雷达,通过电子雷达进行SAR图像舰船目标检测并实施精确打击或者反导,能够影响战场局势,在战略和战术层面都有巨大意义。
[0004]SAR图像舰船目标检测的常用方法包括基于人为设定的目标特征检测方法与基于神经网络的深度学习检测方法。
[0005]典型的基于人为设定的目标特征检测方法是基于SIFT(Scale Invariant Feature Transform)特征的检测方法,该方法包括三个部分:区域选择、特征提取、目标分类,其中区域选择使用基于滑动窗口的物体检测方法(参见:Yanwu Xu,Dong Xu,Stephen Lin,Jiang Liu,Jun Cheng,Carol Yim

lui Cheung,Tin Aung,Tien Yin Wong:Sliding Window and Regression Based Cup Detection in Digital Fundus Images for Glaucoma Diagnosis.MICCAI(3)2011:1

8.https://doi.org/10.1007/978
‑3‑
642

23626

6_1),而滑动窗口法的无针对性导致了该方法时间复杂度高且检测精度低。
[0006]目前最先进的(state

of

the

art,SOTA)基于神经网络的深度学习预测方法之一是YOLOv4(参见:Alexey Bochkovskiy,Chien

Yao Wang,Hong

Yuan Mark Liao:YOLOv4:Optimal Speed and Accuracy of Object Detection.CoRR abs/2004.10934(2020)https://arxiv.org/abs/2004.10934)。YOLOv4可以自行学习图像特征,并进行多尺度舰船
目标检测,检测时间较快、鲁棒性强,但是该预测方法对图像特征的处理能力不足,导致其检测准确度低。
[0007]为了克服所属
中现有技术的上述不足,本专利技术拟利用基于神经网络的深度学习技术来构建SAR图像舰船目标检测方法,这样的方法具有强的图像特征处理能力,因此检测准确度高。
[0008]基于神经网络的深度学习是新一代的机器学习技术。注意力机制(attention mechanism)和卷积神经网络(convolutional neural network,CNN)均是典型的神经网络。深度学习
中的注意力机制(参见:Dzmitry Bahdanau,Kyunghyun Cho,Yoshua Bengio:Neural Machine Translation by Jointly Learning to Align and Translate.3rd International Conference on Learning Representations,ICLR 2015,May 7

9,2015,Conference Track Proceedings.http://arxiv.org/abs/1409.0473)和人类的选择性视觉注意力机制相似,可以从大量重要信息中忽略不重要的信息,筛选出少量重要信息并聚焦到这些重要信息上。卷积神经网络(参见:Yann Lecun,Leon Bottou,Yoshua Bengio,Patrick Haffner:Gradient

based learning applied to document recognition.Proceedings of the IEEE,Volume 86,Issue 11,2278

2324,Nov.1998.https://doi.org/10.1109/5.726791)是一类包含卷积计算且具有深度结构的前馈神经网络(feed

forward network),能够有效地提取数据中的特征。根据待解决的技术问题的特定需要,可以将注意力机制与卷积神经网络进行有机结合后形成特定的多层神经网络。
[0009]下面简要说明本专利技术的技术方案中采用的若干现有技术,这些现有技术只是本专利技术技术方案中的几个单项技术特征,它们与本专利技术的其他技术特征进行非显而易见的有机组合后才构成本专利技术的技术方案。
[0010]K

means聚类算法用于对SAR图像数据集中的舰船目标进行聚类以获得合适尺寸的先验框。
[0011]二维卷积(2

D convolution)、一维卷积(1

D convolution)(参见:Vincent Dumoulin,Francesco Visin:A guide to convolution arithmetic for deep learning.arXi本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多层神经网络的SAR图像舰船目标检测方法,包括下列步骤:步骤S1:将包含SAR图像及其所对应的舰船目标真实值的SAR图像数据集划分成训练集、验证集、测试集;步骤S2:对所述训练集进行预处理,包括SAR图像的尺寸标准化、数据增强和先验框聚类;步骤S3:使用所述验证集和所述预处理过的训练集构建一个基于多层神经网络的SAR图像舰船目标检测方法SSTD

MNN的初始模型;步骤S4:使用所述验证集和所述预处理过的训练集对所述SSTD

MNN的初始模型进行参数调节,得到SSTD

MNN的优化模型,并使用所述测试集评估该优化模型的检测准确度;步骤S5:利用所得SSTD

MNN的优化模型对SAR图像数据集中或实际应用中的待检测SAR图像进行舰船目标检测。2.根据权利要求1所述的方法,其特征在于,所述步骤S2进一步包括下列步骤:步骤S21:对训练集中的所有SAR图像及其舰船目标真实值的尺寸都标准化为608像素
×
608像素;步骤S22:首先为训练集中每张SAR图像随机选取训练集中其他3张SAR图像,将该4张SAR图像随机缩放后分别放置于一张空白图像的四个角以拼接成1张新的SAR图像,然后,将该SAR图像及其原4张SAR图像所对应的舰船目标真实值进行边缘处理,得到预处理后的SAR图像及其舰船目标真实值;步骤S23:对训练集中的所有舰船目标真实值进行K

means聚类后获得n个先验框,其中,超参数n取值于集合{6,9,12}中元素。3.根据权利要求1或2所述的方法,其特征在于,所述步骤S3进一步包括下列步骤:步骤S31:为所述检测方法SSTD

MNN的初始模型构建一个特征提取层,其包含以下7个子层:第1个子层包含2个二维卷积层和1个mish函数激活层,其中,2个二维卷积层的卷积核数量分别为32和64,卷积核大小分别为1
×
1和3
×
3/2,该子层的输出由下列公式定义:Output=mish(conv2(conv1(Input))),式中,Input表示该子层的输入,conv1、conv2分别表示2个二维卷积层,Output表示该子层的输出;第2个子层包含3个二维卷积层、1个mish函数激活层和1个残差网络层,其中,3个二维卷积层的卷积核数量均为32、卷积核大小均为1
×
1,残差网络层中含有2个二维卷积,它们的卷积核数量分别为32和64、卷积核大小分别为1
×
1和3
×
3;第3个子层包含3个二维卷积层、1个mish函数激活层和2个残差网络层,其中,3个二维卷积层的卷积核数量均为64、卷积核大小均为1
×
1,2个残差网络层中均含有2个二维卷积,它们的卷积核数量均为64、卷积核大小分别为1
×
1和3
×
3;第4个子层包含3个二维卷积层、1个mish函数激活层和8个残差网络层,其中,3个二维卷积层的卷积核数量均为128、卷积核大小均为1
×
1,8个残差网络层中均含有2个二维卷积,它们的卷积核数量均为128、卷积核大小分别为1
×
1和3
×
3;第5个子层包含3个二维卷积层、1个mish函数激活层和8个残差网络层,其中,3个二维卷积层的卷积核数量均为256、卷积核大小均为1
×
1,8个残差网络层中均含有2个二维卷
积,它们的卷积核数量均为256、卷积核大小分别为1
×
1和3
×
3;第6个子层包含3个二维卷积层、1个mish函数激活层和8个残差网络层,其中,3个二维卷积层的卷积核数量均为256、卷积核大小均为1
×
1,8个残差网络层中均含有2个二维卷积,它们的卷积核数量均为512、卷积核大小分别为1
×
1和3
×
3;第2个子层至第6个子层的输出均由下列公式定义:Output=mish(conv3(concat(conv1(Input),Resblock
n
(conv2(Input))))),式中,Resblock
n
表示第n子层中的残差网络层,n∈{1,2,...,6},Input表示相应子层的输入,conv1、conv2、conv3分别表示相应子层中的3个二维卷积层,concat表示连接操作,Output表示相应子层的输出;第7个子层包含3个最大池化层,它们的池化核大小分别为3
×
3、5
×
5、7
×
7,该子层的输出由下列公式定义:Output=concat(Input,maxpool1(Input),maxpool2(Input),maxpool3(Input)),式中,Input表示该子层的输入,maxpool1、maxpool2、maxpool3分别表示3个最大池化层,concat表示连接操作,Output表示该子层的输出;步骤S32:为所述检测方法SSTD

MNN的初始模型构建一个特征融合层,其包含以下5个子层:第1个子层包含4个二维卷积层,它们的卷积核数量分别为512、1024、512、256,卷积核大小分别为1
×
1、3
×
3、1
×
1、1
×
1,第1个子层的输出由下列公式定义:Output=conv1‑4(Input),式中,Input表示该子层的输入,conv1‑4表示第1个至第4个二维卷积层,Output表示该子层的输出;第2个子层包含1个上采样层、6个二维卷积层和1个外部注意力层,其中,6个二维卷积层的卷积核数量分别为256、256、512、256、512、256,卷积核大小分别为1
×
1、1
×
1、3
×
3、1
×
1、3
×
3、1
×
1,上采样层的采样倍数为4,该子层的输出由下列公式定义:Output=ea(conv2‑6(concat(upsample(Input),conv1(Output
S31
‑5)))),式中,Input表示该子层的输入,upsample表示上采样层,conv1表示第1个二维卷积层,Output
S31
‑5表示步骤S31中第5个子层的输出,concat表示连接操作,conv2‑6表示第2个至第6个二维卷积层,ea表示外部注意力层,Output表示该子层的输出;第3个子层包含1个上采样层、6个二维卷积层和1个外部注意力层,其中,6个二维卷积层的卷积核数量分别为128、128、256、128、256、128,卷积核大小分别为1
×
1、1
×
1、3
×
3、1
×
1、3
×
3、1
×
1,上采样层的采样倍数为4,该子层的输出由下列公式定义:Output=ea(conv2‑6(concat(upsamp...

【专利技术属性】
技术研发人员:许卓明施仲悦
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1