一种大场景SAR图像细微目标检测方法技术

技术编号:21892835 阅读:36 留言:0更新日期:2019-08-17 14:52
本发明专利技术提出了一种大场景SAR图像细微目标检测方法,它是基于卷积神经网络和YOLO算法目标检测原理,将SAR图像目标检测变换成回归问题,引入残差网络结构和构建特征金字塔,利用1×1卷积核实现SAR图像目标不同特征层交互及跨尺度预测,使得神经网络更加有利于大场景SAR目标特征提取及小目标实时检测;同时使用K‑means聚类确定边界框,使得神经网络训练所需的锚点框数量更少、模型表示能力更强、任务更容易学习。本发明专利技术具有实现简单、检测效率高、检测精度高、检测速度快、适用性好,能够实现对大场景SAR图像细微目标的精确端到端检测。

A Fine Target Detection Method for Large Scene SAR Images

【技术实现步骤摘要】
一种大场景SAR图像细微目标检测方法
本专利技术属于雷达
,它特别涉及合成孔径雷达(SAR)目标检测

技术介绍
合成孔径雷达(SAR)作为一种具有全天时、全天候、信息量丰富的遥感成像技术,已成为当今对地观测的重要手段,在地形图像生成、目标探测与侦察、目标精确打击、国土资源勘查和自然灾害监测等国民经济与军事领域得到越来越广泛的应用,详见文献“刘国祥,丁晓利,陈永奇,等.极具潜力的空间对地观测新技术--合成孔径雷达干涉[J].地球科学进展,2000,15(6):734-740”。随着SAR技术不断成熟,成像分辨率不断提高,使得通过SAR图像的目标检测技术受到越来越广泛的关注。基于深度学习的目标检测技术近年来发展十分迅速。卷积神经网络作为深度学习中的一种,成为当前语音分析和图像识别领域的研究热点,详见参考文献“KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[C].InternationalConferenceonNeuralInformationProcessingSystems.2012.”。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权重的数量。该优点在网络输入是多维图像时表现更为明显,图像可直接作为网络输入,避免了传统识别算法的复杂特征提取和数据重建过程。卷积神经网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对于平移、比例缩放、倾斜或者其他形式的变形具有高度不变性,详见参考文献“LecunY,BengioY,HintonG.Deeplearning.[J].Nature,2015,521(7553):436.”。目前基于深度学习模型的主流目标检测算法,可以分成两大类:(1)两步检测算法,其将检测问题划分为两个阶段,首先产生候选区域,然后对候选区域分类(一般还需要对位置精修),这类算法的典型代表是基于候选区域的R-CNN系算法,如R-CNN,FastR-CNN,FasterR-CNN等,详见参考文献“Girshick,RossB,etal."RichFeatureHierarchiesforAccurateObjectDetectionandSemanticSegmentation."computervisionandpatternrecognition(2014):580-87.Print.”;(2)一步检测算法,其不需要候选区域阶段,直接产生物体的类别概率和位置坐标值,比较典型的算法如YOLO和SSD,详见参考文献“LiuL,OuyangW,WangX,etal.DeepLearningforGenericObjectDetection:ASurvey[J].2018.”。目标检测模型的主要性能指标是检测准确度和速度,对于准确度,目标检测要考虑物体的定位准确性,而不单单是分类准确度。一般情况下,两步算法在准确度上有优势,而一步算法在速度上有优势。不过,随着研究的发展,两类算法都在两个方面做改进。Google公司在2017年开源了TensorFlow目标检测API,详见参考网址“https://github.com/tensorflow/models/tree/master/research/object_detection”,并对主流的FasterR-CNN,R-FCN及SSD算法在MS-COCO数据集上的性能做了细致对比,详见参考文献“https://arxiv.org/pdf/1611.10012.pdf”。Facebook公司的FAIR2018年也开源了基于Caffe2的目标检测平台详见参考资料“https://github.com/facebookresearch/Detectron”,其实现了最新的MaskR-CNN,RetinaNet等检测算法,并且给出了这些算法比较结果。显然易见,准确度和速度是一对矛盾体,如何更好地平衡它们一直是目标检测算法研究的一个重要方向。目前,已经发展出诸SAR图像目标检测算法。其中,经典的恒虚警CFAR检测算法以其简单、快速、实时性强的特点而被广泛应用于SAR图像目标检测,详见参考文献“戴尔燕,金亚秋.多尺度自适应恒虚警率(CFAR)自动检测与重构多方位SAR图像中不同尺度目标物[J].遥感技术与应用,2009,24(6):722-730.”。根据不同类型目标在SAR图像的表征形式,相关学者也提出了多种SAR图像目标检测方法,如,详见参考文献“张嘉峰,朱博,张鹏,等.Wishart分布情形下极化SAR图像目标CFAR检测解析方法[J].电子学报,2018(2).”。但这些现有SAR图像检测方法通常仅利用SAR图像的局部区域统计特性,一般仅能做到像素级别的检测,而且要求目标与背景有较高的对比度,在简单小场景下SAR目标检测性能较好,但在复杂大场景下SAR细微目标检测性能急剧下降。因此,可以结合深度学习的卷积神经网络模型优势,将卷积神经网络深度学习应用于复杂大场景SAR图像细微目标检测,进一步提升大场景SAR图像目标检测能力。
技术实现思路
本专利技术提出了一种大场景SAR图像细微目标检测方法。该方法基于卷积神经网络和YOLO算法目标检测原理,将SAR图像目标检测变换成回归问题,引入残差网络结构和构建特征金字塔,利用1×1卷积核实现SAR图像目标不同特征层交互及跨尺度预测,使得神经网络更加有利于大场景SAR目标特征提取及小目标实时检测;同时使用K-means聚类确定边界框,使得神经网络训练所需的锚点框数量更少、模型表示能力更强、任务更容易学习。本专利技术克服了现有技术中大场景SAR图像目标检测速度慢、准确率低、对小目标检测不敏感的问题,可以实现对大场景SAR图像细微目标的精确端到端检测。为了方便描述本专利技术的内容,首先作以下术语定义:定义1:图像金字塔图像金字塔是一种以多分辨率来解释图像的有效但概念简单的结构。应用于图像分割,机器视觉和图像压缩。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低,详见文献“冈萨雷斯,数字图像处理第三版,电子工业出版社,2011”。定义2:标准数据增强技术标准数据增强技术通过对数据集图像进行翻转、旋转、缩放、平移、增加高斯噪声、对比度变换、颜色变换等操作来扩充数据集。数据增强主要是为了减少网络的过拟合现象,通过对训练图片进行变换可以得到泛化能力更强的网络,更好的适应应用场景,详见网站“https://medium.com/nanonets/how-to-use-deep-learning-when-you-have-limited-data-part-2-data-augmentation-c26971dc8ced”。定义3:标准Darknet-53网络模型标准Darknet-53网络模型是用来提取图片特征的,作为全卷积网络本文档来自技高网
...

【技术保护点】
1.一种大场景SAR图像细微目标检测方法,其特征是它包括以下步骤:步骤1、待检测大场景SAR图像进行初始化和预处理:大场景SAR图像预处理,包括:初始化待检测的SAR图像记为X,X的维数记为N0×N0;初始化N种滑窗切片,滑窗切片维数大小分别记为

【技术特征摘要】
1.一种大场景SAR图像细微目标检测方法,其特征是它包括以下步骤:步骤1、待检测大场景SAR图像进行初始化和预处理:大场景SAR图像预处理,包括:初始化待检测的SAR图像记为X,X的维数记为N0×N0;初始化N种滑窗切片,滑窗切片维数大小分别记为将N种滑窗切片按照维数大小从小到大排序,得到一个N层图像金字塔;将待检测SAR图像中飞机、船、车、建筑、道路等待检测人造目标进行人工位置和类别标注,得到目标类别的总数记为K,目标类别的位置记为Pk=(xk,yk,wk,hk),k=1,2,…,K,其中(xk,yk)分别记为第k类目标的中心坐标,(wk,hk)分别记为第k类目标的宽和高;采用传统的标准数据增强技术对待检测SAR图像X进行数据增强,得到数据增强后的SAR图像检测数据集,记为Ω,Ω集合中图像总数量记为NΩ;初始化数据集Ω中训练集和测试集图像数量的比例,记为K1:K2;对数据集Ω中的图像按照比例K1:K2随机划分训练集和测试集,得到的训练集记为ΩK1,得到的测试集记为ΩK2;步骤2、构建和初始化卷积神经分类网络模型:采用传统的标准Darknet-53网络模型构造方法,构建和初始化标准的卷积神经分类网络模型,记为W0c,初始化网络W0c的卷积层数,记为Nc,其中卷积核大小为ci×ci,i=1,3,…,n;初始化网络W0c的残差块层数,记为其中表示第次下采样后的残差块层数;采用传统的标准通道数加倍方法,将网络W0c中池化层后卷积层的通道数加倍,记为采用传统的标准GoogLeNet网络构造方法,将网络中卷积核大小为ci×ci,i=3,…,n之间添加大小为c1×c1的卷积核,记为采用传统的标准批量归一化方法,对网络中每一个卷积层后添加批量归一化层,记为采用传统的标准Darknet-53网络构造方法,对网络添加K个类别的全连接层,记为采用标准的归一化指数函数(softmax)计算类别置信度,记为Pc;步骤3、训练卷积神经分类网络:初始化步骤2得到网络的图像批量处理大小,记为BS;初始化网络训练参数的学习率,记为LR;初始化网络训练参数的权重衰减率和动量,分别记为WDR和MO;对步骤2得到的网络模型进行随机初始化,得到初始化后网络参数,记为Woldc;采用传统的标准卷积神经分类网络Darknet训练方法,将步骤1中训练集ΩK1的图片顺序随机打乱后小批量依次通入步骤2得到的卷积神经分类网络模型采用传统标准的小批量梯度下降法,对网络中网络参数Woldc进行计算,得到计算后的网络参数,记为Wnewc;采用传统标准交叉熵损失函数计算网络的损失函数值,记为Lossoldc;采用传统的标准卷积神经分类网络Darknet方法,利用步骤1中测试集ΩK2对网络参数Wnewc进行测试,得到测试集ΩK2在Wnewc上的损失函数值,记为Lossnewc;若Lossnewc≤Lossoldc,则继续按照传统标准卷积神经分类网络Darknet训练方法继续训练网络并计算网络参数Wnewc和损失值Lossnewc;若Lossnewc≥Lossoldc,则停止训练网络输出当前模型的网络参数Wnewc,该次网络参数Wnewc即为训练得到的卷积神经分类网络的最终网络参数,记为WFc;步骤4、初始化和构建卷积神经检测网络:按照标准YOLOv3网络模型构造方法,对步骤2得到的卷积神经分类网络添加检测层,得到卷积神经检测网络,记为W0;采用步骤4.1至步骤4.4中的方法对卷积神经检测网络W0进行构建,步骤4.1至步骤4.4具体如下:步骤4.1、跨尺度预测采用标准深度学习特征金字塔构造方法对检测网络W0添加特征交互层,得到网络W0的NF层特征金字塔,特征金字塔记为Fii×Fii,ii=1,2,…,NF,其中Fii×Fii为特征金字塔第ii层的特征图;对步骤2得到的网络中特征图从下到上依次取出NF层特征图,记为Fiic×Fiic,ii=1,2,…,NF,其中Fiic×Fiic为第ii层特征图;网络W0中上采样倍数记为nFii,ii=1,2,…,nF;按照标准的特征金字塔方法,将网络W0中的Fii×Fii,ii=1,2,…,NF与Fiic×Fiic,ii=1,2,…,NF特征图和大小为(ci×ci,i=1,3...

【专利技术属性】
技术研发人员:韦顺军苏浩闫敏周泽南王琛张晓玲师君
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1