基于卷积神经网络的空中目标检测方法技术

技术编号:19934962 阅读:24 留言:0更新日期:2018-12-29 04:49
本发明专利技术公开了一种基于卷积神经网络的空中目标检测方法,旨在解决现有检测方法对空中目标的检测精度低、无法适用的技术问题。本发明专利技术包括制作空中目标图像数据集,搭建基于Caffe深度学习框架的SSD模型并对其进行池化、反卷积、级联连接的改造,使用损失函数对检测模型进行优化,采用Softmax算法对特征进行分类,然后训练得到最终用于检测空中目标的检测模型。本发明专利技术的有益技术效果在于:适用于空中目标的尺寸规格,检测精度高。

【技术实现步骤摘要】
基于卷积神经网络的空中目标检测方法
本专利技术涉及机器学习
,具体涉及一种基于卷积神经网络的空中目标检测方法。
技术介绍
随着防空武器光电跟踪的迅速发展,空中目标检测面临巨大挑战。空中目标相比地面目标所处空域背景较为简单平缓,但远处空中目标成像较小,并且容易受到光照、云雾干扰。近处的一些目标如小鸟快速灵活地机动难以捕捉,镜头晃动容易造成画面模糊失真,而且出于跟踪要求,检测速度需满足实时性。传统的目标检测算法主要有帧差法、光流法、特征匹配法、背景建模法、阈值分割法。帧差法快捷且主动性好,但只能检测静态背景中的移动物体;光流法和特征匹配法检测精度和匹配度高,但需要手动初始化目标,缺乏自主性且计算量大;背景建模法利于目标和背景的自动分割,但模型的建立和更新较为耗时,尤其是动态背景,容易对结果产生干扰;阈值分割法对背景简单的情况便捷高效,但对于复杂的背景效果并不理想。近年,随着深度学习的发展,基于卷积神经网络的深度学习在图像识别、图像检测和图像分割等领域都取得了显著成就。与传统的算法相比,避免了对图像目标的手工提取特征,能够提高模型的泛化能力。申请人于2018年1月17日提出了申请号为“2018100446701”专利技术名称为“基于神经网络的道路目标检测方法”的专利技术专利申请,上述申请基于TensorFlow框架利用常规SSD网络模型来提高检测速度,但是这种方法对小目标的检测则是通过添加不同尺寸的特征图来实现的,并不足以适应空中目标的尺寸规格。
技术实现思路
本专利技术提供一种基于卷积神经网络的空中目标检测方法以解决现有的目标检测方法不足以适应空中目标尺寸规格的技术问题。为解决上述技术问题,本专利技术采用如下技术方案:设计一种基于卷积神经网络的空中目标检测方法,包括以下步骤:步骤1、制作空中目标静态和视频图像数据集;步骤2、搭建Caffe深度学习框架,其中模型的配置利用常规SSD模型完成,并采用VGG-16网络结构对步骤1中的图像数据集进行特征提取;步骤3、采用池化、反卷积结构以及级联连接,对步骤2中的常规SSD模型进行改进;步骤4、用交叉熵代价函数作为置信度损失函数,并与预测框与真实框之间的位置损失函数进行加权求和,得到总体的损失函数进行优化;步骤5、对优化后的特征利用SoftMax算法进行分类得到检测结果。进一步的,步骤1包括以下处理:按照VOC数据集格式标准构建空中目标检测数据集;其中每张图对应一个标签,标签标明了图片名称,图片中目标的类别以及目标外接矩形的坐标和宽高;所述空中目标检测数据集包含28段、2.1万帧视频图像,以及1400张静态图像,分为鸟类、战斗机、直升机、客机四类目标。进一步的,步骤3包括以下处理:(1)通过反卷积结构来连接较低层的特征图,通过池化结构来连接上层的特征图,反卷积结构仅使用带有批量归一化的反卷积层;(2)同时执行池化和反卷积以创建不同层的特征图,每个层通过池化和/或反卷积后得到相同大小的特征图;(3)采用级联连接,将(2)中得到的相同大小的特征图连接起来。进一步的,步骤4中置信度损失函数定义为:其中:表示第i个默认框与类别为p的第j个真实框相匹配,p为目标类别种类,表示第i个默认框为类别p的置信度,进一步的,步骤4中位置损失函数定义为:其中,(cx,cy)为默认框的中心,(w)为默认框的宽,(h)为默认框的高,g表示真实框的位置,d表示默认框的位置,l表示表示默认框相对于真实框的偏移量。进一步的,步骤4中总体的目标损失函数定义为:其中:α=0.5,N为默认框的个数。与现有技术相比,本专利技术的有益技术效果在于:1.本专利技术采用的Caffe网络框架相较于TensorFlow网络结构更加简单,操作更方便。2.本专利技术采用池化和反卷积结构以及级联连接对常规SSD模型进行改进,VGG-16网络提取出的特征图每次卷积后通过池化连接到上层特征图,通过反卷积连接到下层特征图,采用级联连接将经过池化和反卷积处理后的特征图连接起来,使SSD模型可以通过共享权重统一不同层中的默认框,以此来提高SSD模型检测小目标的能力,同时也能提高检测精度。附图说明图1是本专利技术基于神经网络的空中目标检测方法的目标数据集;图2是本专利技术基于神经网络的空中目标检测方法的SSD模型结构示意图;图3是本专利技术基于神经网络的空中目标检测方法对SSD模型进行改进的示意图;图4是本专利技术基于神经网络的空中目标检测方法在改进SSD模型下空中目标检测的结果图;图5是本专利技术基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标鸟类的Precision-Recall曲线图;图6是本专利技术基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标战斗机的Precision-Recall曲线图;图7是本专利技术基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标直升机的Precision-Recall曲线图;图8是本专利技术基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标客机的Precision-Recall曲线图。具体实施方式下面结合附图和实施例来说明本专利技术的具体实施方式,但以下实施例只是用来详细说明本专利技术,并不以任何方式限制本专利技术的范围。以下实施例中所涉及或依赖的程序均为本
的常规程序或简单程序,本领域技术人员均能根据具体应用场景做出常规选择或者适应性调整。实施例1:一种基于卷积神经网络的空中目标检测方法,参见图1至图3,首先,按照VOC数据集格式标准构建空中目标数据集。数据集中每张图对应一个标签,标签标明了图片名称,图片中目标的类别以及目标外接矩形的坐标和宽高。数据集包含28段2.1万帧视频图像,以及1400张静态图像,分为鸟类(空中飞行的鸟),战斗机(军用固定翼飞机),直升机(旋翼飞机),客机(大小型客机)四类目标。数据集中大多目标处于飞行状态,背景除天空外,也包括地面和海面的场景。将上述空中目标训练集的文件夹放在基于Caffe深度学习框架的SSD模型data文件夹下,参见图2,运用多个卷积核对特征图进行多次卷积产生一系列固定大小的默认框,以及每一个框包含物体实例的可能性,常规的SSD模型一共产生38*38*4+19*19*6+10*10*6+5*5*6+3*3*4+1*1*4=8732个默认框,本实施例在VGG-16部分新增了Conv3层,使默认框个数增加至8732+75*75*4=31232个,更有利于小目标的检测。但仅通过默认框的增加对于空中目标的检测效果提升并不明显,因此,本实施例对每次卷积后产生特征图进行处理,具体操作如下:通过池化将较低层中的特征图连接到上层的特征图,参见图3(a),通过反卷积将上层的特征图连接到下层特征,参见图3(b),以conv9层的特征图为例,对其下层的conv8、conv7、conv4、conv3进行池化,上层的conv10、conv11进行反卷积,得到与conv9层相同大小的特征图;将下层池化和上层反卷积的特征图进行级联连接并送入softmax分类层,参见图3(c),进而得到所需的默认框。默认框进入分类层前,需要利用损失函数进行优化,上述损失函数为置信度损失函数与位置损失函数的加权和,置信度损失函数的表达式为:其中:表示第i个默认框本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的空中目标检测方法,其特征在于,包括以下步骤:步骤1、制作空中目标的图像数据集,包括训练集和测试集,其中,70%的图像为训练集,30%的图像为测试集;步骤2、搭建Caffe深度学习框架,其中模型的配置利用常规SSD模型完成,并采用VGG‑16网络进行特征提取;步骤3、采用池化、反卷积结构以及级联连接,对步骤2中的常规SSD模型进行改进;步骤4、用交叉熵代价函数作为置信度损失函数,并与预测框与真实框之间的位置损失函数进行加权求和,得到总体的损失函数进行优化;步骤5、对优化后的特征利用SoftMax算法进行分类,进而得到初步的检测模型;步骤6、利用步骤1中的训练集对步骤5所述的初步的检测模型进行训练,得到最终的检测模型;步骤7、将测试集输入步骤6中最终的训练模型,得出测试结果。

【技术特征摘要】
1.一种基于卷积神经网络的空中目标检测方法,其特征在于,包括以下步骤:步骤1、制作空中目标的图像数据集,包括训练集和测试集,其中,70%的图像为训练集,30%的图像为测试集;步骤2、搭建Caffe深度学习框架,其中模型的配置利用常规SSD模型完成,并采用VGG-16网络进行特征提取;步骤3、采用池化、反卷积结构以及级联连接,对步骤2中的常规SSD模型进行改进;步骤4、用交叉熵代价函数作为置信度损失函数,并与预测框与真实框之间的位置损失函数进行加权求和,得到总体的损失函数进行优化;步骤5、对优化后的特征利用SoftMax算法进行分类,进而得到初步的检测模型;步骤6、利用步骤1中的训练集对步骤5所述的初步的检测模型进行训练,得到最终的检测模型;步骤7、将测试集输入步骤6中最终的训练模型,得出测试结果。2.根据权利要求1所述的基于卷积神经网络的空中目标检测方法,其特征在于,所述步骤1包括以下处理:按照VOC数据集格式标准构建空中目标检测数据集;其中每张图对应一个标签,标签标明了图片名称,图片中目标的类别以及目标外接矩形的坐标和宽高。3.根据权利要求2所述的基于卷积神经网络的空中目标检测方法,其特征在于,所述空中目标检测数据集包含28段、2.1万帧...

【专利技术属性】
技术研发人员:张庆辉万晨霞卞山峰
申请(专利权)人:河南工业大学郑州艾毅电子科技有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1