基于扩大感受野的红外目标检测方法技术

技术编号:31794991 阅读:12 留言:0更新日期:2022-01-08 10:54
本发明专利技术公开了一种基于扩大感受野的红外目标检测方法,构建用于提取特征的基础网络结构;将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图;通过在低层特征分支后添加设计构建的感受野模块RFB

【技术实现步骤摘要】
基于扩大感受野的红外目标检测方法


[0001]本专利技术属于红外目标检测领域,具体涉及一种基于扩大感受野的红外目标检测方法。

技术介绍

[0002]目标检测作为计算机视觉和数字图像处理的基本问题之一,是其它许多计算机视觉任务后续处理的基础,例如实例分割、图像理解、目标跟踪等。红外系统利用红外探测器感知物体的红外辐射来获取信息,具备全天候工作、隐蔽性好、易穿透烟尘、抗噪声能力强的特点。目前,红外场景下的目标检测在自动驾驶、视频监控、军事等领域都具有重要的应用。
[0003]由于红外图像缺乏颜色和纹理信息,信噪比和对比度较低、背景噪声严重且分辨率低等缺陷,导致传统算法以手工设计的特征对红外目标进行识别的误检率较高,鲁棒性较差。近年来,基于深度学习的两阶段算法逐步提高了检测的精度,但计算量的增加也在一定程度上造成了检测速度的下降,越来越多的实际应用场景在保证一定检测精度的条件下,对检测速度的要求越来越高。两阶段检测任务可以分解为两个单阶段检测任务,第一阶段任务完成候选框生成、对候选框做背景与目标的判断以及对边界框位置做初步的回归,第二阶段任务实现对候选框最终的类别预测以及预测框最终的位置回归。单阶段检测算法在单个阶段内完成两个任务,直接对候选框预测目标所属类进行分类预测和边界框预测,因此研究基于单阶段的红外目标检测方法意义重大。

技术实现思路

[0004]有鉴于此,本专利技术的主要目的在于提供一种基于扩大感受野的红外目标检测方法。
[0005]为达到上述目的,本专利技术的技术方案是这样实现的
[0006]本专利技术实施例提供一种基于扩大感受野的红外目标检测方法,该方法为:
[0007]构建用于提取特征的基础网络结构;
[0008]将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图;
[0009]通过在低层特征分支后添加设计构建的感受野模块RFB

d与RFB

w进行处理来扩大感受野,获得语义信息丰富的低层特征图;
[0010]对所述语义信息丰富的低层特征图和高层特征图分别预测该特征图上每个网格对应的每个预测框所属的分类与边界框;
[0011]通过非极大值抑制算法合并边界框,输出整个网络最终的预测结果。
[0012]上述方案中,所述构建用于提取特征的基础网络结构,具体为:以MobileNet为基础,通过重复堆叠多个不同的深度可分离卷积模块进行构建,输入图像经过3
×
3的标准卷积层进行下采样,然后卷积前进方向上叠加13个深度可分离卷积模块DWS,深度可分离卷积
模块中,深度卷积对输入特征图的每个通道都单独使用不同的卷积核来进行特征提取,逐点卷积用来改变输出通道的数量来对信息进行跨通道整合。
[0013]上述方案中,所述将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图,具体为:将输入图像经由深度卷积模块DWS处理得到的DWS11和DWS13的输出矩阵作为图像的低层特征图;在深度卷积层DWS13后再直接添加4个额外的卷积层C14、C15、C16、C17,其中该四层每一层的输出作为图像的高层特征图。
[0014]上述方案中,所述通过在低层特征分支后添加设计构建的感受野模块RFB

d与RFB

w进行处理来扩大感受野,获得语义信息丰富的低层特征图,具体为:将低层特征图经RFB

d进行处理,获得4个分支的输出结果对应级联,并且在通道维度上进行拼接后通过RFB

w模块进行处理,获得语义信息丰富的低层特征图。
[0015]上述方案中,所述将低层特征图经RFB

d进行处理,获得4个分支的输出结果对应级联,具体为:RFB

d模块共有4个分支结构,对于上一层输入:
[0016](1)分支1经过1
×
1的卷积层产生输出;
[0017](2)分支2经过1
×
1的卷积层降低通道的维度,在卷积层后添加3
×
3空洞率为1的膨胀卷积;
[0018](3)分支3先经过1
×
1的卷积层降低通道维度,再将3
×
3的卷积层分解为级联的1
×
3和3
×
1的卷积操作,并添加3
×
3空洞率为2的膨胀卷积;
[0019](4)分支4先经过1
×
1的卷积层降低通道维度,再将5
×
5的卷积层分解为3
×
3的两个级联卷积层,并进一步分解为1
×
3和3
×
1的卷积层,并添加3
×
3空洞率为4的膨胀卷积;
[0020]将以上4个分支的输出结果对应级联,最后在通道维度上进行拼接,输入下一个RFB

w模块。
[0021]上述方案中,将通过RFB

w模块进行处理,获得语义信息丰富的低层特征图,具体为:RFB

w模块共有4个分支结构,对于上一层输入:
[0022](1)分支1经过1
×
1的卷积层产生输出;
[0023](2)分支2经过1
×
1的卷积层,并在卷积层后添加3
×
3空洞率为1的膨胀卷积;
[0024](3)分支3先经过1
×
1的卷积层降低通道维度,再将3
×
3的卷积层分解为并联的1
×
3和3
×
1的两个卷积分支,并分别在两个卷积分支后添加3
×
3空洞率为2的膨胀卷积,生成两个输出结果;
[0025](4)分支4先经过1
×
1的卷积层降低通道维度,再将5
×
5的卷积层分解为3
×
3的两个级联卷积层,进一步将其中一个分解为并联的1
×
3和3
×
1的两个卷积分支,并分别在两个卷积分支后添加3
×
3空洞率为4的膨胀卷积来扩大感受野,生成两个输出结果;
[0026]将以上4个分支的6个输出结果对应级联,最后在通道维度上进行拼接,作为语义信息丰富的低层特征图。
[0027]上述方案中,所述对所述语义信息丰富的低层特征图和高层特征图分别预测该特征图上每个网格对应的每个预测框所属的分类与边界框,具体为:将两个经扩大感受野处理的低层特征图和四个高层特征图分别输入6个检测分支,把每个检测分支分为两个1
×
1的卷积分支,一个分支通过softmax层输出每个候选框对应的类别,另一个分支通过线性回归层输出对应的边界框,对于每一个区域,分类和回归检测网络将输出6个可能所存在的目
标的位置与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于扩大感受野的红外目标检测方法,其特征在于,该方法为:构建用于提取特征的基础网络结构;将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图;通过在低层特征分支后添加设计构建的感受野模块RFB

d与RFB

w进行处理来扩大感受野,获得语义信息丰富的低层特征图;对所述语义信息丰富的低层特征图和高层特征图分别预测该特征图上每个网格对应的每个预测框所属的分类与边界框;通过非极大值抑制算法合并边界框,输出整个网络最终的预测结果。2.根据权利要求1所述的基于扩大感受野的红外目标检测方法,其特征在于,所述构建用于提取特征的基础网络结构,具体为:以MobileNet为基础,通过重复堆叠多个不同的深度可分离卷积模块进行构建,输入图像经过3
×
3的标准卷积层进行下采样,然后卷积前进方向上叠加13个深度可分离卷积模块DWS,深度可分离卷积模块中,深度卷积对输入特征图的每个通道都单独使用不同的卷积核来进行特征提取,逐点卷积用来改变输出通道的数量来对信息进行跨通道整合。3.根据权利要求1或2所述的基于扩大感受野的红外目标检测方法,其特征在于,所述将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图,具体为:将输入图像经由深度卷积模块DWS处理得到的DWS11和DWS13的输出矩阵作为图像的低层特征图;在深度卷积层DWS13后再直接添加4个额外的卷积层C14、C15、C16、C17,其中该四层每一层的输出作为图像的高层特征图。4.根据权利要求3所述的基于扩大感受野的红外目标检测方法,其特征在于,所述通过在低层特征分支后添加设计构建的感受野模块RFB

d与RFB

w进行处理来扩大感受野,获得语义信息丰富的低层特征图,具体为:将低层特征图经RFB

d进行处理,获得4个分支的输出结果对应级联,并且在通道维度上进行拼接后通过RFB

w模块进行处理,获得语义信息丰富的低层特征图。5.根据权利要求4所述的基于扩大感受野的红外目标检测方法,其特征在于,所述将低层特征图经RFB

d进行处理,获得4个分支的输出结果对应级联,具体为:RFB

d模块共有4个分支结构,对于上一层输入:(1)分支1经过1
×
1的卷积层产生输出;(2)分支2经过1
×
1的卷积层降低通道的维度,在卷积层后添加3
×
3空洞率为1的膨胀卷积;(3)分支3先经过1
×
1的卷积层降低通道维度,再将3
×
3的卷积层分解为级联的1
×
3和3
×
1的卷积操作,并添加3
×
3空洞率为2的膨胀卷积;(4)分支4先经过1
×
1的卷积层降低通道维度,再将5
×
5的卷积层分解为3
×
3的两个级联卷积层,并进一步分解为1
×
3和...

【专利技术属性】
技术研发人员:宋江鲁奇李苗青周慧鑫李欢刘国均向培张嘉嘉张喆李怡雨王瑛琨田成刘志宇白宇婷秦翰林王炳健
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1