一种基于U-Net的目标检测器检测小目标的方法技术

技术编号:35260517 阅读:45 留言:0更新日期:2022-10-19 10:19
本发明专利技术公开了一种基于特征增强与重建的小目标快速检测网络方法,该方法采用(UNET)作为基础架构,以逐像素的方式检测小物体。为了提高对小目标的识别精度,提出了一种亚像素卷积来丰富特征图信息并使用空洞卷积块和SE注意力机制解决小物体的尺度变化。本发明专利技术可以提高目标检测器的检测小目标性能。高目标检测器的检测小目标性能。高目标检测器的检测小目标性能。

【技术实现步骤摘要】
一种基于U

Net的目标检测器检测小目标的方法


[0001]本专利技术涉及一种基于U

Net的目标检测器检测小目标的方法,属于计算机视觉的领域。

技术介绍

[0002]随着人工智能技术发展,在无人机、航空和卫星对地观测等任务中,小目标检测成为近年来的研究热点。通常将对象的边界框与图像的重叠区域占比为0.08%到0.58%之间的目标称为小目标。因获取的有效特征信息少、特征不显著等困难,小目标检测成为未来民用和军事领域急需解决的难题。对于256*256图像来说,目标边界框大小相当于16*16到42*42像素之间。目前基于深度学习的目标检测算法对于检测小目标有几种策略:如Jakaria Rabbi应用边缘增强生成对抗网络提升遥感图像的图像质量来提高检测性能,推理时间长,无法实时检测;Mate Kisantal通过数据增强,将小目标在同一副图像中复制粘贴多次,提高特征显著的小目标的正确检测率;Guimei Cao认为网络浅层捕获主要的小目标的特征,对浅层特征加权融合来提高检测性能。
[0003]例如李娟娟等人,发表于《空军工程大学学报》2022年2月第 23卷第1期的《基于空洞卷积和特征融合的单阶段目标检测算法》的文章,针对SSD多尺度目标检测过程中存在的目标漏检和错检问题,提出了一种融入多维空洞卷积和多尺度特征融合的目标检测算法。在卷积神经网络输出的多尺度特征中,浅层具有更多的细节信息,深层具有更多的语义信息,根据这一特点,对浅层网络采用了3种多维空洞卷积的浅层特征增强模块,获得具有语义信息的特征图,将增强后的特征图进行下采样,融合不同层的特征;同时在深层网络引入通道注意力模块,对通道进行权重分配,抑制无用信息,提高目标的检测性能。虽然改善了检测性能,但仍存在无法有效利用小目标特征用于检测的问题。原因是目标检测网络最初几层虽然捕获小目标特征信息,但是经过后续多次池化,特征分类等高级语义信息快速丢失,例如32*32的小目标池化后变为1*1大小。

技术实现思路

[0004]本专利技术所要解决的技术问题在于克服现有技术的不足,提供一种基于U

Net的目标检测器检测小目标的方法。本文以快速检测小物体为目标,采用(UNET)作为基础架构,以逐像素的方式检测小物体。为了提高对小目标的识别精度,提出了一种亚像素卷积来丰富特征图信息并使用空洞卷积块和SE注意力机制解决小物体的尺度变化。在COCO数据集和SUN数据集进行验证,实验证明,本专利技术的算法能够有效地含有小目标的图像,比现有的方法具有更好的性能。
[0005]本专利技术具体采用以下技术方案解决现有方法中存在的问题:
[0006]一种基于特征增强与重建的小目标快速检测网络方法,包括以下步骤:
[0007]步骤1、获取训练图像数据与预处理;
[0008]步骤2、将步骤1中得到的训练图像数据输入建立的基于特征增强与重建的小目标
快速检测网络进行训练,其过程包括:
[0009](1)特征增强。编码器是由四个带SE注意力机制的编码块组成,在每个编码块的池化层后使用亚像素卷积恢复小物体特征细节;
[0010](2)网络底层块使用ASPP(Atrous Spatial Pyramid Pooling)模块,并对该通道添加SE注意力机制。解码器包含四个解码块;
[0011](2)U网络跨层连接的方式增强了捕捉上下文信息的能力,特别是应对物体尺度变化大的情况。且训练利用Adam优化算法对网络中的参数训练;
[0012]步骤3、基于训练后的网络,输入测试图像进行检测,得到最终的小目标检测结。
[0013]进一步地,作为本专利技术的一种优选技术方案:所述步骤1还包括对所获取训练图像数据叠加任意大小、形状的数据增强预处理步骤。
[0014]进一步地,作为本专利技术的一种优选技术方案:所述步骤2中采用的残差块均使用SE注意力机制,以学习图像的小目标特征。
[0015]进一步地,作为本专利技术的一种优选技术方案:所述步骤2中的亚像素卷积恢复小物体特征细节。
[0016]进一步地,作为本专利技术的一种优选技术方案:所述步骤2中的网络底层块使用ASPP(Atrous Spatial Pyramid Pooling)模块,并对该通道添加SE注意力机制。
[0017]进一步地,作为本专利技术的一种优选技术方案:所述步骤2中U 网络跨层连接的方式增强了捕捉上下文信息的能力,特别是应对物体尺度变化大的情况。
[0018]本专利技术采用上述技术方案,能产生如下技术效果:
[0019]1.本专利技术提供的采用(UNET)作为基础架构,以逐像素的方式检测小物体。
[0020]2.本专利技术提出了一种亚像素卷积来丰富特征图信息并使用空洞卷积块和SE注意力机制解决小物体的尺度变化,提高对小目标的识别精度,
[0021]3.实践证明,本专利技术的算法优化,能够有效地含有小目标的图像,比现有的方法具有更好的性能。
附图说明
[0022]图1为本专利技术基于特征增强与重建的小目标快速检测网络方法的原理示意图。
[0023]图2为本专利技术编码块示意图。
[0024]图3为本专利技术网络底层块示意图。
[0025]图4为本专利技术小目标特征重建过程示意图。
具体实施方式
[0026]下面结合说明书附图对本专利技术的实施方式进行描述。
[0027]本专利技术总体原理结构如图1所示,提出一个基于特征增强与重建的小目标快速检测网络,采用端到端的方式训练。本方法具体包括以下步骤:
[0028]步骤1、获取训练图像数据与预处理。
[0029]由于网络需要多次迭代训练,并且要适应各类应用情形,所以准备的训练数据量需要达到一定的量级要求。选用COCO数据集作为训练图像数据,它是用于人类视觉认知和视觉理解目的的数据集,包含许多场景类别,该数据集每个类别包含400张图像。它允许深
度学习方法使用大规模数据来训练其架构。
[0030]步骤2、网络框架如图1所示,由三个部分组成:编码器、网络底层块和解码器。编码器是由四个带SE注意力机制的编码块组成,在每个编码块的池化层后使用亚像素卷积恢复小物体特征细节;网络底层块使用ASPP(Atrous Spatial Pyramid Pooling)模块,并对该通道添加SE注意力机制。解码器包含四个解码块;U网络跨层连接的方式增强了捕捉上下文信息的能力,特别是应对物体尺度变化大的情况。
[0031]步骤21、编码器中的编码块结构示意图如图2所示。使用该结构的原因是由于小目标占图像比例为0.08%到0.58%之间,网络通道会捕捉到许多无用的特征,因此希望通过对各通道的依赖性进行建模以提高网络的表示能力,并且可以对特征进行逐通道调整,这样网络就可以学习通过全局信息来有选择性的加强包含有用信息的特征并抑制无用特征。为了增强重要特征来提升准确率,对特征通道间的相关性进行建模:第一步squeeze压缩操作,将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于U

Net的目标检测器检测小目标的方法,其特征在于,包括以下步骤:步骤1、获取训练图像数据及对数据预处理;步骤2、所述U

Net网络网络框架由三个部分组成:编码器、网络底层块和解码器;将训练图像数据输入建立的U

Net网络进行训练,进行数据特征增强,所述编码器是由编码块组成,在每个编码块的池化层后使用亚像素卷积恢复小物体特征细节;解码器包含解码块。步骤3、基于训练后的网络,输入测试图像进行检测,得到最终的小目标检测结。2.根据权利要求1所述基于特征增强与重建的小目标快速检测网络方法,其特征在于:所述数据预处理还包括对所获取训练图像数据叠加其它大小、形状的数据进行增强的步骤。3.根据权利要求1所述基于特征增强与重建的小目标快速检测网络方法,其特征在于:所述步骤2中训练图像数据包含SE编码块的残差块。4.根据权利要求1所述基于特征增强与重建的小目标快速检测网络方...

【专利技术属性】
技术研发人员:霍智勇晏天文
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1