基于空间上下文特征金字塔的小目标检测方法技术

技术编号:41752139 阅读:24 留言:0更新日期:2024-06-21 21:36
本发明专利技术提出了一种基于空间上下文特征金字塔的小目标检测方法,其步骤如下:在空间金字塔上增加一条聚合路线构建空间上下文金字塔块模块;构建动态感知上采样模块;在基础网络Yolov5s的骨干网络之后以及颈部网络3个输出的特征图之后融合空间上下文金字塔块模块;在基础网络Yolov5s的颈部网络的前两个卷积层之后添加动态感知上采样模块,生成三个尺寸的特征图输入检测头网络,得到小目标检测模型;采用EIoU损失函数对小目标检测模型进行训练,得到训练后的小目标检测模型;将待检测的图像输入训练后的小目标检测模型,得到小目标检测结果。本发明专利技术充分提取了小目标物体的上下文特征信息,在较大的感受野中将空间信息与语义信息充分聚合,更加全面的区分小目标物体与背景信息,提高了小目标检测的检测精度。

【技术实现步骤摘要】

本专利技术涉及图像检索的,尤其涉及一种基于空间上下文特征金字塔的小目标检测方法


技术介绍

1、目标检测作为计算机视觉领域的重要组成部分,已经经过了将近20年的快速发展,在技术层面已经非常成熟。在这20年间,涌现了例如faster rcnn、yolo系列、transformer等非常优秀的目标检测方法,这些方法已经可以成熟地应用在工业界,并展现出了极高的检测效果。但针对于小目标检测性能差、精度低的问题至今仍没有被完全解决。以swin transformer为例,其在ms-coco数据集上的平均精度(ap)值已经达到61,而小目标的ap值仅仅只达到44,大目标的ap值将近是小目标ap值的1.7倍。由此可见,小目标检测问题目前依然是计算机视觉领域的一大挑战。随着深度学习的出现,计算机视觉有了很大的进步,其强大的特征提取能力为计算机视觉在复杂场景中的应用提供了可能。

2、先前的研究将小物体分为两类:一是在现实世界中物理上很小的物体(如鼠标、电话、瓶子或盘子),二是由于相机的角度或焦距而在图像中显得很小的物体。在ms-coco数据集的度量估值中,任何占本文档来自技高网...

【技术保护点】

1.一种基于空间上下文特征金字塔的小目标检测方法,其特征在于,其步骤如下:

2.根据权利要求1所述的基于空间上下文特征金字塔的小目标检测方法,其特征在于,所述聚合路线将输入的特征图经过1×1卷积核的映射处理后通过softmax层归一化处理,然后再经过1×1卷积核的映射后得到聚合的特征图,聚合的特征图与空间金字塔的路线得到的细化后的空间上下文特征图广播逐元素相乘,得到一个没有信息混淆且与输入的特征图尺寸一致的全局上下文特征图,学习输入的特征图中每个像素的空间上下文信息,并融合输入的特征图图像的局部和全局的空间特征信息。

3.根据权利要求2所述的基于空间上下文特征金字...

【技术特征摘要】

1.一种基于空间上下文特征金字塔的小目标检测方法,其特征在于,其步骤如下:

2.根据权利要求1所述的基于空间上下文特征金字塔的小目标检测方法,其特征在于,所述聚合路线将输入的特征图经过1×1卷积核的映射处理后通过softmax层归一化处理,然后再经过1×1卷积核的映射后得到聚合的特征图,聚合的特征图与空间金字塔的路线得到的细化后的空间上下文特征图广播逐元素相乘,得到一个没有信息混淆且与输入的特征图尺寸一致的全局上下文特征图,学习输入的特征图中每个像素的空间上下文信息,并融合输入的特征图图像的局部和全局的空间特征信息。

3.根据权利要求2所述的基于空间上下文特征金字塔的小目标检测方法,其特征在于,所述空间上下文金字塔块模块对输入的特征图的处理方法为:1)首先将输入的大小为h×w×c的特征图s先后经过1×1卷积核的映射处理以及softmax层提取注意力权重处理,生成大小为1×hw×1的注意图b;2)再次将特征图s经过1×1卷积核的特征映射处理得到大小为1×c’×hw的特征图d,将特征图d与注意图b批处理矩阵相乘,获得全局上下文特征图e;将全局上下文特征图e经过1×1卷积核的上下文细化处理,得到细化后的空间上下文特征图f;3)将输入的特征图s输入一个独立的聚合路径,分别经过两个1×1卷积核以及softmax层的激活函数处理,得到大小为1×h×w的特征图z;4)最终将特征图z与细化后的空间上下文特征图f广播逐元素相乘,得到最终输出结果:一个没有信息混淆且与原特征图尺寸一致的全局上下文特征图r;其中,c为特征图s的通道数,h为特征图s的高度,w为特征图s的宽度,c’表示特征图s经过特征映射处理后得到的特征图d的高度。

4.根据权利要求3所述的基于空间上下文特征金字塔的小目标检测方法,其特征在于,所述空间上下文金字塔块模块中逐像素的特征聚合为:

5.根据权利要求1-4中任意一项所述的基于空间上下文特征金字塔的小目标检测方法,其特征在于,所述采用动态卷积的方式动态地处理输入特征图生成上采样核的方法为:设输入特征图j的尺寸大小为h×w×c,其中c表示输入特征图的通道数,w、h分别表示输入特征图的宽和高;首先利用一个1×1卷积核将输入特征图j的通道数进行压缩,将通道数c压缩至cm得到大小为h×w×cm的特征图j’;将特征图j’经过参数为β的特征映射之后变为大小为βh×βw×cm的特征图j”;使用大小为k×k的重组内核对压缩后的特征图j”中每个像素位置进行特征重组操作得到大小为h×w×β^2×k^2的上采样重组核;将上采样重组核的通道维度在空间维度展开得到尺寸为βh×βw×k^2的上采样核;将得到的上采样核利用softmax层进行归一化处理,让每个上采样核的权重映射到概率分布上,使每个上采样核的概率值都在0到1之间且所有上采样核的概率之和为1,而后取其中...

【专利技术属性】
技术研发人员:李玉华张春雨张梦月许彦如黄万伟李璞张王卫
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1