一种基于差异性空间注意力机制的实时目标检测方法技术

技术编号:34464009 阅读:13 留言:0更新日期:2022-08-10 08:35
本发明专利技术公开一种基于差异性空间注意力机制的实时目标检测方法。包括:对空间注意力机制进行改进,提出了差异性空间注意力机制DSAM,通过卷积操作赋予特征图各通道不同的重要性和作用,实现了有效信息的保留和噪声信息的抑制。对Yolov4

【技术实现步骤摘要】
一种基于差异性空间注意力机制的实时目标检测方法


[0001]本专利技术属于目标检测领域,更具体的,尤其涉及一种基于差异性空间注意力机制的实时目标检测方法。

技术介绍

[0002]目标检测是计算机视觉中最重要的任务之一。自从第一个无约束的实时人脸检测方法“Viola

Jones检测器”被提出以来,目标检测技术一直在不断发展。特别是近年来,随着深度学习的发展,物体检测方法的性能得到了极大的提高,在很多领域都有广泛的应用,如交通标志检测、人机交互、医学图像分析、自然场景检测等。
[0003]基于深度学习的目标检测可以分为两类:两阶段检测和一阶段检测,前者将目标检测视为一个由粗到细的过程,后者将目标检测视为一个一步到位的过程。典型的两阶段检测器包括RCNN、SPPNet、Fast RCNN、Faster RCNN和FPN等。典型的单阶段检测器包括Yolo系列、SSD、RetinaNet等。两级检测器和一级检测器都有复杂的网络结构和大量的参数,需要GPU(图形处理单元)进行实时目标检测。但在实际应用中,设备的计算能力和内存是有限的。因此,人们提出了许多轻量级的目标检测方法。
[0004]轻量级目标检测方法具有更简单的网络结构和更少的参数。它们可以满足在计算能力有限的平台上进行实时目标检测的要求。典型的轻量级方法包括Squeezenet系列、MobileNet系列、ShuffleNet系列,以及Yolo

tiny系列。
[0005]然而,现有的轻量级目标检测方法精度较低,容易出现误检和漏检,引入注意力机制可以缓解这个问题。
[0006]典型的主力机制包括SENet、SAM、Non

Local和GCNet等。其中,空间注意力机制SAM经常被使用,因为它关注的是物体的位置。但SAM忽略了每个通道在特征图中的不同重要性和作用。

技术实现思路

[0007]针对现有技术的缺陷和改进需求,本专利技术提供了一种基于差异性空间注意力机制的实时目标检测方法,其目的在于保证实时性和的前提下,对于目标检测准确率与鲁棒性方面均有较大性能提升。
[0008]为实现上述目的,按照本专利技术的第一方面,提供一种差异性空间注意力机制DSAM,包括:
[0009]特征图在通道维度上通过最大池化和平均池化,得到两个特征矩阵,拼接两个特征矩阵输入到卷积层,卷积层中卷积个数和特征图的通道个数一致,卷积层输出权重矩阵,权重矩阵与特征图加权得到加权特征图。
[0010]有益效果:DSAM通过在加权过程中给这些通道分配不同的权重矩阵,使特征图的每个通道具有不同的重要性和作用,实现了对有效信息的保留和对噪声信息的抑制。
[0011]为实现上述目的,按照本专利技术的第二方面,提供一种新颖的实时目标检测模型
DSAM

Det,包括:
[0012]所述DSAM

Det包括串联的CSPDarknet53

Tiny、FPN和Yolo

head。CSPDarknet53

Tiny包括CBL、CSPBlock和Maxpooling,其中CBL表示卷积和批量归一化操作,激活函数是leaky_relu。CSPBlock包括CBL、Grouping、Concatenation和DSAM。FPN包括CBL、Upsample和Concatenation。Yolo

head包含两个卷积块。
[0013]有益效果:CSPDarknet53

Tiny提取输入图像的特征,FPN对提取的特征进行融合,Yolo

head输出结果张量。在提取特征的过程中,包含DSAM的CSPBlock可以提取输入张量的多尺度特征,提高目标检测精度。
[0014]为实现上述目的,按照本专利技术的第三方面,提供一种基于差异性空间注意力机制的实时目标检测方法,该方法包括:
[0015]采用目标检测数据集训练网络模型,训练集中样本为包含待检测目标的图片,标签为图片中目标的位置和类别,得到训练好的检测模型;将测试集的图片输入到训练好的检测模型,得到图片中目标的位置和类别。
[0016]优先地,采用以下方式构建数据集:
[0017]收集待检测目标的图片,使用labelme软件标注图片,待检测的目标标注位置和类别,生成xml文件。
[0018]优先地,使用DSAM

Det网络进行训练。
[0019]有益效果:包含DSAM模块,提取多层次和多尺度特征,有效提高目标检测的精度。
附图说明
[0020]图1是DSAM的结构图。
[0021]图2是DSAM

Det的结构图。
[0022]图3是数据集的组成示意图。
[0023]图4是本专利技术提供的模型在VOC测试集上精准率和召回率对比示意图。
[0024]图5是本专利技术提供的模型在VOC测试集上准确度和速度对比示意图。
[0025]图6是本专利技术提供的模型在VOC测试集上检测结果对比示意图。
具体实施方式
[0026]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施仅仅用于解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0027]如图2所示,本专利技术提供一种基于差异性空间注意力机制的实时目标检测方法,包括以下步骤:
[0028]步骤S1,使用PASCAL VOC数据集,该数据集来自PASCAL VOC视觉挑战赛,共20种目标类别,具体组成如图3所示。使用VOC2007和VOC2012的训练集进行训练,VOC2007的测试集进行测试。
[0029]步骤S2,对空间注意力机制进行改进,提出差异性空间注意力机制DSAM,在生成权重矩阵的过程中,使用的卷积个数等于输入特征图的通道个数,赋予特征图的每个通道具
有不同的重要性和作用,实现了对有效信息的保留和对噪声信息的抑制。
[0030]步骤S2中,对空间注意力机制进行改进的具体方法为:
[0031]S21,给定一个特征图作为输入张量:
[0032]F
in
=(f
ijk
)
H
×
W
×
C s.t.i=1,2

,H;j=1,2

,W;k=1,2

,C
[0033]其中F
in
是输入张量,(H,W,C)输入张量的形状,f
ijk
代表F
in
中点(i,j,k)的值。
[0034]S22,通过通道维度上的最大池化和平均池化,分别得到两本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于差异性空间注意力机制的实时目标检测方法,其特征在于,该方法包括:采用目标检测数据集训练DSAM

Det,训练集中样本为包含待检测目标的图片,标签为图片中目标的位置和类别,得到训练好的检测模型;将测试集的图片输入到训练好的检测模型,得到图片中目标的位置和类别。所述DSAM

Det包括串联的CSPDarknet53

Tiny、FPN和Yolo

head。CSPDarknet53

Tiny包括CBL、CSPBlock和Maxpooling,其中CBL表示卷积和批量归一化操作,激活函数是leaky_relu。CSPBlock包括CBL、Grouping、Concatenation和DSAM。FPN包括CBL、Upsample和Concatenation。Yolo

head包含两个卷积...

【专利技术属性】
技术研发人员:张康徐蔚鸿李庚隆
申请(专利权)人:长沙理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1