一种融合改进注意力机制的目标检测算法制造技术

技术编号:32968284 阅读:11 留言:0更新日期:2022-04-09 11:28
本发明专利技术公开了一种融合改进注意力机制的目标检测算法,涉及目标检测领域,解决现存技术对注意力机制与目标检测算法的适配性缺乏研究,注意力模型并不是对所有网络的性能提升都有显著的效果,并且注意力模型在网络中的融合方式也需要研究,不恰当的融合方式会显著增加模型的复杂度,给网络带来额外的开销,破坏单阶段算法的实时性优势的技术问题,本发明专利技术对CA注意力机制进行创新设计,增加了两个不同空洞率的空洞卷积并联结构,摒弃了特征在水平和垂直方向的二次划分,并对空间信息的特征提取和融合方式做出了优化和改进,扩大了模型的感受野和空间特征表达能力,优化了模型的性能,设计了一种合理且高效的融合方式。设计了一种合理且高效的融合方式。设计了一种合理且高效的融合方式。

【技术实现步骤摘要】
一种融合改进注意力机制的目标检测算法


[0001]本专利技术涉及目标检测领域,具体涉及一种融合改进注意力机制的目标检测算法。

技术介绍

[0002]作为计算机视觉的重要研究方向和关键技术,目标检测是解决场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次的视觉任务的基础。其任务是找出图像中所有感兴趣的目标,确定它们的类别和位置,目标检测算法的核心包含分类和定位两大任务。传统的目标检测方法依赖于人工设计特征,例如方向梯度直方图、尺度不变特征变换、滑动窗口和局部形变模型及其扩展,但传统方法存在滑动窗口资源消耗大、手工特征鲁棒性差等缺点。目前,主流的基于深度学习的目标检测算法主要有两大类:一类是检测过程分成两个部分的双阶段方法,例如R

CNN系列、SPP

Net;另一类是直接对目标框进行分类和回归的单阶段算法,例如YOLO系列、SSD,双阶段算法虽然能够获取较高的检测精度,但算法模型结构较大、计算流程繁琐,会占用较多的计算资源,同时推理速度较慢;与双阶段算法相比,单阶段算法流程简单,检测速度快,但是精度略低。为了解决目前目标检测任务中对于目标密度过大、目标重叠度较高以及小目标较多时场景检测精度差的问题,研究人员对目标检测算法做出了许多改进,提出了加深网络的层数、加强特征融合、优化损失函数等改进方法,但是对特征之间相关性的利用和对重要特征的增强缺乏考虑,忽略了注意力机制对网络性能改进方面的潜力。
[0003]现存技术存在的主要问题及缺陷是:
[0004]1.单阶段算法流程简单,检测速度快,但是精度略低。以YOLOv4为例,其网络结构如图1所示,由主干特征提取网络、特征融合层以及分类回归层三部分组成,结构简单,但是对主干特征提取网络输出的细节信息和颈部中的重要通道和空间信息的利用不够充分,因此检测精度有待进一步增强。但是现存技术大都基于加深网络的层数、加强特征融合、优化损失函数等常见方式对算法进行改进,对特征信息之间相关性的利用和对重要特征的增强缺乏考虑。
[0005]2.大部分注意力模型的感受野有限,容易忽略多尺度的上下文信息。以CA注意力模型为例,其网络结构如图2所示,CA将位置信息融入通道注意力中,通过两个一维的全局平均池化直接对输入进行特征编码,虽然能在一定程度上聚合当前输入的特征,但是模型的感受野有限,只能获取到当前层的局部依赖信息,并且CA对水平方向和垂直方向的特征编码沿空间维度进行拼接,提取信息后再进行分解,分解后在两个方向分别进行卷积操作,但是两个单独的卷积没有考虑到完整的邻域信息,可能会丢失一些重要关系信息。因此如果直接将其融入YOLOv4中,注意力机制对原网络特征信息的增强效果不够充分。
[0006]解决以上问题及缺陷的难度为:现存技术对注意力机制与目标检测算法的适配性缺乏研究,注意力模型并不是对所有网络的性能提升都有显著的效果,并且注意力模型在网络中的融合方式也需要研究,不恰当的融合方式会显著增加模型的复杂度,给网络带来额外的开销,破坏单阶段算法的实时性优势。因此需要对注意力机制进行创新设计使网络
性能达到最佳,并且需要提出一种合理有效的融合方式。
[0007]解决以上问题及缺陷的意义为:能在不破坏单阶段算法实时性的情况下,融入改进后的注意力机制,优化网络的性能,有效提高算法检测精度。

技术实现思路

[0008]本专利技术的目的在于:为了解决上述技术问题,提供了一种融合改进注意力机制的目标检测算法。
[0009]本专利技术采用的技术方案如下:
[0010]一种融合改进注意力机制的目标检测算法,包括以下步骤:
[0011]S1:采集原始图片制作数据集;
[0012]S2:构建网络模型;
[0013]S3:搭建实验环境,利用S1中的数据集对S2中构建的网络模型进行训练和验证,获取训练好的模型权重;
[0014]S4:利用S3得到的模型权重对算法进行评估,以及在真实场景图片上进行测试。
[0015]进一步地,所述S1中采集的图片涵盖了多种物体类别,并对图片的类别和位置信息进行标注。
[0016]进一步地,所述S2中构建网络模型是基于YOLOv4目标检测算法,在其主干特征提取网络CSPDarknrt的三个输出部分以及特征融合PANet的三个横向连接部分嵌入改进CA注意力机制,所述改进CA注意力机制称为DCA注意力机制。
[0017]进一步地,所述DCA注意力机制对输入特征的处理如下:
[0018]S21:首先对输入使用两个不同大小空洞率的空洞卷积并联以扩大模型的感受野;其中小空洞率捕获近距离信息,大空洞率关心远距离信息,设输入为x,经下式的空洞卷积处理后输出为dx:
[0019]dx=[dconv
2(x)
,dconv
5(x)
][0020]式中dconv2表示空洞率为2的小空洞卷积,dconv5表示空洞率为5的大空洞卷积,[,]表示沿维度的拼接;
[0021]S22:利用尺寸为(H,1)和(1,W)的两个全局平均池化核对空洞卷积后的特征分别沿水平方向和垂直方向进行编码得到和
[0022][0023]其中,和分别表示第c个通道的水平方向和垂直方向的特征编码,dx
c
(h,i)表示c通道中高度为h的第i个竖直张量,dx
c
(j,w)表示c通道中宽度为w的第j个水平张量,H、W为(H,1)和(1,W)池化核相应维度的数值。
[0024]S23:使用两个一维卷积分别对特征编码进行变换并将两个方向的特征映射进行合并,得到下式中的特征p:
[0025]p=Leakyrelu(BN(conv(z
h
)))
×
Leakyrelu(BN(conv(z
w
)))
[0026]其中conv()为一维卷积操作,BN()为批尺寸归一化操作,Leakyrelu()为激活函数,z
h
和z
w
分别表示水平方向和垂直方向的全通道特征编码。
[0027]S24:最后直接利用一个全局的卷积操作调整通道,通过简单但有效的加法对全文特征进行融合,得到了下式中聚合了多尺度上下文信息的输出y
c
(i,j):
[0028]y
c
(i,j)=x
c
(i,j)+conv(p
c
(i,j))
[0029]其中x
c
(i,j)为第c个通道的原始输入特征,conv(p
c
(i,j))为调整通道后的变换特征,(i,j)表示像素点坐标。
[0030]进一步地,所述S3中,在训练过程中采用欧氏距离和平均绝对误差的联合损失L指导网络训练,L的定义如下:
[0031][0032]式中L
MSE
为平均绝对误差损失,F
k
为第k个标签图,F...

【技术保护点】

【技术特征摘要】
1.一种融合改进注意力机制的目标检测算法,其特征在于,包括以下步骤:S1:采集原始图片制作数据集;S2:构建网络模型:S3:搭建实验环境,利用S1中的数据集对S2中构建的网络模型进行训练和验证,获取训练好的模型权重;S4:利用S3得到的模型权重对算法进行评估,以及在真实场景图片上进行测试。2.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S1中采集的图片涵盖了多种物体类别,并对图片的类别和位置信息进行标注。3.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S2中构建网络模型是基于YOLOv4目标检测算法,在其主干特征提取网络CSPDarknrt的三个输出部分以及特征融合PANet的三个横向连接部分嵌入改进CA注意力机制,所述改进CA注意力机制称为DCA注意力机制。4.根据权利要求2所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述DCA注意力机制对输入特征的处理如下:S21:首先对输入使用两个不同大小空洞率的空洞卷积并联以扩大模型的感受野;其中小空洞率捕获近距离信息,大空洞率关心远距离信息,设输入为x,经下式的空洞卷积处理后输出为dx:dx=[dconv
2(x)
,dconv
5(x)
]式中dconv2表示空洞率为2的小空洞卷积,dconv5表示空洞率为5的大空洞卷积,[,]表示沿维度的拼接;S22:利用尺寸为(H,1)和(1,W)的两个全局平均池化核对空洞卷积后的特征分别沿水平方向和垂直方向进行编码得到和和其中,和分别表示第c个通道的水平方向和垂直方向的特征编码,dx
c
(h,i)表示c通道中高度为h的第i个竖直张量,dx
c
(j,w)表示c通道中宽度为w的第j个水平张量,H、W为(H,1)和(1,W)池化核相应维度的数值;S23:使用两个一维卷积、批尺寸归一化和激活操作分别对特征编码进行变换并将两个方向的特征映射进行合并,得到下式中的特征p:p=Leakyrelu(BN(conv(z
h
)))
×
Leakyrelu(BN(conv(z
w
)))其中conv()为一维卷积操作,BN()为批尺寸归一化操作,Leakyrelu()为激活函数,z
...

【专利技术属性】
技术研发人员:黄进吴雪莲刘鑫杨涛汪向宇李剑波冯义从方铮
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1