一种基于多头注意力机制的抗遮挡目标检测方法及设备技术

技术编号：27032033 阅读：39 留言：0更新日期：2021-01-12 11:15

本发明专利技术涉及一种基于多头注意力机制的抗遮挡目标检测方法及设备，方法包括：将所述训练样本输送至初始模型中，通过目标提取子网络对所述训练样本中进行特征提取，以得到多个不同尺度的特征层；将各个所述特征层以特征金字塔的结构融合，通过注意力机制子网络在所述特征金字塔的每层特征层中添加多头注意力机制，以得到各层特征层的特征响应图和注意力特征图；计算出分类损失值、回归损失值和注意力损失值；计算出整体损失值，利用所述整体损失值对所述初始模型进行训练，以得到目标检测模型；利用所述目标检测模型对待检测图像进行目标检测。本发明专利技术解决了目前无法有效减少遮挡对目标检测的影响的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多头注意力机制的抗遮挡目标检测方法及设备
本专利技术涉及图像处理和计算机视觉
，尤其涉及一种基于多头注意力机制的抗遮挡目标检测方法、设备及存储介质。
技术介绍
近年来，在图像领域，卷积神经网络被广泛应用在目标检测、语义分割、行人检测等领域。自从AlexNet大幅度提升了目标检测算法的检测精度之后，Faster-RCNN又舍弃了速度较慢的SelectiveSearch算法，设计了与CNN权值共享的RPN，真正意义上实现了端对端训练。而FCN算法则是利用全卷积的ResNet替代Faster-RCNN常用的VGGNet，将特征图像上的特征点能够与原始输入图片之间构成映射关系，能提升对小目标的检测性能。SSD算法集成了Faster-RCNN算法的检测精度和YOLO算法的检测速度，将RPN网站中的锚点代替单一的网格化分割，使用多尺度特征向量对特征区域进行回归运算。FPN算法沿袭了SSD算法对于特征金字塔的构建基础，但是又将特征金字塔进行top-down连接，使不同尺度的特征图直接相互关联，提取更丰富的特征。FocalLoss提出一种全新结构RetinaNet以解决单阶段目标检测中正负样本比例严重失衡的问题。尽管在目标检测领域中，各种最佳算法在各个数据集中都展现了不俗的检测效果，但是目前的算法的检测精度都会随着遮挡程度的增加而降低，经常会出现的待检测目标之间相互重合或者背景遮住待检测目标的一部分的现象。在遮挡情况下，待检测目标的目标特征不完全，这使得常用的卷积神经网络会误将待检测目标识别为背景或者识别成相邻...

【技术保护点】
1.一种基于多头注意力机制的抗遮挡目标检测方法，其特征在于，包括如下步骤：/n获取训练样本，将所述训练样本输送至初始模型中，通过目标提取子网络对所述训练样本中进行特征提取，以得到多个不同尺度的特征层；/n将各个所述特征层以特征金字塔的结构融合，通过注意力机制子网络在所述特征金字塔的每层特征层中添加多头注意力机制，以得到各层特征层的特征响应图和注意力特征图；/n分别通过分类子网络、回归子网络和注意力特征图计算出分类损失值、回归损失值和注意力损失值；/n根据所述分类损失值、回归损失值和注意力损失值计算出整体损失值，利用所述整体损失值对所述初始模型进行训练，以得到目标检测模型；/n利用所述目标检测模型对待检测图像进行目标检测，以检测出所述待检测图像中的被遮挡目标信息。/n

【技术特征摘要】
1.一种基于多头注意力机制的抗遮挡目标检测方法，其特征在于，包括如下步骤：
获取训练样本，将所述训练样本输送至初始模型中，通过目标提取子网络对所述训练样本中进行特征提取，以得到多个不同尺度的特征层；
将各个所述特征层以特征金字塔的结构融合，通过注意力机制子网络在所述特征金字塔的每层特征层中添加多头注意力机制，以得到各层特征层的特征响应图和注意力特征图；
分别通过分类子网络、回归子网络和注意力特征图计算出分类损失值、回归损失值和注意力损失值；
根据所述分类损失值、回归损失值和注意力损失值计算出整体损失值，利用所述整体损失值对所述初始模型进行训练，以得到目标检测模型；
利用所述目标检测模型对待检测图像进行目标检测，以检测出所述待检测图像中的被遮挡目标信息。

2.根据权利要求1所述的基于多头注意力机制的抗遮挡目标检测方法，其特征在于，所述通过目标提取子网络对所述训练样本中进行特征提取，以得到多个不同尺度的特征层的方法具体为：
通过具有残差结构的RetinaNet特征提取子网络对所述训练样本进行特征提取，并通过FPN的自上而下融合方式得到多个不同尺度的特征层。

3.根据权利要求1所述的基于多头注意力机制的抗遮挡目标检测方法，其特征在于，所述多头注意力机制包含三组注意力特征层，每组注意力特征层由两层包含256个滤波器的3*3卷积层组成。

4.根据权利要求3所述的基于多头注意力机制的抗遮挡目标检测方法，其特征在于，所述注意力特征图的获取方式为：

其中，P、V、A分别表示一组注意力特征层，d为所述训练集中的图像的像素宽度。

5.根据权利要求4所述的基于多头注意力机制的抗遮挡目标检测方法，其...

【专利技术属性】
技术研发人员：石英，毛诗淼，谢长君，张晖，苏涛，
申请(专利权)人：武汉理工大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人