【技术实现步骤摘要】
基于注意力机制的目标检测方法、网络、设备和存储介质
本申请涉及图像处理
,尤其涉及一种基于注意力机制的目标检测方法、网络、设备和存储介质。
技术介绍
目标检测是用于识别图像中的目标及其位置的技术,其既要使用边界框定位图像中的目标(确定目标位置),也要检测出每个目标所属的类别(图像分类)。目标检测是很多计算机视觉任务的基础,其在自动驾驶、人脸识别、行为识别和目标计数等领域有广泛的应用前景。目前主流的目标检测算法主要是基于深度学习模型,可以分为两大类:一类是one-stage检测算法。该类算法直接产生目标的类别概率和坐标位置,不需要产生候选区域。另一类是two-stage检测算法。该类算法将检测问题划分为两个阶段,首先是产生候选区域,然后基于候选区域进行分类和边框回归,得到目标的类别概率和坐标位置。上述各类目标检测模型存在的主要问题有:(1)目标定位不准确;(2)模型泛化能力(模型对新样本的适应能力)不强,导致分类错误;(3)速度较慢。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种基于注意力机制的目标检测方法、网络、设备和存储介质。第一方面,本申请提供了一种基于注意力机制的目标检测方法,包括:通过特征提取网络提取待检测图像的特征,得到第一特征图;通过区域生成网络处理所述第一特征图,得到至少一个候选区域;通过ROI池化网络处理所述第一特征图和所述至少一个候选区域,得到第二特征图,所述第二特征图包括所述至少一个候选 ...
【技术保护点】
1.一种基于注意力机制的目标检测方法,其特征在于,所述方法包括:/n通过特征提取网络提取待检测图像的特征,得到第一特征图;/n通过区域生成网络处理所述第一特征图,得到至少一个候选区域;/n通过ROI池化网络处理所述第一特征图和所述至少一个候选区域,得到第二特征图,所述第二特征图包括所述至少一个候选区域;/n通过分类网络和回归网络分别处理所述第二特征图,得到至少一个目标的类别得分和边界框信息;/n其中,所述特征提取网络、所述分类网络和所述回归网络中的至少一个包括注意力子网络;/n其中,所述注意力子网络用于:确定在先层,所述在先层为待配置注意力权重的特征图;确定临时层;基于所述在先层和所述临时层,确定注意力权重;将所述在先层和所述注意力权重进行乘积操作,实现对所述在先层增加注意力。/n
【技术特征摘要】
1.一种基于注意力机制的目标检测方法,其特征在于,所述方法包括:
通过特征提取网络提取待检测图像的特征,得到第一特征图;
通过区域生成网络处理所述第一特征图,得到至少一个候选区域;
通过ROI池化网络处理所述第一特征图和所述至少一个候选区域,得到第二特征图,所述第二特征图包括所述至少一个候选区域;
通过分类网络和回归网络分别处理所述第二特征图,得到至少一个目标的类别得分和边界框信息;
其中,所述特征提取网络、所述分类网络和所述回归网络中的至少一个包括注意力子网络;
其中,所述注意力子网络用于:确定在先层,所述在先层为待配置注意力权重的特征图;确定临时层;基于所述在先层和所述临时层,确定注意力权重;将所述在先层和所述注意力权重进行乘积操作,实现对所述在先层增加注意力。
2.根据权利要求1所述的方法,其特征在于,所述确定临时层包括:对所述在先层进行卷积操作得到临时层。
3.根据权利要求1所述的方法,其特征在于,所述特征提取网络提取得到多张尺度不同的第一特征图;
所述确定在先层包括:选择第一尺度的第一特征图为在先层;
所述确定临时层包括:选择第二尺度的第一特征图为临时层;
其中,所述第二尺度小于所述第一尺度。
4.根据权利要求1所述的方法,其特征在于,所述特征提取网络提取得到多张尺度不同的第一特征图;
所述确定在先层包括:选择任一尺度的第一特征图为在先层;
所述确定临时层包括:选择多张第一特征图,通过卷积操作将选择的多张第一特征图合并为临时层;
其中,选择的多张第一特征图的尺度均小于所述在先层的尺度。
5.根据权利要求1所述的方法,其特征在于,所述基于所述在先层和所述临时层,确定注意力权重包括:
将所述在先层和所述临时层进行相加操作;
对所述相加操作得到的特征图进行卷积操作;
对所述卷积操作得到的特征图进行激活操作,得到注意力权重。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述在先层和所述临时层,确定注意力权重之前,所述注意力子网络还用于:
将所述在先层的尺度和所述临时层的尺度进行统一,所述进行统一的方式包括:对尺度较小的层进行上采样,或者,对尺度较大的层进行下采样。
7.一种基于注意力机制的目标检测网络,其特征在于,所述网络包括:
特征提取网络、区域生成网络、ROI池化网络、分类网络和回归网络;
其中,所述特征提取网络、所述分类网络和所述回归网络中的至少一个包括注意力子网络;
其中,所述注意力子网络,用于确定在先层,所述在先层为待配置注意力权重的特征图;确定临时层;基于所述在先层...
【专利技术属性】
技术研发人员:任豪,郭钰,
申请(专利权)人:驭势科技南京有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。