【技术实现步骤摘要】
基于注意力机制的目标检测方法
[0001]本专利技术属于图像处理
,涉及图像检测,特别涉及一种基于注意力机制的目标检测方法。
技术介绍
[0002]现有的大量目标检测方法在公开数据集中获得了非常高的分数,但在现实任务中目标检测仍然存在很多挑战,像在复杂背景下对目标的检测效果较差等。例如,在实际道路上,智能驾驶系统的实时检测行人和车辆将有助于驾驶员更安全地行驶。然而,现实情况的背景却十分复杂,比如雨天和下雪天等恶劣天气会影响行人和车辆的检测,傍晚和夜间的时间对行人和车辆检测效果也较差,在高速路或者城市道路等不同的场景中对行人和车辆的检测效果也会受到影响。
[0003]在专利CN 112163580 A中公开了一种基于注意力机制的小目标检测算法。该算法在检测过程中加入了注意力机制,从而将注意力机制应用到不同通道的特征图上,增强对于识别有利的通道,抑制对于识别无用的通道。该方法首先将图像输入RPN网络,提取预选区域;将获取的区域输入FPN,提取多尺度的特征;将多尺度的特征输入注意力机制模块;在注意力机制模块中,通过两个全连接层和一个Sigmoid函数来计算特征通道的权值;将获得的特征图输入ROI Align层;根据得到的特征图,进行分类和回归,得到检测结果。此方法虽然可以提高目标检测精度,但是,该方法仍然存在的不足之处是:特征提取网络性能一般,使得添加注意力机制效果不明显,导致在实际复杂背景下的目标检测效果不佳。
[0004]Han Hu等人在其发表的论文Relation Networks for O
【技术保护点】
【技术特征摘要】
1.基于注意力机制的目标检测方法,其特征在于,包括如下步骤:步骤1,构建卷积神经网络所述卷积神经网络由特征提取模块、注意力机制模块、特征增强模块、识别和定位模块依次连接组成;所述特征提取模块用于提取待检测目标特征,所述注意力机制模块用于改变不同通道的特征权重,所述特征增强模块用于增强提取的目标特征,所述识别和定位模块用于对增强的目标特征进行识别和定位;步骤2,生成目标训练集所述目标训练集由多张含有目标的待检测图片组成,每张待检测图片中的目标均进行标注,所述标注,是标注出目标所在的每个外接矩形框的各顶点坐标和其代表的类别;步骤3,训练卷积神经网络;步骤4,利用训练完成的卷积神经网络对待检测目标进行检测;将含有待检测目标的图片输入训练好的卷积神经网络,输出对图片中待检测目标的类别和目标所在的每个外接矩形框位置的检测结果。2.根据权利要求1所述基于注意力机制的目标检测方法,其特征在于,所述特征提取模块共有9层,其结构依次为:Focus层
→
第一卷积层
→
第一CSP层
→
第二卷积层
→
第二CSP层
→
第三卷积层
→
第三CSP层
→
第四卷积层
→
池化层;设置每层参数为:将第一至第四卷积层中卷积核的个数分别设置为64,128,256,512,卷积核的大小均设置为3
×
3,步长均设置为2,且每一个卷积层均需要进行卷积操作、批归一化处理和ReLU激活函数处理;Focus层进行一次下采样和卷积操作,下采样时宽和高均降为原来的一半,通道数增加到原来的四倍,卷积操作的卷积核大小为1
×
1,步长为1;CSP层有两路操作,上路是通过卷积操作再通过残差结构,下路是一个卷积操作,将两路进行通道拼接后通过卷积操作,每次的卷积核大小均设置为3
×
3,步长均设置为2;池化层有四路,有一路是输入,另外三路的池化区域核的大小分别为5
×
5、9
×
9、13
×
13,步长均设置为2,且均采用最大池化的方式,将四路结构拼接后进行卷积操作,卷积核大小为3
×
3,步长为2。3.根据权利要求2所述基于注意力机制的目标检测方法,其特征在于,所述批归一化处理是对每一批数据进行归一化,所用的处理方法是min
‑
batch SGD;所述ReLU激活函数用于增加卷积神经网络的非线性,并克服梯度消失的问题,该函数公式为:f(x)=max(0,x)式中,x是输入的特征信息,f(x)是输出的特征信息。4.根据权利要求2或3所述基于注意力机制的目标检测方法,其特征在于,所述注意力机制模块共有3层,其结构依次为:全局平均池化层
→
权重共享的一维卷积层
→
Sigmoid激活层;将池化区域核的大小设置为2
×
2,步长设置为2;与特征提取模块的卷积层不同,权重共享的一维卷积层的卷积核大小为k,填充为k/2。5.根据权利要求4所述基于注意力机制的目标检测方法,其特征在于,所述全局平均池化层的函数为:
其中,z<...
【专利技术属性】
技术研发人员:李超,张文博,姬红兵,张靖宇,朱隽洋,
申请(专利权)人:陕西方寸积慧智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。