引入注意力机制的小目标检测方法、装置及设备制造方法及图纸

技术编号:34883203 阅读:30 留言:0更新日期:2022-09-10 13:40
本发明专利技术公开了一种引入注意力机制的小目标检测方法、装置及设备,所述方法包括:获取输入图像;通过预设的仿初级视觉感知皮层模型对所述输入图像进行特征提取,得到第一特征图;所述预设的仿初级视觉感知皮层模型包括VOneBlock层、Conv层和特征融合层;通过预设的目标检测模型对所述第一特征图进行目标检测,得到五个不同尺寸的目标特征图;所述目标检测模型是基于Yolov5模型的改进模型,所述目标检测模型中包括CA注意力模块;对所述五个不同尺寸的目标特征图进行目标分类和坐标定位,得到目标检测结果。本发明专利技术增强了特征图上下文信息的利用效率,提高了感兴趣特征提取的效能,有效提升了对小目标的特征提取能力,提高了模型的抗干扰能力。的抗干扰能力。的抗干扰能力。

【技术实现步骤摘要】
引入注意力机制的小目标检测方法、装置及设备


[0001]本专利技术涉及目标检测
,更具体地,涉及一种引入注意力机制的小目标检测方法、装置及设备。

技术介绍

[0002]随着计算机技术的发展,出现了大量的目标检测模型,比如Faster

RCNN、SSD、CenterNet、Yolov1~Yolov5等。现有的目标检测模型在有环境噪声干扰时以及针对小目标的检测准确性较差,造成目标检测的漏检率高甚至检测失效,无法应用于存在大量小目标以及噪声干扰的应用场景。

技术实现思路

[0003]本专利技术的一个目的是提供一种用于小目标检测的新技术方案。
[0004]根据本专利技术的第一方面,提供了一种引入注意力机制的小目标检测方法,所述方法包括:
[0005]获取输入图像;
[0006]通过预设的仿初级视觉感知皮层模型对所述输入图像进行特征提取,得到第一特征图;所述预设的仿初级视觉感知皮层模型包括VOneBlock层、Conv层和特征融合层;
[0007]通过预设的目标检测模型对所述第一特征图进行目标检测,得到五个不同尺寸的目标特征图;所述目标检测模型是基于Yolov5模型的改进模型,所述目标检测模型中包括CA注意力模块;
[0008]对所述五个不同尺寸的目标特征图进行目标分类和坐标定位,得到目标检测结果。
[0009]可选地,所述预设的目标检测模型包括骨干网络和头部网络,所述骨干网络和所述头部网络中均设有所述CA注意力模块,所述通过预设的目标检测模型对所述第一特征图进行目标检测,得到五个不同尺寸的目标特征图,包括:
[0010]通过所述骨干网络对所述第一特征图进行多次尺寸压缩和特征提取,得到多个不同尺寸的骨干特征图;
[0011]将所述第一特征图和所述多个不同尺寸的骨干特征图输入所述头部网络,得到所述五个不同尺寸的目标特征图。
[0012]可选地,所述头部网络包括四个串联的FPN模块和四个特征聚合模块,所述FPN模块包括依次连接的Conv层、Upsample层、Concat层、C3层,所述CA注意力模块包括设置在所述FPN模块的C3层之后的CA注意力层、以及设置在每个特征聚合模块之后的CA注意力层,所述将所述第一特征图和所述多个不同尺寸的骨干特征图输入所述头部网络,得到所述五个不同尺寸的目标特征图,包括:
[0013]所述四个FPN模块和所述设置在每个FPN模块的C3层之后的CA注意力层根据所述多个不同尺寸的骨干特征图和所述第一特征图生成第一目标特征图;
[0014]将所述第一目标特征图、第一骨干特征图、第一FPN模块的Conv层输出的特征图输入第一特征聚合模块,所述第一特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第一特征聚合模块之后的CA注意力层对所述第一特征聚合模块输出的特征图进行感兴趣特征提取,得到第二目标特征图;
[0015]将所述第二目标特征图、第二骨干特征图、第二FPN模块的Conv层输出的特征图输入第二特征聚合模块,所述第二特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第二特征聚合模块之后的CA注意力层对所述第二特征聚合模块输出的特征图进行感兴趣特征提取,得到第三目标特征图;
[0016]将所述第三目标特征图、第三骨干特征图、第三FPN模块的Conv层输出的特征图输入第三特征聚合模块,所述第三特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第三特征聚合模块之后的CA注意力层对所述第三特征聚合模块输出的特征图进行感兴趣特征提取,得到第四目标特征图;
[0017]将所述第四目标特征图、第四骨干特征图、第四FPN模块的Conv层输出的特征图输入第四特征聚合模块,所述第四特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第四特征聚合模块之后的CA注意力层对所述第四特征聚合模块输出的特征图进行感兴趣特征提取,得到第五目标特征图。
[0018]可选地,所述所述四个FPN模块和所述设置在每个FPN模块的C3层之后的CA注意力层根据所述多个不同尺寸的特征图和所述第一特征图生成第一目标特征图,包括:
[0019]将所述第四骨干特征图和所述第三骨干特征图输入第四FPN模块,得到第四FPN模块的输出特征图;
[0020]通过设置在第四FPN模块的C3层之后的CA注意力层对第四FPN模块输出的特征图进行感兴趣特征提取,将所述设置在第四FPN模块的C3层之后的CA注意力层输出的特征图和所述第二骨干特征图输入第三FPN模块,得到第三FPN模块的输出特征图;
[0021]通过设置在第三FPN模块的C3层之后的CA注意力层对第三FPN模块输出的特征图进行感兴趣特征提取,将所述设置在第三FPN模块的C3层之后的CA注意力层输出的特征图和所述第一骨干特征图输入第二FPN模块,得到第二FPN模块的输出特征图;
[0022]通过设置在第二FPN模块的C3层之后的CA注意力层对第二FPN模块输出的特征图进行感兴趣特征提取,将所述设置在第二FPN模块的C3层之后的CA注意力层输出的特征图和所述第一特征图输入所述第一FPN模块,通过设置在第一FPN模块的C3层之后的CA注意力层对第一FPN模块输出的特征图进行感兴趣特征提取,得到第一目标特征图。
[0023]可选地,所述骨干网络包括第一Conv层、第一C3层、第二Conv层、第二C3层、第三Conv层、第三C3层、第四Conv层、第四C3层、SPP层,所述CA注意力模块包括设置在骨干网络中每个C3层之后的CA注意力层,所述通过所述骨干网络对所述第一特征图进行多次特征图尺寸压缩和特征提取,得到多个不同尺寸的骨干特征图,包括:
[0024]通过所述第一Conv层对所述第一特征图进行特征图尺寸压缩,通过所述第一C3层对压缩后的第一特征图进行特征提取,得到第一骨干特征图;
[0025]通过设置在第一C3层之后的CA注意力层对所述第一骨干特征图进行感兴趣特征提取,通过所述第二Conv层对所述设置在第一C3层之后的CA注意力层输出的特征图进行特征图尺寸压缩,通过所述第二C3层对所述第二Conv层输出的特征图进行特征提取,得到第
二骨干特征图;
[0026]通过设置在第二C3层之后的CA注意力层对所述第二骨干特征图进行感兴趣特征提取,通过所述第三Conv层对所述设置在第二C3层之后的CA注意力层输出的特征图进行特征图尺寸压缩,通过所述第三C3层对所述第三Conv层输出的特征图进行特征提取,得到第三骨干特征图;
[0027]通过设置在第三C3层之后的CA注意力层对所述第三骨干特征图进行感兴趣特征提取,通过所述第四Conv层对所述设置在第三C3层之后的CA注意力层输出的特征图进行特征图尺寸压缩,通过所述SPP层对所述第三Conv层输出的特征图进行空间信息融合,通过所述第四C3层对所述SPP层输出的特征图进行特征提取,得到第四骨干特征图。
[0028]可选地,所述通过预设的仿初级视本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种引入注意力机制的小目标检测方法,其特征在于,所述方法包括:获取输入图像;通过预设的仿初级视觉感知皮层模型对所述输入图像进行特征提取,得到第一特征图;所述预设的仿初级视觉感知皮层模型包括VOneBlock层、Conv层和特征融合层;通过预设的目标检测模型对所述第一特征图进行目标检测,得到五个不同尺寸的目标特征图;所述目标检测模型是基于Yolov5模型的改进模型,所述目标检测模型中包括CA注意力模块;对所述五个不同尺寸的目标特征图进行目标分类和坐标定位,得到目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述预设的目标检测模型包括骨干网络和头部网络,所述骨干网络和所述头部网络中均设有所述CA注意力模块,所述通过预设的目标检测模型对所述第一特征图进行目标检测,得到五个不同尺寸的目标特征图,包括:通过所述骨干网络对所述第一特征图进行多次尺寸压缩和特征提取,得到多个不同尺寸的骨干特征图;将所述第一特征图和所述多个不同尺寸的骨干特征图输入所述头部网络,得到所述五个不同尺寸的目标特征图。3.根据权利要求2所述的方法,其特征在于,所述头部网络包括四个串联的FPN模块和四个特征聚合模块,所述FPN模块包括依次连接的Conv层、Upsample层、Concat层、C3层,所述CA注意力模块包括设置在所述FPN模块的C3层之后的CA注意力层、以及设置在每个特征聚合模块之后的CA注意力层,所述将所述第一特征图和所述多个不同尺寸的骨干特征图输入所述头部网络,得到所述五个不同尺寸的目标特征图,包括:所述四个FPN模块和所述设置在每个FPN模块的C3层之后的CA注意力层根据所述多个不同尺寸的骨干特征图和所述第一特征图生成第一目标特征图;将所述第一目标特征图、第一骨干特征图、第一FPN模块的Conv层输出的特征图输入第一特征聚合模块,所述第一特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第一特征聚合模块之后的CA注意力层对所述第一特征聚合模块输出的特征图进行感兴趣特征提取,得到第二目标特征图;将所述第二目标特征图、第二骨干特征图、第二FPN模块的Conv层输出的特征图输入第二特征聚合模块,所述第二特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第二特征聚合模块之后的CA注意力层对所述第二特征聚合模块输出的特征图进行感兴趣特征提取,得到第三目标特征图;将所述第三目标特征图、第三骨干特征图、第三FPN模块的Conv层输出的特征图输入第三特征聚合模块,所述第三特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第三特征聚合模块之后的CA注意力层对所述第三特征聚合模块输出的特征图进行感兴趣特征提取,得到第四目标特征图;将所述第四目标特征图、第四骨干特征图、第四FPN模块的Conv层输出的特征图输入第四特征聚合模块,所述第四特征聚合模块对输入的多个特征图进行尺寸压缩和通道聚合,设置在第四特征聚合模块之后的CA注意力层对所述第四特征聚合模块输出的特征图进行感兴趣特征提取,得到第五目标特征图。4.根据权利要求3所述的方法,其特征在于,所述所述四个FPN模块和所述设置在每个
FPN模块的C3层之后的CA注意力层根据所述多个不同尺寸的特征图和所述第一特征图生成第一目标特征图,包括:将所述第四骨干特征图和所述第三骨干特征图输入第四FPN模块,得到第四FPN模块的输出特征图;通过设置在第四FPN模块的C3层之后的CA注意力层对第四FPN模块输出的特征图进行感兴趣特征提取,将所述设置在第四FPN模块的C3层之后的CA注意力层输出的特征图和所述第二骨干特征图输入第三FPN模块,得到第三FPN模块的输出特征图;通过设置在第三FPN模块的C3层之后的CA注意力层对第三FPN模块输出的特征图进行感兴趣特征提取,将所述设置在第三FPN模块的C3层之后的CA注意力层输出的特征图和所述第一骨干特征图输...

【专利技术属性】
技术研发人员:赵小川史津竹樊迪刘华鹏王子彻陈路豪李陈
申请(专利权)人:中国兵器工业计算机应用技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1