【技术实现步骤摘要】
一种基于特征金字塔网络和注意力机制的目标检测改进算法
本专利技术属于数字图像处理领域,涉及目标检测,特别涉及一种基于特征金字塔网络和注意力机制的目标检测改进算法。
技术介绍
目标检测的任务是找出图像中的感兴趣目标,确定它们的类别和位置,是计算机视觉领域的核心问题之一,在红外探测技术,智能视频监控,遥感影像目标检测,医疗诊断以及智能建筑中的火灾、烟雾检测中都有广泛应用。目标检测算法可以分为传统目标检测算法和基于深度学习的目标检测算法;传统目标检测算法代表算法有SIFT算法和V-J检测算法等,但该种方法时间复杂度高,且没有很好的鲁棒性。基于深度学习的目标检测算法,经典算法有R-CNN算法,FastR-CNN算法,FasterR-CNN算法,YOLO算法,SSD算法等。虽然现阶段有很多优秀的目标检测算法,但检测性能仍有很多不足,从而导致出现漏检、误检等问题。
技术实现思路
针对上述现有技术存在的缺陷或不足,本专利技术的目的在于,提供一种基于特征金字塔网络和注意力机制的目标检测改进算法。为了实现上述任务,本专利技术采取如下的技术解决方案:一种基于特征金字塔网络和注意力机制的目标检测改进算法,其特征在于,包括以下步骤:步骤1)结合特征金字塔网络的原理,对原始SSD算法中,基础网络VGG-16提取出输入图像的6个多尺度特征图,按自小而大的顺序进行特征融合;得到融合不同层的特征图,且融合后的特征图同时包含有丰富的语义信息和细节信息;其中,所述原始SSD算法中,经过基础网络VGG- ...
【技术保护点】
1.一种基于特征金字塔网络和注意力机制的目标检测改进算法,其特征在于,包括以下步骤:/n步骤1)结合特征金字塔网络的原理,对原始SSD算法中,基础网络VGG-16对输入图像提取出的6个多尺度特征图,按自小而大的顺序进行特征融合;得到融合不同层的特征图,且融合后的特征图同时包含有丰富的语义信息和细节信息;/n其中,所述原始SSD算法中,经过基础网络VGG-16对输入图像提取出的特征图尺度是从大到小依次递减的,其中底层特征图分辨率较大,含有更多细节信息,高层特征图分辨率较小,包含更多抽象的语义信息,因此,原始SSD算法将底层特征图用于对小目标进行检测,高层特征图用于对中、大目标进行检测;/n步骤2)引入通道注意力机制,对特征融合后其中拥有更加丰富的细节信息和语义信息,同时对小目标检测更加敏感的两个特征图添加注意力模型;即通过对特征图添加掩码(mask)来实现注意力机制,将感兴趣区域的特征标识出来,通过网络的不断训练,让网络学习到每一张图像中需要重点关注的感兴趣区域,抑制其他干扰区域带来的影响,从而增强算法对小目标物体的检测能力。/n
【技术特征摘要】
1.一种基于特征金字塔网络和注意力机制的目标检测改进算法,其特征在于,包括以下步骤:
步骤1)结合特征金字塔网络的原理,对原始SSD算法中,基础网络VGG-16对输入图像提取出的6个多尺度特征图,按自小而大的顺序进行特征融合;得到融合不同层的特征图,且融合后的特征图同时包含有丰富的语义信息和细节信息;
其中,所述原始SSD算法中,经过基础网络VGG-16对输入图像提取出的特征图尺度是从大到小依次递减的,其中底层特征图分辨率较大,含有更多细节信息,高层特征图分辨率较小,包含更多抽象的语义信息,因此,原始SSD算法将底层特征图用于对小目标进行检测,高层特征图用于对中、大目标进行检测;
步骤2)引入通道注意力机制,对特征融合后其中拥有更加丰富的细节信息和语义信息,同时对小目标检测更加敏感的两个特征图添加注意力模型;即通过对特征图添加掩码(mask)来实现注意力机制,将感兴趣区域的特征标识出来,通过网络的不断训练,让网络学习到每一张图像中需要重点关注的感兴趣区域,抑制其他干扰区域带来的影响,从而增强算法对小目标物体的检测能力。
2.如权利要求1所述的算法,其特征在于,步骤1)中所述输入图像尺寸为300×300,经过基础网络VGG-16后得到的用于检测的特征图尺寸分别为38×38、19×19、10×10、5×5、3×3、1×1;按特征金字塔网络的原理,对用于检测的特征图按照尺寸从小到大的顺序,依次进行特征融合,得到特征图尺寸大小仍为38×38、19×19、10×10、5×5、3×3、1×1的6个特征图。
3.如权利要求1所述的算法,其特征在于,步骤2)中对步骤1)中按特征金字塔原理融合后的特征图,添加注意力模型,因为融合过程是按照特征图尺寸从小到大的顺序进行的,因此融合后信息最丰富的特征图为(38,38),(19,19)两个特征图,这两个特征图相比其他特征图,拥有更加丰富的细节信息和语义信息,同时对小目标检测更加敏感;且为了保持算法的检测速度,减少算法的计算量,故只对融合后的(38,38),(19,19)这两个特征图添加注意力模型,目标检测算法的检测过程如下:
a)基于单阶段网络模型的目标检测,利用回归的思想,直接通过一个卷积神经网络在输入图像上回归出目标的类别及边框。首先结合特征金字塔网络的原理,对原始SSD...
【专利技术属性】
技术研发人员:王燕妮,刘祥,翟会杰,余丽仙,孙雪松,
申请(专利权)人:西安建筑科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。