【技术实现步骤摘要】
基于注意力机制与并行空洞卷积网络的目标检测方法、系统
本专利技术涉及一种目标检测方法、系统,尤其涉及一种基于注意力机制与并行空洞卷积网络的目标检测方法、系统,属于计算机视觉
技术介绍
目标检测是计算机视觉和图像处理学科中的一大重要研究领域,包含目标分类和目标定位两个任务,是很多模式识别任务的基础。自Hinton教授提出深度学习理论,越来越多的研究学者尝试采用深度学习理念来解决目标检测问题。伴随着近些年来深度学习领域的飞速发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。基于深度学习的目标检测也取得了多项重大突破,各种经典的目标检测算法被相继提出,成为了目标检测领域的主流算法。如今目标检测技术被广泛地应用于各个领域中,比如,人脸识别、AI医疗、自动驾驶和智能视频监控等。但是目前主流的目标检测算法如R-CNN系列算法、YOLO系列算法以及SSD系列算法都存在一个问题,即对目标的尺度变化范围很敏感,对尺度变化范围较大的检测目标鲁棒性较差,尤其是对小目标的检测效果差。专利 ...
【技术保护点】
1.一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,包括以下步骤:/n提取待测目标图像信息中的高层特征,将所述高层特征中的多尺度下的多个高层特征图(1)进行融合,生成语义信息特征图(2);/n基于所述语义信息特征图(2)生成细化语义信息特征图(3);/n提取待测目标图像信息中的低层特征,将所述低层特征中的多个低层特征图(4)进行融合,生成细粒度信息特征图(5);/n将所述细化语义信息特征图(3)与细粒度信息特征图(5)通过空间注意力网络细化后生成细化细粒度信息特征图(6);/n将所述细化细粒度信息特征图(6)进行反卷积,并将所述细化细粒度信息特征图(6)与所 ...
【技术特征摘要】
1.一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,包括以下步骤:
提取待测目标图像信息中的高层特征,将所述高层特征中的多尺度下的多个高层特征图(1)进行融合,生成语义信息特征图(2);
基于所述语义信息特征图(2)生成细化语义信息特征图(3);
提取待测目标图像信息中的低层特征,将所述低层特征中的多个低层特征图(4)进行融合,生成细粒度信息特征图(5);
将所述细化语义信息特征图(3)与细粒度信息特征图(5)通过空间注意力网络细化后生成细化细粒度信息特征图(6);
将所述细化细粒度信息特征图(6)进行反卷积,并将所述细化细粒度信息特征图(6)与所述细化语义信息特征图(3)线性融合,得到含有细化细粒度信息和语义信息的细粒度语义特征图(7),将所述细粒度语义特征图(7)导入并行空洞卷积网络得到所述并行空洞卷积网络中每个分支的感受野特征图(8),对所述感受野特征图(8)进行目标检测框的分类和定位。
2.根据权利要求1所述的一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,所述待测目标的图像信息中的高层特征通过SSD算法的卷积神经网络获得。
3.根据权利要求2所述的一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,基于SSD算法,选取Conv8_2、Conv9_2和Conv10_2三个高层特征图(1),将Conv9_2和Conv10_2的两个特征图尺寸反卷积成Conv8_2的特征图尺寸大小,将反卷积后的Conv9_2和Conv10_2特征图与Conv8_2特征图沿通道方向进行堆叠,通过卷积操作进行特征融合,生成语义信息特征图(2)。
4.根据权利要求1所述的一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,所述语义信息特征图(2)通过通道注意力网络生成细化语义信息特征图(3),所述通道注意力网络包括上支路、下支路,
所述上支路将语义信息特征图(2)通过一次全局池化,再通过全连接层和Relu激活层,然后通过全连接层和Sigmoid激活层,最后得到特征向量;
所述下支路将语义信息特征图(2)作为输入;
采用所述上支路生成的所述特征向量对所述下支路输入的语义信息特征图(2)进行恒等映射沿通道方向进行加权,输出生成细化语义信息特征图(3)。
5.根据权利要求1所述的一种基于注意力机制与并行空洞卷积网络的目标检测方法,其特征在于,所述待测目标的图像信...
【专利技术属性】
技术研发人员:韩光,朱梦成,刘耀明,艾岳川,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。