基于权重共享的多尺度自注意力目标检测方法技术

技术编号:26420046 阅读:34 留言:0更新日期:2020-11-20 14:15
本发明专利技术提供一种基于权重共享的多尺度自注意力目标检测方法。该方法由一个权重共享的多尺度卷积网络和一个视觉自注意力模块构成。此方法在一定程度上能够兼顾多尺度、注意力机制、细粒度特征提取以及模型轻量化,创新性的在多尺度卷积网络中融入残差块与膨胀卷积技术,在保证模型轻量化的同时又具备深度提取特征的能力;在多尺度卷积网络中引入视觉注意力机制,使网络能更多的注意图像中的重点区域,节约计算资源。本发明专利技术方法适应性广,鲁棒性强,可用于多种目标检测任务。通过将该方法在知名数据集上的进行实验,实验结果表明该方法在保证模型轻量化的同时具有较高的准确率,取得了73.6的平均准确率,证明了其有效性。

【技术实现步骤摘要】
基于权重共享的多尺度自注意力目标检测方法
本专利技术涉及深度学习中的计算机视觉领域,特别涉及在需要识别图中不同尺寸目标的复杂情况下提取细粒度特征的方法,具体为一种基于权重共享的多尺度自注意力目标检测网络。
技术介绍
目标检测一直是计算机视觉领域的研究热点,它可以应用在许多领域中。随着计算机视觉领域的不断发展,对目标检测的要求也越来越高。传统的目标检测网络使用单一的卷积神经网络模型进行特征提取,如今这些方法仍然被广泛使用。对图片进行图片特征提取是为了得到图片中的信息特征,从而将图像中的像素点分为不同的点、曲线或者连续的区域等类别,最终通过神经网络输出该像素对应的特征类别。因此特征提取本质上是来检查每个像素以及确定改像素是否代表为一个特征。除此之外,特征提取的“可重复性”使得网路能够根据某一共同图像特征识别不同的物体。经过计算机图像领域的长期发展,产生了大量的特征提取方法。在目标检测任务中,使用模型进行特征提取是第一步,它的好坏直接影响着后续的步骤在传统算法下,这种特征提取分类模型通常存在一个统一的问题,仅适用于一种情况。然而,在现实世界中本文档来自技高网...

【技术保护点】
1.一种基于权重共享的多尺度自注意力目标检测方法,其特征在于包含以下步骤:/n步骤1:构建深度学习网络,该网络包括用于提取不同尺寸目标特征的基于权重共享机制的自注意力多尺度卷积网络模块,以及用于精确物体定位的丰富特征层次结构,网络搭建步骤如下:/n步骤1.1:首先构造一个具有权重共享性质的三通道多尺度卷积网络,进入每个通道前有一个1×1的卷积操作,三个通道的卷积核大小分别为1×1,3×3,5×5;/n步骤1.2:把用于1×1,3×3,5×5卷积核的卷积操作分别做拆分,将每次卷积拆分成两次卷积,1×1卷积拆分成1×1与1×1,3×3卷积拆分为3×1和1×3,5×5卷积拆分为5×1和1×5;/n步...

【技术特征摘要】
1.一种基于权重共享的多尺度自注意力目标检测方法,其特征在于包含以下步骤:
步骤1:构建深度学习网络,该网络包括用于提取不同尺寸目标特征的基于权重共享机制的自注意力多尺度卷积网络模块,以及用于精确物体定位的丰富特征层次结构,网络搭建步骤如下:
步骤1.1:首先构造一个具有权重共享性质的三通道多尺度卷积网络,进入每个通道前有一个1×1的卷积操作,三个通道的卷积核大小分别为1×1,3×3,5×5;
步骤1.2:把用于1×1,3×3,5×5卷积核的卷积操作分别做拆分,将每次卷积拆分成两次卷积,1×1卷积拆分成1×1与1×1,3×3卷积拆分为3×1和1×3,5×5卷积拆分为5×1和1×5;
步骤1.3:将普通卷积改为膨胀卷积并设置三条通道的扩张率分别为1、2、3,并在每个通道卷积之后分别加入1×1卷积;
步骤1.4:引入残差块,将每条通道卷积前的特征图与经过通道卷积后的特征图做残差处理;
步骤1.5:在多尺度卷积网络模块的三条分支后分别连上一个修改后的自注意力分支,最后将三条分支的结果进行相加;
步骤1.6:把经过基于权重共享机制的自注意力多尺度卷积网络模块后得到的特征图再分别经过尺寸为3×3以及1×1卷积网络进行卷积,分别生成锚点和对应的边框回归偏移量,并同时计算出候选框的位置,其次ROI层则利用候选框在特征图中所标记的位置信息提出对应的候选框特征信息,最后通过全连接层以及损失函数来判断该候选框内的图像所对应的物体分类,从而完成目标检测的总任务;
步骤2:定义区域建议网络的损失函数和优化器及尾部阶段的损失函数和优化器,使得网络梯度进行反向传播;
步骤2.1:构建区域建议网络的损失函数组...

【专利技术属性】
技术研发人员:刘晋李越
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1