一种目标检测方法以及检测系统技术方案

技术编号:36126471 阅读:70 留言:0更新日期:2022-12-28 14:33
本发明专利技术提供了一种目标检测方法以及检测系统,所述检测方法包括:采用主干特征提取网络,对输入的图片进行特征提取得到特征图;对所述特征图进行多分支空洞卷积注意力处理,加强感兴趣信息的特征表示,经过双向特征金字塔结构,丰富不同层级的特征信息;利用所述双向特征金字塔结构产生的多尺度特征对目标的位置和类别进行预测。本发明专利技术的目标检测方法,通过多尺度注意力特征金字塔网络和广义交并比损失函数(GIoU),捕获多尺度上下文信息,将高层特征和低层特征有效融合,丰富不同层级的特征信息,使模型更加准确地定位和识别感兴趣的物体,从而进一步提高目标检测的精度。从而进一步提高目标检测的精度。从而进一步提高目标检测的精度。

【技术实现步骤摘要】
一种目标检测方法以及检测系统


[0001]本专利技术涉及计算机技术和深度学习算法领域,具体而言,涉及一种目标检测方法以及检测系统。

技术介绍

[0002]随着计算机技术和深度学习算法的快速发展,基于深度卷积神经网络的目标检测算法也逐渐替代了传统的目标检测算法,目标检测技术得到飞速发展,在众多优秀算法的加持下,许多检测模型的性能和效率有了显著的提升。目标检测的基本任务是找出图像中所有感兴趣的目标,并对目标进行定位和分类,解决了图像中物体在哪里和是什么的问题。基于深度学习的目标检测算法根据其算法流程特点大致可以分为两类:两阶段目标检测算法和单阶段目标检测算法。
[0003]两阶段目标检测算法将物体检测按分类问题对待,首先生成包含目标的候选区域,然后对候选区域进行坐标回归和类别分类,得到最终的检测结果。Girshick等人提出的R

CNN使目标检测取得巨大突破,成为后续两阶段目标检测的开山之作,但是它输入图像尺寸固定、检测速度较慢。为了解决R

CNN的问题,He等人提出了SPP

Net,SPP

Net在最后一个卷积层和全连接层之间加入空间金字塔结构,使得网络能够输入任意尺度的候选区域。Girshick等人在SPP

Net的基础上提出了Fast R

CNN,该模型提出了ROI池化层和新的多任务损失函数。为了实现真正的端到端的训练和测试,Ren等人提出Faster

RCNN,它使用区域建议网络(RPN)提取检测区域,很大程度上提高了区域建议的速度。Lin等人在Faster

RCNN的基础上提出了特征金字塔网络检测算法(FPN),其主要创新点是加入了多层特征和特征融合,大幅提升了小目标物体的检测效果。
[0004]为了提升基于深度学习的目标检测算法的效率,单阶段目标检测算法应运而生。Redmon等人提出YOLOv1算法,该算法通过在输出特征图上划分网格的方法直接进行目标坐标回归和类别分类,省略掉了显式的提取候选区域过程,这大幅降低了检测的耗时,但是它存在严重的定位错误问题,从而检测精度并不高。Liu等人提出了SSD算法,引入多参考和多分辨率检测技术使得不同层的网络检测不同尺度的对象。Redmon等人提出了YOLOv2算法,引入Anchor机制和联合训练算法,但其仍有小尺寸目标检测精度较低的缺点。Redmon等人在YOLOv2的基础上提出了YOLOv3算法,YOLOv3的特色是引入了FPN来实现多尺度预测,同时还使用了更加优秀的基础网络Darknet53和二值交叉熵损失函数,并且可以通过改变模型的网络结构来实现速度与精度的平衡。
[0005]但是,两阶段目标检测算法需要先产生包含目标可能存在的候选区域。然后对候选区域提取特征,用于后续的分类及回归。单阶段目标检测算法不需要提取候选区域,直接进行目标坐标回归和类别分类,经过单次检测即可直接得到最终的检测结果。虽然许多的目标检测算法被提出,但对于目标检测还是存在一些问题,目标检测不能充分利用上下文信息,使得检测精度较低。目标检测对于主干网络提取到的特征不能充分利用,使得浅层网络缺乏语义信息,深层网络缺乏位置信息。在实际场景中,目标通常出现在复杂的背景环境
中,使得检测变得困难,容易造成错检、漏检的情况。
[0006]有鉴于此,特提出本专利技术。

技术实现思路

[0007]有鉴于此,本专利技术公开了一种新型的目标检测方法,通过多尺度注意力特征金字塔网络和广义交并比损失函数(GIoU),捕获多尺度上下文信息,将高层特征和低层特征有效融合,丰富不同层级的特征信息,使模型更加准确地定位和识别感兴趣的物体,从而进一步提高目标检测的精度。
[0008]具体地,本专利技术是通过以下技术方案实现的:
[0009]第一方面,本专利技术公开了一种新型的目标检测方法,包括如下步骤:
[0010]采用主干特征提取网络,对输入的图片进行特征提取得到特征图;
[0011]对所述特征图进行多分支空洞卷积注意力处理,加强感兴趣信息的特征表示,经过双向特征金字塔结构,丰富不同层级的特征信息;
[0012]利用所述双向特征金字塔结构产生的多尺度特征对目标的位置和类别进行预测。
[0013]第二方面,本专利技术公开了一种目标检测系统,包括:
[0014]提取模块:用于采用主干特征提取网络,对输入的图片进行特征提取得到特征图;
[0015]处理模块:用于对所述特征图进行多分支空洞卷积注意力处理,加强感兴趣信息的特征表示,经过双向特征金字塔结构,丰富不同层级的特征信息;
[0016]预测模块:用于利用所述双向特征金字塔结构产生的多尺度特征对目标的位置和类别进行预测。
[0017]第三方面,本专利技术公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述目标检测方法的步骤。
[0018]第四方面,本专利技术公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所目标检测方法的步骤。
[0019]本专利技术的目标检测方法,主要由主干网络特征提取,特征融合和目标检测结果预测三部分组成。通过获取丰富的上下文信息,抑制图像中与目标无关的背景信息,并且使得高层特征和低层特征有效融合,丰富不同层级的特征信息,并且还采用GIoU损失函数作为边界框回归损失函数,减少了错检、漏检的情况,提高了目标检测的精度,并将其实际应用于目标检测领域。可见本专利技术的方案应用领域非常广泛,具有广阔的应用价值。
附图说明
[0020]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0021]图1为本专利技术实施例提供的目标检测方法的整体框架图;
[0022]图2为本专利技术实施例提供的多分支空洞卷积注意力模块的结构示意图;
[0023]图3为本专利技术实施例提供的坐标注意力模块的结构示意图;
[0024]图4为本专利技术实施例提供的一种计算机设备的流程示意图。
具体实施方式
[0025]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0026]在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括如下步骤:采用主干特征提取网络,对输入的图片进行特征提取得到特征图;对所述特征图进行多分支空洞卷积注意力处理,加强感兴趣信息的特征表示,经过双向特征金字塔结构,丰富不同层级的特征信息;利用所述双向特征金字塔结构产生的多尺度特征对目标的位置和类别进行预测。2.根据权利要求1所述的目标检测方法,其特征在于,所述多分支空洞卷积注意力处理的方法包括:采用膨胀率为1、3、5,卷积核为3x3大小的空洞卷积对输入进行采样,充分获取目标上下文之间的信息,得到不同尺度特征图的信息;然后分别经过坐标注意力模块忽略掉无用的背景信息,对不同膨胀率分支的输出进行特征融合,得到多尺度融合特征。3.根据权利要求2所述的目标检测方法,其特征在于,所述坐标注意力模块通过将位置信息嵌入到通道注意力中,使网络获取更大的区域信息。4.根据权利要求3所述的目标检测方法,其特征在于,所述双向特征金字塔结构的具体结构包括:所述特征图分别为F1、F2、F3,经过多分支空洞卷积注意力模块得到多尺度融合特征T1、T2、T3,T3与T2进行特征融合得到P2特征图,然后P2与T1进行特征融合得到P1特征图;P1与P2进行特征融合得到C2特征图,C2与P3进行特征融合得到C3特征图。将融合后的特征层C1,C2和C3进行检测目标。5.根据权利要求1所述的目标检测方法,其特征在于,进行预测的步骤之后,采用GIoU损失函数来进一步提高目标检测...

【专利技术属性】
技术研发人员:强保华刘玲芝杨先一张世豪
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1