一种多尺度目标检测方法及系统技术方案

技术编号:29984641 阅读:75 留言:0更新日期:2021-09-08 10:24
本发明专利技术涉及一种多尺度目标检测方法及系统,该方法包括:构建空洞金字塔网络模型;空洞金字塔网络模型包括依次连接的多个卷积模块和多个卷积支路,各卷积模块的输出分别连接一个卷积支路,卷积支路包括一个卷积操作和多个空洞卷积操作,卷积支路中的卷积操作和空洞卷积操作为并列关系;一个卷积支路中多个空洞卷积操作的扩张率相同,卷积核尺寸不同;卷积支路的输出按照分辨率从低到高,依次将各第一特征图进行上采样操作后与同尺寸的相邻第一特征图进行元素级相加,获得多个融合特征图;根据目标检测数据集对空洞金字塔网络模型进行模型训练,获得目标检测模型;利用目标检测模型对待检测图像进行目标检测。本发明专利技术提高了目标检测的准确性。标检测的准确性。标检测的准确性。

【技术实现步骤摘要】
一种多尺度目标检测方法及系统


[0001]本专利技术涉及目标检测
,特别是涉及一种多尺度目标检测方法及系统。

技术介绍

[0002]目标检测技术是计算机视觉领域的一大核心研究方向,旨在获取图像中感兴趣目标的所属分类和所在位置。该技术不仅是目标跟踪、语义分割等诸多计算机视觉任务的研究基础,也被广泛应用于医学诊断、自动驾驶、智能视频监控、军事目标监测等多种民用和军用领域。随着应用场景的多元化和复杂化,一张待检图像中往往包含了多个不同尺度的目标,这使得现阶段的目标检测任务面临着尺度差异带来的严峻挑战。多尺度目标检测也因此成为了目标检测领域的研究热点之一。
[0003]作为解决尺度问题的主流算法,多尺度特征融合技术通过构建特征金字塔网络将卷积神经网络中包含更多细节信息的浅层特征图与包含更多语义信息的深层特征图进行融合,使得各个特征层同时具有丰富的细节特征和语义特征,从而有效提升神经网络的特征表达能力。但现有多尺度特征融合方法的不足之处在于,每个特征层虽然包含丰富的特征信息,但各个特征层仅对固定尺度范围内的目标敏感,不仅使得特征信息的利用率不高,也限制了网络的各个特征层对不同尺度目标的检测能力。

技术实现思路

[0004]本专利技术的目的是提供一种多尺度目标检测方法及系统,提高了目标检测的准确性。
[0005]为实现上述目的,本专利技术提供了如下方案:一种多尺度目标检测方法,包括:采集目标检测数据集;构建空洞金字塔网络模型;所述空洞金字塔网络模型包括依次连接的多个卷积模块和多个卷积支路,各卷积模块包括卷积操作,各卷积模块的输出分别连接一个卷积支路,所述卷积支路包括一个卷积操作和多个空洞卷积操作,所述卷积支路中的卷积操作和空洞卷积操作为并列关系;一个所述卷积支路中多个空洞卷积操作的扩张率相同,卷积核尺寸不同;所述卷积支路中的一个卷积操作和多个空洞卷积操作输出的特征图采用元素级加和操作,获得第一特征图;按照分辨率从低到高的顺序依次将各所述第一特征图进行上采样操作后与同尺寸的相邻第一特征图进行元素级相加,获得多个融合特征图;根据所述目标检测数据集对所述空洞金字塔网络模型进行模型训练,获得目标检测模型;利用所述目标检测模型对待检测图像进行目标检测。
[0006]可选地,各所述卷积模块的输出经过卷积核为1*1的卷积层后输入所述卷积支路。
[0007]可选地,所述空洞金字塔网络模型还包括区域建议网络,各所述融合特征图输入所述区域建议网络,所述区域建议网络分别输出与各所述融合特征图对应的候选区域。
[0008]可选地,所述空洞金字塔网络模型还包括ROI池化层和检测头,所述ROI池化层的输入连接所述区域建议网络的输出,所述ROI池化层的输出连接所述检测头,所述检测头用于输出检测结果。
[0009]可选地,所述卷积支路包括一个卷积核为1*1的卷积操作和2个空洞卷积操作。
[0010]可选地,2个空洞卷积操作分别为第一空洞卷积操作和第二空洞卷积操作;第一空洞卷积操作为卷积核为3*3的空洞卷积操作,扩张率为2;第二空洞卷积操作为卷积核为5*5的空洞卷积操作,扩张率为2。
[0011]本专利技术还公开了一种多尺度目标检测系统,包括:数据集采集模块,用于采集目标检测数据集;空洞金字塔网络模型构建模块,用于构建空洞金字塔网络模型;所述空洞金字塔网络模型包括依次连接的多个卷积模块和多个卷积支路,各卷积模块包括卷积操作,各卷积模块的输出分别连接一个卷积支路,所述卷积支路包括一个卷积操作和多个空洞卷积操作,所述卷积支路中的卷积操作和空洞卷积操作为并列关系;一个所述卷积支路中多个空洞卷积操作的扩张率相同,卷积核尺寸不同;所述卷积支路中的一个卷积操作和多个空洞卷积操作输出的特征图采用元素级加和操作,获得第一特征图;按照分辨率从低到高的顺序依次将各所述第一特征图进行上采样操作后与同尺寸的相邻第一特征图进行元素级相加,获得多个融合特征图;空洞金字塔网络模型训练模块,用于根据所述目标检测数据集对所述空洞金字塔网络模型进行模型训练,获得目标检测模型;目标检测模块,用于利用所述目标检测模型对待检测图像进行目标检测。
[0012]可选地,各所述卷积模块的输出经过卷积核为1*1的卷积层后输入所述卷积支路。
[0013]可选地,所述卷积支路包括一个卷积核为1*1的卷积操作和2个空洞卷积操作,2个空洞卷积操作分别为第一空洞卷积操作和第二空洞卷积操作;第一空洞卷积操作为卷积核为3*3的空洞卷积操作,扩张率为2;第二空洞卷积操作为卷积核为5*5的空洞卷积操作,扩张率为2。
[0014]可选地,所述空洞金字塔网络模型还包括区域建议网络,各所述融合特征图输入所述区域建议网络,所述区域建议网络分别输出与各所述融合特征图对应的候选区域;所述空洞金字塔网络模型还包括ROI池化层和检测头,所述ROI池化层的输入连接所述区域建议网络的输出,所述ROI池化层的输出连接所述检测头,所述检测头用于输出检测结果。
[0015]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术将空洞卷积多分支结构与多尺度特征融合技术相结合,通过采用不同卷积核的空洞卷积提取特征信息,可使卷积层具有不同尺寸的感受野,有助于单一特征层获取到更丰富的多尺度上下文特征信息,增强各个特征层对不同尺度目标的敏感性,提高了目标检测的准确性。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本专利技术一种多尺度目标检测方法流程示意图;图2为本专利技术一种多尺度目标检测方法具体流程示意图;图3为本专利技术空洞金字塔网络模型结构示意图;图4为本专利技术一种多尺度目标检测系统结构示意图。
具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]本专利技术的目的是提供一种多尺度目标检测方法及系统,提高了目标检测的准确性。
[0020]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0021]图1为本专利技术一种多尺度目标检测方法流程示意图,如图1所示,一种多尺度目标检测方法具体包括以下内容:一种多尺度目标检测方法,包括:步骤101:采集目标检测数据集。
[0022]首先利用车载摄像头获取不同交通场景下车辆行进过程中的图像数据,并进行图像预处理;接下来,基于图像标注软件对图像中的目标(包括各类车辆、行人、交通标识牌、路面阻挡物)进行类别和位置标注,从而得到每个图像对应的标注文件;最后,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多尺度目标检测方法,其特征在于,包括:采集目标检测数据集;构建空洞金字塔网络模型;所述空洞金字塔网络模型包括依次连接的多个卷积模块和多个卷积支路,各卷积模块包括卷积操作,各卷积模块的输出分别连接一个卷积支路,所述卷积支路包括一个卷积操作和多个空洞卷积操作,所述卷积支路中的卷积操作和空洞卷积操作为并列关系;一个所述卷积支路中多个空洞卷积操作的扩张率相同,卷积核尺寸不同;所述卷积支路中的一个卷积操作和多个空洞卷积操作输出的特征图采用元素级加和操作,获得第一特征图;按照分辨率从低到高的顺序依次将各所述第一特征图进行上采样操作后与同尺寸的相邻第一特征图进行元素级相加,获得多个融合特征图;根据所述目标检测数据集对所述空洞金字塔网络模型进行模型训练,获得目标检测模型;利用所述目标检测模型对待检测图像进行目标检测。2.根据权利要求1所述的多尺度目标检测方法,其特征在于,各所述卷积模块的输出经过卷积核为1*1的卷积层后输入所述卷积支路。3.根据权利要求1所述的多尺度目标检测方法,其特征在于,所述空洞金字塔网络模型还包括区域建议网络,各所述融合特征图输入所述区域建议网络,所述区域建议网络分别输出与各所述融合特征图对应的候选区域。4.根据权利要求3所述的多尺度目标检测方法,其特征在于,所述空洞金字塔网络模型还包括ROI池化层和检测头,所述ROI池化层的输入连接所述区域建议网络的输出,所述ROI池化层的输出连接所述检测头,所述检测头用于输出检测结果。5.根据权利要求1所述的多尺度目标检测方法,其特征在于,所述卷积支路包括一个卷积核为1*1的卷积操作和2个空洞卷积操作。6.根据权利要求5所述的多尺度目标检测方法,其特征在于,2个空洞卷积操作分别为第一空洞卷积操作和第二空洞卷积操作;第一空洞卷积操作为卷积核为3*3的空洞卷积操作,扩张率为2;第二空洞卷积操作为卷积核为5*5的空洞卷积操作,扩张率为2。7.一种多...

【专利技术属性】
技术研发人员:朱敏严凡王帅赵文登
申请(专利权)人:北京电信易通信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1