目标检测方法、装置、设备及存储介质制造方法及图纸

技术编号:38737162 阅读:11 留言:0更新日期:2023-09-08 23:23
本发明专利技术公开了一种目标检测方法、装置、设备及存储介质,该方法包括:获取待检测图像以及初始数据集;对初始数据集进行图像预处理,得到预处理后的数据集;基于YOLOv7网络构建初始目标检测模型,将初始目标检测模型的主干网络替换为改进的ConvNextv2结构,在初始目标检测模型的颈层网络中加入CA注意力机制,并将初始目标检测模型的头部网络中的检测头替换为解耦检测头,得到改进的目标检测模型;通过预处理后的数据集对改进的目标检测模型进行训练,得到优化的目标检测模型;根据优化的目标检测模型对待检测图像进行检测,得到检测结果。解决了当前小目标检测精度低,模型性能易受干扰的问题,提升小目标检测的精度。提升小目标检测的精度。提升小目标检测的精度。

【技术实现步骤摘要】
目标检测方法、装置、设备及存储介质


[0001]本专利技术涉及目标检测
,尤其涉及一种目标检测方法、装置、设备及存储介质。

技术介绍

[0002]如今,伴随着人工智能的快速发展,以及计算机硬件设备的升级,目标检测算法取得了突破性进展,相关研究成果也为人们的日常生活带来诸多便利。
[0003]目前大中型目标检测已取得瞩目的成绩,但随着智能化系统的快速发展和便携式拍照设备的广泛应用,大量小目标存在于视频和图像中,仅仅检测大中型物体已无法满足实际需求,很多领域需要从小目标中获取关键信息。这充分表明小目标检测极具研究价值和应用前景。然而相较于大中型目标检测而言,同种检测算法用于小目标检测时的性能指标往往偏低,很难达到预期效果。这是因为小目标的分辨率低、信息有限,在下采样过程中容易丢失关键特征,导致漏检、误检现象严重。另外模型性能还受光照强度变化、图像噪声、复杂背景、目标遮挡等因素的干扰,这些干扰因素更加剧了检测难度。因此,需要将现有的目标检测算法进行改进,提升在小目标检测上的精度。

技术实现思路

[0004]本专利技术的主要目的在于提供一种目标检测方法、装置、设备及存储介质,旨在解决现有技术小目标检测精度低,模型性能易受干扰的技术问题。
[0005]为实现上述目的,本专利技术提供了一种目标检测方法,所述方法包括以下步骤:
[0006]获取待检测图像以及初始数据集;
[0007]对所述初始数据集进行图像预处理,得到预处理后的数据集;
[0008]基于YOLOv7网络构建初始目标检测模型,将所述初始目标检测模型的主干网络替换为改进的ConvNextv2结构,在所述初始目标检测模型的颈层网络中加入CA注意力机制,并将所述初始目标检测模型的头部网络中的检测头替换为解耦检测头,得到改进的目标检测模型,其中,所述改进的ConvNextv2结构是基于ConvNextv2结构构建并将所述ConvNextv2结构的下采样层替换为SPD模块得到的,所述ConvNextv2结构中包括全局响应归一化层;
[0009]通过所述预处理后的数据集对所述改进的目标检测模型进行训练,得到优化的目标检测模型;
[0010]根据所述优化的目标检测模型对所述待检测图像进行检测,得到检测结果。
[0011]可选地,所述对所述初始数据集进行图像预处理,得到预处理后的数据集,包括:
[0012]将所述初始数据集的原始标签转换为目标标签,得到目标数据集;
[0013]通过几何变换和颜色变换扩增所述目标数据集,得到预处理后的数据集,其中,所述几何变换包括翻转、旋转、裁剪、变形、缩放、加噪以及模糊中的至少一项,颜色变换包括颜色变换、擦除以及填充中的至少一项。
[0014]可选地,所述通过所述预处理后的数据集对所述改进的目标检测模型进行训练,得到优化的目标检测模型,包括:
[0015]将所述预处理后的数据集中的图像输入至所述改进的目标检测模型的改进的ConvNextv2结构进行特征提取,得到参考特征图,其中,所述改进的ConvNextv2结构包括SPD模块、卷积层以及全局响应归一化层,所述卷积层包括深度卷积和一维卷积;
[0016]将所述参考特征图输入至所述改进的目标检测模型的颈层网络进行编码,得到目标特征图,其中,所述颈层网络包括CA注意力机制;
[0017]将所述目标特征图输入至所述改进的目标检测模型的头部网络进行检测,输出标记框以及分类标签;
[0018]根据所述标记框以及分类标签确定目标损失函数;
[0019]通过所述目标损失函数优化所述改进的目标检测模型的参数,得到优化的目标检测模型。
[0020]可选地,所述将所述预处理后的数据集中的图像输入至所述改进的目标检测模型的改进的ConvNextv2结构进行特征提取,得到参考特征图,包括:
[0021]对所述预处理后的数据集中的图像进行特征提取,得到原始特征图;
[0022]通过所述改进的ConvNextv2结构中的SPD模块对所述原始特征图进行切片操作,得到若干数量的子特征图;
[0023]按照通道维度连接所述若干数量的子特征图,得到中间特征图;
[0024]将所述中间特征图进行输入至所述卷积层进行深度卷积后进行一维卷积,得到卷积特征图;
[0025]将所述卷积特征图输入至所述全局响应归一化层进行聚合处理,得到参考特征图。
[0026]可选地,所述将所述卷积特征图输入至所述全局响应归一化层进行聚合处理,得到参考特征图,包括:
[0027]对所述卷积特征图通过L2范式池化进行全局特征聚合,得到聚合特征图;
[0028]对所述聚合特征进行特征归一化,得到归一化特征图;
[0029]对所述归一化特征图进行特征校准,得到参考特征图。
[0030]可选地,所述将所述参考特征图输入至所述改进的目标检测模型的颈层网络进行编码,得到目标特征图,包括:
[0031]通过所述CA注意力机制根据第一卷积核和第二卷积核对所述参考特征图分别沿水平方向和垂直向进行编码,得到水平方向的聚合特征图和垂直方向的聚合特征图,其中,所述第一卷积核和第二卷积核的空间范围不同;
[0032]将水平方向的聚合特征图和垂直方向的聚合特征图进行拼接,得到拼接后的张量;
[0033]通过一维卷积变换函数对所述拼接后的张量进行计算,得到水平张量和垂直张量;
[0034]根据所述水平张量和垂直张量与参考特征图进行计算,得到目标特征图。
[0035]可选地,所述根据所述标记框以及分类标签确定目标损失函数,包括:
[0036]根据所述标记框与真实框进行计算,得到位置损失函数;
[0037]根据所述分类标签与预设标签进行计算,得到分类损失函数;
[0038]根据所述位置损失函数与所述分类损失函数确定目标损失函数。
[0039]此外,为实现上述目的,本专利技术还提出一种目标检测装置,所述目标检测装置包括:
[0040]获取模块,用于获取待检测图像以及初始数据集;
[0041]处理模块,用于对所述初始数据集进行图像预处理,得到预处理后的数据集;
[0042]构建模块,用于基于YOLOv7网络构建初始目标检测模型,将所述初始目标检测模型的主干网络替换为改进的ConvNextv2结构,在所述初始目标检测模型的颈层网络中加入CA注意力机制,并将所述初始目标检测模型的头部网络中的检测头替换为解耦检测头,得到改进的目标检测模型,其中,所述改进的ConvNextv2结构是基于ConvNextv2结构构建并将所述ConvNextv2结构的下采样层替换为SPD模块得到的,所述ConvNextv2结构中包括全局响应归一化层;
[0043]训练模块,用于通过所述预处理后的数据集对所述改进的目标检测模型进行训练,得到优化的目标检测模型;
[0044]检测模块,用于根据所述优化的目标检测模型对所述待检测图像进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:获取待检测图像以及初始数据集;对所述初始数据集进行图像预处理,得到预处理后的数据集;基于YOLOv7网络构建初始目标检测模型,将所述初始目标检测模型的主干网络替换为改进的ConvNextv2结构,在所述初始目标检测模型的颈层网络中加入CA注意力机制,并将所述初始目标检测模型的头部网络中的检测头替换为解耦检测头,得到改进的目标检测模型,其中,所述改进的ConvNextv2结构是基于ConvNextv2结构构建并将所述ConvNextv2结构的下采样层替换为SPD模块得到的,所述ConvNextv2结构中包括全局响应归一化层;通过所述预处理后的数据集对所述改进的目标检测模型进行训练,得到优化的目标检测模型;根据所述优化的目标检测模型对所述待检测图像进行检测,得到检测结果。2.如权利要求1所述的方法,其特征在于,所述对所述初始数据集进行图像预处理,得到预处理后的数据集,包括:将所述初始数据集的原始标签转换为目标标签,得到目标数据集;通过几何变换和颜色变换扩增所述目标数据集,得到预处理后的数据集,其中,所述几何变换包括翻转、旋转、裁剪、变形、缩放、加噪以及模糊中的至少一项,颜色变换包括颜色变换、擦除以及填充中的至少一项。3.如权利要求1所述的方法,其特征在于,所述通过所述预处理后的数据集对所述改进的目标检测模型进行训练,得到优化的目标检测模型,包括:将所述预处理后的数据集中的图像输入至所述改进的目标检测模型的改进的ConvNextv2结构进行特征提取,得到参考特征图,其中,所述改进的ConvNextv2结构包括SPD模块、卷积层以及全局响应归一化层,所述卷积层包括深度卷积和一维卷积;将所述参考特征图输入至所述改进的目标检测模型的颈层网络进行编码,得到目标特征图,其中,所述颈层网络包括CA注意力机制;将所述目标特征图输入至所述改进的目标检测模型的头部网络进行检测,输出标记框以及分类标签;根据所述标记框以及分类标签确定目标损失函数;通过所述目标损失函数优化所述改进的目标检测模型的参数,得到优化的目标检测模型。4.如权利要求3所述的方法,其特征在于,所述将所述预处理后的数据集中的图像输入至所述改进的目标检测模型的改进的ConvNextv2结构进行特征提取,得到参考特征图,包括:对所述预处理后的数据集中的图像进行特征提取,得到原始特征图;通过所述改进的ConvNextv2结构中的SPD模块对所述原始特征图进行切片操作,得到若干数量的子特征图;按照通道维度连接所述若干数量的子特征图,得到中间特征图;将所述中间特征图进行输入至所述卷积层进行深度卷积后进行一维卷积,得到卷积特征图;将所述卷积特征图输入至所述全局响...

【专利技术属性】
技术研发人员:王周璞胡婧吴素崟樊闯阮靖琳
申请(专利权)人:武汉轻工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1