一种水下图像的目标检测方法、装置、设备及存储介质制造方法及图纸

技术编号:38226755 阅读:9 留言:0更新日期:2023-07-25 17:56
本发明专利技术公开了一种水下图像的目标检测方法、装置、设备及存储介质,方法包括:提取水下图像的多种特征,并组合得到多尺度特征;将多尺度特征分散到多个特征图上,并根据特征图融合多尺度特征,得到融合特征;通过卷积块注意力模块获取多尺度特征与融合特征中的目标特征通道信息和目标特征空间信息,并得到目标特征;通过卷积模块整合目标特征,并转换为最终的预测结果。本发明专利技术可以提高水下图像目标的检测准确率,可广泛应用于水下图像处理领域。可广泛应用于水下图像处理领域。可广泛应用于水下图像处理领域。

【技术实现步骤摘要】
一种水下图像的目标检测方法、装置、设备及存储介质


[0001]本专利技术涉及水下图像处理领域,尤其是一种水下图像的目标检测方法、装置、设备及存储介质。

技术介绍

[0002]现有基于学习的水下目标检测算法是利用大量标注的水下目标图像数据,将图像中的目标进行标注和分类,通过模型训练结果和标注信息之间不断趋近,学习得到某一类目标的特征学习并且进行标注,从而达到目标检测的效果。
[0003]然而在水下环境中,由于水下介质、水下光照条件、水下海底环境等都要比地面环境复杂,不同波长光在水中的差异性衰减,水中浮游生物和悬浮粒子对光的散射,使得水下图像和视频中的目标模糊,且存在严重色差严重影响目标的特征,为水下目标的特征学习、识别理解造成严重障碍。现有的水下目标检测方案不能解决上述问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种水下图像的目标检测方法、装置、设备及存储介质,用于提高水下图像目标的检测准确率。
[0005]本专利技术实施例的一方面提供了一种水下图像的目标检测方法,包括:
[0006]提取水下图像的多种特征,并组合得到多尺度特征;
[0007]将所述多尺度特征分散到多个特征图上,并根据所述特征图融合所述多尺度特征,得到融合特征;
[0008]通过卷积块注意力模块获取所述多尺度特征与所述融合特征中的目标特征通道信息和目标特征空间信息,并得到目标特征;
[0009]通过卷积模块整合所述目标特征,并转换为最终的预测结果。
[0010]可选地,所述提取水下图像的多种特征,并组合得到多尺度特征,包括:
[0011]提取水下图像的多种特征,所述多种特征包括纹理、颜色和形状中的至少之一;
[0012]将所述多种特征的感受野大小和中心步长进行多种方式的组合,得到多尺度特征。
[0013]可选地,所述将所述多种特征的感受野大小和中心步长进行多种方式的组合,得到多尺度特征,包括:
[0014]通过CBS模块卷积提取所述水下图像的多种特征,进行归一化操作并激活处理;
[0015]通过E

ELAN模块和MP模块交替提取经过卷积、归一化和激活处理后的多种特征,输出由不同感受野和不同中心步长组合的多尺度特征。
[0016]可选地,所述根据所述特征图融合所述多尺度特征,得到融合特征,包括:
[0017]通过特征金字塔和路径聚合网络将分散在所述特征图中的多尺度特征进行融合,得到融合特征。
[0018]可选地,所述通过卷积块注意力模块获取所述多尺度特征与所述融合特征中的目
标特征通道信息和目标特征空间信息,并得到目标特征,包括:
[0019]通过卷积块注意力模块获取所述多尺度特征与所述融合特征中特征通道的权重信息和特征空间的权重信息;
[0020]根据所述特征通道的权重信息确定目标特征通道信息,根据所述特征空间的权重信息确定目标特征空间信息;
[0021]所述多尺度特征与所述融合特征、目标特征通道信息和目标特征空间信息相乘,得到目标特征。
[0022]可选地,所述通过卷积模块整合所述目标特征,包括:
[0023]分别将所述多尺度特征、所述特征金字塔提取并融合得到的第一融合特征,以及所述路径聚合网络提取并融合得到的第二融合特征进行卷积,以整合所述目标特征。
[0024]可选地,所述方法还包括:
[0025]通过跨阶段局部快速空间金字塔池化增加所述多种特征的感受野。
[0026]本专利技术实施例的另一方面还提供了一种水下图像的目标检测装置,包括:
[0027]特征提取单元,用于提取水下图像的多种特征,并组合得到多尺度特征;
[0028]特征融合单元,用于将所述多尺度特征分散到多个特征图上,并根据所述特征图融合所述多尺度特征,得到融合特征;
[0029]特征获取单元,用于通过卷积块注意力模块获取所述多尺度特征与所述融合特征中的目标特征通道信息和目标特征空间信息,并得到目标特征;
[0030]结果预测单元,用于通过卷积模块整合所述目标特征,并转换为最终的预测结果。
[0031]本专利技术实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
[0032]所述存储器用于存储程序;
[0033]所述处理器执行所述程序实现上述任一项所述的方法。
[0034]本专利技术实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现上述任一项所述的方法。
[0035]本专利技术实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
[0036]本专利技术先提取水下图像的多尺度特征,进而获取多尺度特征在通道及空间维度的信息,并据此减少了特征提取过程中的信息损失,提高了网络整体的特征提取能力,使得本专利技术在水下目标场景有更高的检测精度,可以在一定程度上解决了水下场景目标重叠、背景模糊复杂等问题给水下目标检测带来的困难。
附图说明
[0037]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本专利技术实施例提供的一种水下图像的目标检测方法的流程示意图;
[0039]图2为本专利技术实施例提供的一种数据对比图;
[0040]图3为本专利技术实施例提供的一种水下图像的目标检测装置的结构框图。
具体实施方式
[0041]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0042]参照图1,本专利技术实施例提供了一种水下图像的目标检测方法,具体包括以下步骤:
[0043]S100:提取水下图像的多种特征,并组合得到多尺度特征。
[0044]由于,在水下环境中,由于水下介质、水下光照条件、水下海底环境等都要比地面环境复杂,使得水下图像和视频中的目标模糊,且存在严重色差严重影响目标的特征,为水下目标的特征学习、识别理解造成严重障碍。为了使网络结构能够在这种复杂的环境下完成目标检测的任务,一种可选的实施方式下,本专利技术可以基于对YOLOv7模型的改进,提出了一种适用于水下环境的目标检测网络方法。本专利技术的YOLOv7模型可以包括Backbone网络、Neck网络和Detect网络。
[0045]具体的,Backbone网络可以用于水下图像的特征提取,例如水下图像的纹理,颜色和形状。Backbone网络可以提供多种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水下图像的目标检测方法,其特征在于,包括:提取水下图像的多种特征,并组合得到多尺度特征;将所述多尺度特征分散到多个特征图上,并根据所述特征图融合所述多尺度特征,得到融合特征;通过卷积块注意力模块获取所述多尺度特征与所述融合特征中的目标特征通道信息和目标特征空间信息,并得到目标特征;通过卷积模块整合所述目标特征,并转换为最终的预测结果。2.根据权利要求1所述的一种水下图像的目标检测方法,其特征在于,所述提取水下图像的多种特征,并组合得到多尺度特征,包括:提取水下图像的多种特征,所述多种特征包括纹理、颜色和形状中的至少之一;将所述多种特征的感受野大小和中心步长进行多种方式的组合,得到多尺度特征。3.根据权利要求2所述的一种水下图像的目标检测方法,其特征在于,所述将所述多种特征的感受野大小和中心步长进行多种方式的组合,得到多尺度特征,包括:通过CBS模块卷积提取所述水下图像的多种特征,进行归一化操作并激活处理;通过E

ELAN模块和MP模块交替提取经过卷积、归一化和激活处理后的多种特征,输出由不同感受野和不同中心步长组合的多尺度特征。4.根据权利要求1所述的一种水下图像的目标检测方法,其特征在于,所述根据所述特征图融合所述多尺度特征,得到融合特征,包括:通过特征金字塔和路径聚合网络将分散在所述特征图中的多尺度特征进行融合,得到融合特征。5.根据权利要求1所述的一种水下图像的目标检测方法,其特征在于,所述通过卷积块注意力模块获取所述多尺度特征与所述融合特征中的目标特征通道信息和目标特征空间信息,并得到目标特征,包括:...

【专利技术属性】
技术研发人员:颜经辉周壮王腾辉赵泽锋唐佳林赖韵婷周俊涛陈炯江王振波李智创梁婉欣刘辰晨
申请(专利权)人:北京理工大学珠海学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1