一种图像目标检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40872751 阅读：4 留言：0更新日期：2024-04-08 16:40

本申请实施例涉及计算机视觉技术领域，公开了一种图像目标检测方法、装置、电子设备及存储介质，方法包括：获取带有目标物体的图像集；基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络；其中，所述初始目标检测网络包括依次连接的目标主干模块、目标中间模块以及目标头部模块，所述目标主干模块中包括用于进行特征提取的FasterNet结构；将待检测图像输入至所述目标检测网络，以基于所述目标检测网络检测所述待检测图像是否存在所述目标物体。本申请实施例用于精准、高效进行图像目标检测。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及计算机视觉，具体涉及一种图像目标检测方法、装置、电子设备及存储介质。

技术介绍

1、合成孔径雷达(synthetic aperture radar，sar)是一种高分辨率成像雷达，作为一种主动式微波传感器，与传统的光学传感器相比，sar在成像或探测时不受光照强度、天气等因素的限制，具有全天候、远距离等优点。随着高分辨率sar成像技术的不断发展,图像中出现的检测目标特征更加复杂，大量的sar图像可用于目标检测。随着深度学习的发展，sar图像目标检测的性能得到了极大的提升，而针对sar图像中舰船、油罐、桥梁等小目标的检测算法的研究在近岸检测、海洋监测等领域具有重要意义。

2、基于深度学习算法的卷积神经网络(convolutional neural networks，cnn)借助其自主学习参数和自动提取特征的能力，不需要人工设计特征和建模就可以达到比较好的目标检测效果，使其成为当前目标检测的主流算法之一。而目前流行的检测算法主要分为两类：一类是以区域卷积神经网络(r-cnn)、faster r-cnn等为代表的两阶段目标检测算法，采用该类算法在包含目标的边框上生成候选区域并进行目标检测，该类算法的检测精度高，但效率较低；另外一类是单阶段目标检测算法，代表性的算法有yolo(一种目标检测算法)、ssd(2016年公开的一种目标检测算法)、retina-net(2017年提出的一种检测模型)等，该类算法的思想是把目标检测问题简化为回归的问题，不需要生成候选区域，识别速度相对其他算法普遍较快。

3、由

技术实现思路

1、鉴于上述问题，本申请实施例提供了一种图像目标检测方法、装置及存储介质，用于精准、高效进行图像目标检测。

2、根据本申请实施例的一个方面，提供了一种图像目标检测方法，所述方法包括：获取带有目标物体的图像集；基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络；其中，所述初始目标检测网络包括依次连接的目标主干模块、目标中间模块以及目标头部模块，所述目标主干模块中包括用于进行特征提取的fasternet结构；将待检测图像输入至所述目标检测网络，以基于所述目标检测网络检测所述待检测图像是否存在所述目标物体。

3、在一种可选的方式中，在所述基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络之前，所述方法还包括：

4、获取yolov8模型；

5、将所述yolov8模型中的主干模块替换为fasternet结构，以得到所述目标主干模块；

6、在所述yolov8模型中的中间模块增加上采样层，并在所述中间模块的c2f结构中增加注意力单元，以得到所述目标中间模块；

7、将所述yolov8模型中的头部模块作为所述目标头部模块，以得到所述初始目标检测网络。

8、在一种可选的方式中，所述fasternet结构包括嵌入层、fasternet子模块，所述fasternet子模块包括依次连接的fasternet块与合并层。

9、在一种可选的方式中，所述将所述yolov8模型中的主干模块替换为fasternet结构，以得到所述目标主干模块，包括：

10、在所述fasternet结构之后增加池化结构，以得到所述目标主干模块；其中，所述池化结构包括多个尺寸为3×3的内核单元。

11、在一种可选的方式中，所述注意力单元包括通道注意力子单元以及空间注意力子单元，所述通道注意力子单元被配置为基于通道注意力机制对输入的特征进行通道注意力加权处理，所述空间注意力子单元被配置为基于对进行通道注意力加权处理后的特征进行空间注意力加权处理。

12、在一种可选的方式中，所述基于所述图像集对初始目标检测网络进行训练，得到训练完成的目标检测网络，包括：

13、设定训练参数；

14、将图像集中的图像输入至所述初始目标检测网络，并基于优化器对所述初始目标检测网络中的网络参数进行迭代更新，以得到训练后的目标检测网络。

15、在一种可选的方式中，基于mpdiou损失函数以及所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络。

16、根据本申请实施例的另一方面，提供了一种图像目标检测装置，所述装置包括：图像获取模块，用于获取带有目标物体的图像集；网络训练模块，用于基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络；其中，所述初始目标检测网络包括依次连接的目标主干模块、目标中间模块以及目标头部模块，所述目标主干模块中包括用于进行特征提取的fasternet结构；目标检测模块，用于将待检测图像输入至所述目标检测网络，以基于所述目标检测网络检测所述待检测图像是否存在所述目标物体。

17、根据本申请实施例的一个方面，提供了一种电子设备，包括：控制器；存储器，用于存储一个或多个程序，当一个或多个程序被所述控制器执行时，以执行上述的方法。

18、根据本申请实施例的一个方面，还提供了一种计算机可读存储介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行上述的方法。

19、根据本申请实施例的一个方面，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述的方法。

20、本申请实施例通过在初始目标检测网络中的主干模块中使用fasternet结构，从而能高效的提取图像的空间特征，同时，该fasternet结构能降低初始目标检测网络的参数量与计算量，以此，在训练得到目标检测网络后，该目标检测网络可精准、高效得进行图像目标检测。

21、上述说明仅是本申请实施例技术方案的概述，为了能够更清楚了解本申请实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种图像目标检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络之前，所述方法还包括：

3.根据权利要求1或2所述的方法，其特征在于，所述FasterNet结构包括嵌入层、至少一个FasterNet子模块，所述FasterNet子模块包括依次连接的FasterNet块与合并层。

4.根据权利要求2所述的方法，其特征在于，所述将所述YOLOv8模型中的主干模块替换为FasterNet结构，以得到所述目标主干模块，包括：

5.根据权利要求2所述的方法，其特征在于，所述注意力单元包括通道注意力子单元以及空间注意力子单元，所述通道注意力子单元被配置为基于通道注意力机制对输入的特征进行通道注意力加权处理，所述空间注意力子单元被配置为基于对进行通道注意力加权处理后的特征进行空间注意力加权处理。

6.根据权利要求1所述的方法，其特征在于，所述基于所述图像集对初始目标检测网络进行训练，得到训练完成的目标检测网络，包括：

7.根据权

8.一种图像目标检测装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，其上存储有计算机可读指令，当计算机可读指令被计算机的处理器执行时，使计算机执行权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.一种图像目标检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述基于所述图像集对初始目标检测网络进行训练，得到训练后的目标检测网络之前，所述方法还包括：

3.根据权利要求1或2所述的方法，其特征在于，所述fasternet结构包括嵌入层、至少一个fasternet子模块，所述fasternet子模块包括依次连接的fasternet块与合并层。

4.根据权利要求2所述的方法，其特征在于，所述将所述yolov8模型中的主干模块替换为fasternet结构，以得到所述目标主干模块，包括：

5.根据权利要求2所述的方法，其特征在于，所述注意力单元包括通道注意力子单元以及空间注意力子单元，所述通道注意力子单元被配置为基于通...

【专利技术属性】
技术研发人员：彭辉，刘思熠，
申请(专利权)人：成都信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人