一种水面无人艇对水下目标的识别方法、系统、电子设备及存储介质技术方案

技术编号：40951455 阅读：4 留言：0更新日期：2024-04-18 20:26

本发明专利技术提供一种水面无人艇对水下目标的识别方法、系统、电子设备及存储介质。其中，方法包括：搭建CNN主干网络，提取图像第一特征的序列，并引入位置编码；将所述图像第一特征序列输入Transformer网络的编码器，提取图像第二特征；将所述图像第二特征输入Transformer网络的解码器，输出识别结果；应用预处理后的目标的图像对所述CNN主干网络、Transformer网络的编码器和Transformer网络的解码器构成的DETR模型进行训练；用训练好的DETR模型对待检测目标图像进行识别，得到识别结果。本发明专利技术提出的方案能够增强了模型的泛化能力和鲁棒性，有效提高水下复杂的环境中目标识别的速度和精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于水下目标识别，尤其涉及一种水面无人艇对水下目标的识别方法、系统、电子设备及存储介质。

技术介绍

1、水下目标探测是水面无人艇的重要能力之一，而视觉感知是其获取水下信息的主要方式，由于获取的水下图像会出现模糊、失真，所以对识别方法的精度和速度有较大的要求。基于深度学习的目标检测算法相较于传统依赖人工设计的检测方法有更好的性能，开始逐渐被广泛地使用在水下目标检测领域。

2、由于水中漂浮颗粒物和水体本身等因素会对水下图像质量产生影响，引起图像模糊、失真、对比度降低等问题，并且对目标识别的精度和速度会影响后续水面无人艇执行任务的精确高效，所以水下目标识别面临困难，基于深度学习的目标检测算法逐渐在水面无人艇的水下图像处理领域得到应用，但往往要引入非常复杂的网络结构，并且常见的单阶段、两阶段深度学习目标检测算法多为基于锚框识别的，繁杂的操作会降低整体的检测速度。

3、以上技术问题亟待解决。

技术实现思路

1、为解决上述技术问题，本专利技术提出一种水面无人艇对水下目标的识别方法的技术方案，以解决上述技术问题。

2、本专利技术第一方面公开了一种水面无人艇对水下目标的识别方法，所述方法包括：

3、步骤s1、获取目标的图像并进行预处理；

4、步骤s2、搭建cnn主干网络，提取图像第一特征的序列，并引入位置编码；

5、步骤s3、将所述图像第一特征序列输入transformer网络的编码器，提取图像第二特征；

>6、步骤s4、将所述图像第二特征输入transformer网络的解码器，输出识别结果；

7、步骤s5、应用预处理后的目标的图像对所述cnn主干网络、transformer网络的编码器和transformer网络的解码器构成的detr模型进行训练，监控损失变化；

8、步骤s6、按目标识别性能指标评价detr模型训练结果，并存储detr模型训练参数；

9、步骤s7、用训练好的detr模型对待检测目标图像进行识别，得到识别结果。

10、根据本专利技术第一方面的方法，在所述步骤s2中，所述位置编码的维度与所述序列的维度相同。

11、根据本专利技术第一方面的方法，在所述步骤s2中，产生所述位置编码的方法包括：

12、正弦或余弦函数编码，编码规则为：

13、

14、

15、pos表示序列所处的位置，dmodel表示所编码序列的维度大小，i表示所编码的位置在序列中的所处的维度，奇数维度的用正弦函数编码，偶数维度用余弦函数编码。

16、根据本专利技术第一方面的方法，在所述步骤s3中，transformer网络的主体结构是编码器和解码器结构。

17、根据本专利技术第一方面的方法，在所述步骤s3中，transformer网络的编码器的内部主要包含多头注意力层和前馈神经网络，有残差网络的连接操作；

18、所述多头注意力层得到多组迭代后的序列，合并经过前馈神经网络，对特征进行浓缩，重复上述过程，提取更深层次的特征。

19、根据本专利技术第一方面的方法，在所述步骤s3中，transformer网络的注意力层的每个自注意力模块是通过设置查询矩阵q、键值矩阵k、值矩阵v三个矩阵来实现的，主要使用的是值矩阵v，每经过一个注意力模块，就会对值矩阵进行一次迭代。

20、本专利技术第二方面公开了一种水面无人艇对水下目标的识别系统，所述系统包括：

21、第一处理模块，被配置为，获取目标的图像并进行预处理；

22、第二处理模块，被配置为，搭建cnn主干网络，提取图像第一特征的序列，并引入位置编码；

23、第三处理模块，被配置为，将所述图像第一特征序列输入transformer网络的编码器，提取图像第二特征；

24、第四处理模块，被配置为，将所述图像第二特征输入transformer网络的解码器，输出识别结果；

25、第五处理模块，被配置为，应用预处理后的目标的图像对所述cnn主干网络、transformer网络的编码器和transformer网络的解码器构成的detr模型进行训练，监控损失变化；

26、第六处理模块，被配置为，按目标识别性能指标评价detr模型训练结果，并存储detr模型训练参数；

27、第七处理模块，被配置为，用训练好的detr模型对待检测目标图像进行识别，得到识别结果。

28、根据本专利技术第二方面的系统，所述第二处理模块102具体被配置为，所述位置编码的维度与所述序列的维度相同。

29、产生所述位置编码具体包括：

30、正弦或余弦函数编码，编码规则为：

31、

32、

33、pos表示序列所处的位置，dmodel表示所编码序列的维度大小，i表示所编码的位置在序列中的所处的维度，奇数维度的用正弦函数编码，偶数维度用余弦函数编码。

34、具体地，引入位置编码(positional encoding)体现输入序列的位置，让网络模型能够对整体信息和位置关系有一定的认识。

35、根据本专利技术第二方面的系统，所述第三处理模块具体被配置为，transformer网络的主体结构是编码器和解码器结构。

36、transformer网络的编码器的内部主要包含多头注意力层和前馈神经网络，有残差网络的连接操作，提高了网络的泛化能力，在残差连接相加后又加入正则化操作，使训练更容易收敛，提高了网络训练质量；

37、所述多头注意力层得到多组迭代后的序列，合并经过前馈神经网络，对特征进行浓缩，重复上述过程，提取更深层次的特征。

38、transformer网络的注意力层的每个自注意力模块是通过设置查询矩阵q、键值矩阵k、值矩阵v三个矩阵来实现的，主要使用的是值矩阵v，每经过一个注意力模块，就会对值矩阵进行一次迭代。公式为：

39、本专利技术第三方面公开了一种电子设备。电子设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时，实现本公开第一方面中任一项的一种水面无人艇对水下目标的识别方法中的步骤。

40、本专利技术第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时，实现本公开第一方面中任一项的一种水面无人艇对水下目标的识别方法中的步骤。

41、综上，本专利技术提出的方案能够充分利用detr模型的transformer框架所引入的注意力机制，可以让网络模型更加注重整体语义，增强了模型的泛化能力和鲁棒性，有效提高水下复杂的环境中目标识别的速度和精度。

本文档来自技高网...

【技术保护点】

1.一种水面无人艇对水下目标的识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤S2中，所述位置编码的维度与所述序列的维度相同。

3.根据权利要求2所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤S2中，产生所述位置编码的方法包括：

4.根据权利要求1所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤S3中，Transformer网络的主体结构是编码器和解码器结构。

5.根据权利要求4所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤S3中，Transformer网络的编码器的内部主要包含多头注意力层和前馈神经网络，有残差网络的连接操作；

6.根据权利要求4所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤S3中，Transformer网络的注意力层的每个自注意力模块是通过设置查询矩阵Q、键值矩阵K、值矩阵V三个矩阵来实现的，使用的是值矩阵V，每经过一个注意力模块，就会对值矩阵进行一次迭代。p>

7.一种用于水面无人艇对水下目标的识别系统，其特征在于，所述系统包括：

8.根据权利要求7所述的一种水面无人艇对水下目标的识别系统，其特征在于，所述第二处理模块，被配置为，所述位置编码的维度与所述序列的维度相同；

9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时，实现权利要求1至6中任一项所述的一种水面无人艇对水下目标的识别方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现权利要求1至6中任一项所述的一种水面无人艇对水下目标的识别方法中的步骤。

...

【技术特征摘要】

1.一种水面无人艇对水下目标的识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤s2中，所述位置编码的维度与所述序列的维度相同。

3.根据权利要求2所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤s2中，产生所述位置编码的方法包括：

4.根据权利要求1所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤s3中，transformer网络的主体结构是编码器和解码器结构。

5.根据权利要求4所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤s3中，transformer网络的编码器的内部主要包含多头注意力层和前馈神经网络，有残差网络的连接操作；

6.根据权利要求4所述的一种水面无人艇对水下目标的识别方法，其特征在于，在所述步骤s3中，transf...

【专利技术属性】
技术研发人员：骆福宇，陈卓，韩玮，张孟超，宋胜男，董钉，杨博，孙溪桥，温利鑫，房姝彤，袁鑫，唐平鹏，李宁，
申请(专利权)人：中国船舶集团有限公司系统工程研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人