System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多视角声图的深度学习目标自动识别方法及系统技术方案_技高网

基于多视角声图的深度学习目标自动识别方法及系统技术方案

技术编号:40157843 阅读:8 留言:0更新日期:2024-01-26 23:32
本发明专利技术公开了一种基于多视角声图的深度学习目标自动识别方法及系统,其方法包括以下步骤:获取待测目标在同一声呐的多视角观测下的多视角声图数据集;对所述多视角声图数据集进行样本增广,得到声呐图像训练样本;基于误差反向传播算法及交叉熵代价函数,并利用所述声呐图像训练样本对卷积神经网络进行迭代训练,得到多视角并行深度卷积神经网络;利用所述多视角并行深度卷积神经网络对所述多视角声图数据集进行识别,得到待测目标的类别属性。本发明专利技术利用多个观测视角的声纳图像,能够为目标识别提供更加完整的特征信息,有利于目标的精细认知和识别。

【技术实现步骤摘要】

本专利技术涉及声纳图像识别,特别涉及一种基于多视角声图的深度学习目标自动识别方法及系统


技术介绍

1、声纳图像自动目标识别能够从大场景声纳图像中自动检测出感兴趣的目标,并准确识别其类别属性,实现由图像数据到情报信息的转化,是当前国际上亟待解决的前沿热点问题。

2、卷积神经网络(convolutional neural network, cnn)最早是为单视角图像目标识别任务所设计的机器学习模型,最早的实用cnn结构是由lecun设计的lenet-5,以lenet-5为代表的经典的cnn结构一般比较简单,只适合处理小尺寸的图像;后来的alexnet是首个在千万级规模数据量的大尺寸图像组成的数据集上训练的cnn结构。继alexnet之后,vggnet、resnet、inceptionnet、densenet等现代cnn结构不断刷新图像的分类准确度,并取得了超越人类的图像分类性能。尽管cnn的结构设计越来越复杂,但cnn结构并不具有视角不变性。也就是说,利用一个视角图像所训练的cnn难以识别其他视角图像。这是由于,从不同视角获取的目标声纳图像仅能获取目标部分的结构信息,不同视角图像所训练的cnn所提取出的不同视角特征之间差异较大。

3、因此,要利用cnn识别对同一目标的多视角声图还需要使用特定的识别方案。由于直接使用cnn处理多视角声图的研究较为缺乏,因此需要设计一种基于多视角声图的深度学习目标自动识别方案,而利用多个观测视角的声纳图像,能够为目标识别提供更加完整的特征信息,有利于目标的精细认知和识别,是声纳图像目标识别技术的重要发展方向。


技术实现思路

1、本专利技术提供一种基于多视角声图的深度学习目标自动识别方法及系统,利用多个观测视角的声纳图像,能够为目标识别提供更加完整的特征信息,有利于目标的精细认知和识别。

2、第一方面,提供一种基于多视角声图的深度学习目标自动识别方法,其特征在于,包括以下步骤:

3、获取待测目标在同一声呐的多视角观测下的多视角声图数据集;

4、对所述多视角声图数据集进行样本增广,得到声呐图像训练样本;

5、基于误差反向传播算法及交叉熵代价函数,并利用所述声呐图像训练样本对卷积神经网络进行迭代训练,得到多视角并行深度卷积神经网络;

6、利用所述多视角并行深度卷积神经网络对所述多视角声图数据集进行识别,得到待测目标的类别属性。

7、根据第一方面,在第一方面的第一种可能的实现方式中,所述按预设条件对所述多视角声图数据集进行样本增广,得到声呐图像训练样本步骤,具体包括以下步骤:

8、在所述多视角声图数据集中获取包括同一视角类目标声呐图像的所有视角声图组合数如下:

9、;

10、在包括同一视角类目标声呐图像的每一视角声图组合中,按方位角进行排序;

11、选取满足如下条件的每一视角声图组合中的声呐图像训练样本:

12、;

13、式中,为每一视角声图组合中包括的同一视角类目标声呐图像;为每一视角声图组合中的单视角目标声呐图像对应的方位角;为声呐视角区间;k为视角数;为多视角声图数据集中样本数量。

14、根据第一方面,在第一方面的第二种可能的实现方式中,所述基于误差反向传播算法及交叉熵代价函数,并利用所述声呐图像训练样本对卷积神经网络进行迭代训练,得到多视角并行深度卷积神经网络步骤,具体包括以下步骤:

15、基于误差反向传播算法,利用所述声呐图像训练样本对卷积神经网络进行迭代训练,并利用交叉熵代价函数根据每一次迭代训练结果优化卷积神经网络;

16、当检测到交叉熵代价函数取得全局最小值时,得到对应的多视角并行深度卷积神经网络。

17、根据第一方面的第二种可能的实现方式中,在第一方面的第三种可能的实现方式中,所述交叉熵代价函数的计算公式如下:

18、;

19、式中,为待测目标的声呐图像视角类别标签,为待测目标的声呐图像视角类别数;分别为多视角并行深度卷积神经网络的待训练参数;为softmax分类器的输入。

20、根据第一方面,在第一方面的第四种可能的实现方式中,所述利用所述多视角并行深度卷积神经网络对所述多视角声图数据集进行识别,得到待测目标的类别属性步骤,具体包括以下步骤:

21、顺次利用所述多视角并行深度卷积神经网络的卷积层、池化层及全连接层对所述多视角声图数据集进行识别,得到待测目标的类别属性。

22、根据第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述卷积层的计算公式如下:

23、;

24、其中,;

25、式中,为卷积运算;为非线性激活函数;为第层卷积层中的第个特征图;为神经网络中第个特征图与第层卷积层中的第个特征图的卷积核,为第层卷积层中的第个特征图的偏置;为第层卷积层中的第个特征图的softmax分类器输入。

26、根据第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述池化层的计算公式如下:

27、;

28、式中,和为池化窗尺寸;分别为第层卷积层中的第个特征图的x轴和y轴坐标;、分别为原始坐标经方位旋转后对应的声呐图像中目标像素坐标;为最大池化窗函数。

29、根据第一方面的第六种可能的实现方式,在第一方面的第七种可能的实现方式中,所述全连接层设置为softmax分类器,所述softmax分类器的计算公式如下:

30、;

31、式中,为待测目标的声呐图像视角类别标签,为待测目标的声呐图像视角类别数;为softmax分类器的输入;为第l层卷积层中的第个特征图的softmax分类器输入;为第l层卷积层中的第个特征图的softmax分类器输入。

32、根据第一方面,在第一方面的第八种可能的实现方式中,在所述获取待测目标在同一声呐的多视角观测下的多视角声图数据集步骤之后,具体包括以下步骤:

33、对所述多视角声图数据集中的每个单视角目标声呐图像通过如下公式进行方位旋转:

34、;

35、对所述多视角声图数据集中的每个单视角目标声呐图像通过如下公式进行图像灰度增强处理:

36、;

37、式中,为相对于目标方向的待测目标方位旋转角度,为声呐图像中目标像素的原始坐标,为原始坐标经方位旋转后对应的声呐图像中目标像素坐标;为幂变换因子。

38、第二方面,提供了一种基于多视角声图的深度学习目标自动识别系统,包括:

39、多视角获取模块,用于获取待测目标在同一声呐的多视角观测下的多视角声图数据集;

40、样本选取模块,与所述多视角获取模块通信连接,用于对所述多视角声图数据集进行样本增广,得到声呐图像训练样本;

41、训练模块,与所述样本选取模块通信连接,用于基于误差反向传播算法及交叉本文档来自技高网...

【技术保护点】

1.一种基于多视角声图的深度学习目标自动识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述基于误差反向传播算法及交叉熵代价函数,并利用所述声呐图像训练样本对卷积神经网络进行迭代训练,得到多视角并行深度卷积神经网络步骤,具体包括以下步骤:

3.如权利要求2所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述交叉熵代价函数的计算公式如下:

4.如权利要求1所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述利用所述多视角并行深度卷积神经网络对所述多视角声图数据集进行识别,得到待测目标的类别属性步骤,具体包括以下步骤:

5.如权利要求4所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述卷积层的计算公式如下:

6.如权利要求4所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述池化层的计算公式如下:

7.权利要求4所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述全连接层设置为Softmax分类器,所述Softmax分类器的计算公式如下:

8.如权利要求1所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,在所述获取待测目标在同一声呐的多视角观测下的多视角声图数据集步骤之后,具体包括以下步骤:

9.一种基于多视角声图的深度学习目标自动识别系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于多视角声图的深度学习目标自动识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述基于误差反向传播算法及交叉熵代价函数,并利用所述声呐图像训练样本对卷积神经网络进行迭代训练,得到多视角并行深度卷积神经网络步骤,具体包括以下步骤:

3.如权利要求2所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述交叉熵代价函数的计算公式如下:

4.如权利要求1所述的基于多视角声图的深度学习目标自动识别方法,其特征在于,所述利用所述多视角并行深度卷积神经网络对所述多视角声图数据集进行识别,得到待测目标的类别属性步骤,具体包括以下步骤:

...

【专利技术属性】
技术研发人员:范越张国平张鹏葛镜
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1