复杂场景下合成孔径声纳图像多尺度目标检测方法及系统技术方案

技术编号:39679149 阅读:13 留言:0更新日期:2023-12-11 18:56
本发明专利技术涉及水声信号处理领域,尤其涉及复杂场景下合成孔径声纳图像多尺度目标检测方法及系统,所述方法包括:对阵元接收的声学回波数据进行处理,得到满足尺寸要求的合成孔径声纳图像;将满足尺寸要求的合成孔径声纳图像输入预先建立和训练好的目标检测模型,实现水下多尺度目标检测;所述目标检测模型为改进的

【技术实现步骤摘要】
复杂场景下合成孔径声纳图像多尺度目标检测方法及系统


[0001]本专利技术涉及水声信号处理领域,尤其涉及复杂场景下合成孔径声纳图像多尺度目标检测方法及系统


技术介绍

[0002]合成孔径声纳
(Synthetic Aperture Sonar,SAS)
是一种高分辨率水下成像声纳,其基本原理是利用小孔径基阵的移动形成虚拟大孔径,从而获得方位向的高分辨率

与普通侧扫声纳相比,
SAS
最为显著的优点是方位向分辨率较高,且理论分辨率与目标距离以及采用的声波频段无关

合成孔径声纳图像目标检测任务在水下无人平台自主导航和搜索发挥着重要作用

考虑水底环境的复杂性以及水下目标尺寸的多样性,这会进一步增加目标检测的难度

[0003]传统的检测和识别方法包括:人工判读和模式识别

众所周知,人工判读存在效率低

耗时长

主观不确定性大和经验依赖性强等问题,而模式识别通过人工提取灰度

纹理

边缘和形状等特征,经过图像和数据处理后设计分类器进行判别

上述方法适用于简单或者特征明显的目标判别,对于复杂场景下的水下目标,传统特征提取算法存在特征设计难度大

运算冗余以及泛化性和鲁棒性差等问题

近年来,随着计算机视觉领域的蓬勃发展,基于深度学习的目标识别与检测相关技术研究正在开展,尤其是以卷积神经网络
(Convolutional Neural Networks

CNN)
代替人工判读和模式识别

因此,通过借鉴深度学习技术提高
SAS
图像感兴趣小目标的检测识别精度具有重要的理论和实践意义
.Williams
等人利用
CNN

SAS
图像目标进行分类识别,提高了
SAS
图像目标的分类准确率
。McKay
等人在
CNN
的基础上,通过迁移学习进一步提高了
SAS
图像水下目标的分类准确率
。Williams
等人通过分析
CNN
的计算复杂度,选取参数更少的网络来对水下目标进行分类识别

上述三种
SAS
图像水下目标识别方法主要是利用
CNN

SAS
图像进行分类识别,因此无法获取图像内目标的位置信息

目前,基于
CNN
的目标检测模型在一个框架内实现了目标检测和识别的统一
.Li
等提出了基于
SSD
的水下多尺度目标检测方法,不过,该方法不能适用复杂场景下的
SAS
图像多尺度目标检测
。Tang
等人利用
Faster R

CNN
网络实现了声纳图像海底沉船目标的自动检测
。Faster

RCNN
考虑正负样本的平衡性,设置正负区域交并比
(intersection over union

IOU)

0.5
,这使得其目标检测并不是很准确,因为
IOU

0.5
时区域内含有较多背景,造成很多误检,而直接使用提高
IOU
的阈值会造成正负样本不均衡问题,使得漏检率大大提高

[0004]综上所述,目前急需一种适用复杂场景下
SAS
图像多尺度目标检测精度的方法,以提高后续目标精细化识别的准确率与效率


技术实现思路

[0005]本专利技术的目的在于克服现有技术缺陷,提出了复杂场景下合成孔径声纳图像多尺度目标检测方法及系统

[0006]为了实现上述目的,本专利技术提出了一种复杂场景下合成孔径声纳图像多尺度目标检测方法,所述方法包括:
[0007]步骤
1)
对阵元接收的声学回波数据进行处理,得到满足尺寸要求的合成孔径声纳图像;
[0008]步骤
2)
将标准尺寸合成孔径声纳图像输入预先建立和训练好的目标检测模型,实现水下多尺度目标检测;
[0009]所述目标检测模型为改进的
Cascade

RCNN
网络,所述改进的
Cascade

RCNN
网络包括高分辨率骨干网络,高分辨率骨干网络采用改进的特征提取模块

[0010]优选的,所述步骤
1)
具体包括:
[0011]对阵元接收到的声学回波数据进行处理,得到合成孔径声纳图像,再基于图像宽度进行切割,得到满足尺寸要求的合成孔径声纳图像

[0012]优选的,所述改进的
Cascade

RCNN
网络包括依次连接的:
[0013]高分辨率骨干网络,用于作为特征提取的骨干网络来构建多层次表征;
[0014]区域提案网络,用于生成候选目标边界框提案;
[0015]特征融合网络,用于对多尺度特征进行融合增强;
[0016]具有阈值的三个级联对象检测器,用于进行边界框回归和分类;和
[0017]Soft NMS
模块,用于获得最终的水下多尺度目标检测结果

[0018]优选的,所述改进的特征提取模块的输入为特征
D
,输出
D
BBSS
为:
[0019]D
BBSS

D+D
sim

[0020]其中,
D
sim
为第一支路的输出,所述第一支路为依次连接的第一
3x3
卷积层单元
、SGE
组件

第二
3x3
卷积层单元和
SIM
组件,所述第一
3x3
卷积层单元包括
BN
层和
ReLU
层,第二
3x3
卷积层单元包括
BN


[0021]优选的,所述第一支路的处理过程具体包括:
[0022]输入特征
D
经过第一个
3x3
卷积层单元,其输出特征
D1为:
[0023]D1=
f1(D),D∈
Φ
H
×
H
×
M
[0024]其中,
H
×
H
为输入特征的尺寸,
M本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种复杂场景下合成孔径声纳图像多尺度目标检测方法,所述方法包括:步骤
1)
对阵元接收的声学回波数据进行处理,得到满足尺寸要求的合成孔径声纳图像;步骤
2)
将满足尺寸要求的合成孔径声纳图像输入预先建立和训练好的目标检测模型,实现水下多尺度目标检测;所述目标检测模型为改进的
Cascade

RCNN
网络,所述改进的
Cascade

RCNN
网络包括高分辨率骨干网络,所述高分辨率骨干网络采用改进的特征提取模块
。2.
根据权利要求1所述的复杂场景下合成孔径声纳图像多尺度目标检测方法,其特征在于,所述步骤
1)
具体包括:对阵元接收到的声学回波数据进行处理,得到合成孔径声纳图像,再基于图像宽度进行切割,得到满足尺寸要求的合成孔径声纳图像
。3.
根据权利要求1所述的复杂场景下合成孔径声纳图像多尺度目标检测方法,其特征在于,所述改进的
Cascade

RCNN
网络包括依次连接的:高分辨率骨干网络,用于作为特征提取的骨干网络来构建多层次表征;区域提案网络,用于生成候选目标边界框提案;特征融合网络,用于对多尺度特征进行融合增强;具有阈值的三个级联对象检测器,用于进行边界框回归和分类;和
Soft NMS
模块,用于获得最终的水下多尺度目标检测结果
。4.
根据权利要求1所述的复杂场景下合成孔径声纳图像多尺度目标检测方法,其特征在于,所述改进的特征提取模块的输入为特征
D
,输出
D
BBSS
为:
D
BBSS

D+D
sim
;其中,
D
sim
为第一支路的输出,所述第一支路为依次连接的第一个
3x3
卷积层单元
、SGE
组件

第二个
3x3
卷积层单元和
SIM
组件,所述第一个
3x3
卷积层单元包括
BN
层和
ReLU
层,第二个
3x3
卷积层单元包括
BN

。5.
根据权利要求4所述的复杂场景下合成孔径声纳图像多尺度目标检测方法,其特征在于,所述第一支路的处理过程具体包括:输入特征
D
经过第一个
3x3
卷积层单元,其输出特征
D1为:
D1=
f1(D),D∈
Φ
H
×
H
×
M
其中,
H
×
H
为输入特征的尺寸,
M
为输入特征的通道数,
Φ
表示特征图,
f1为第一个
3x3
卷积层单元;
D1进入
SGE
组件,按通道维度将
D1分为
G
个组,对每个组进行单独处理,
SGE
组件输出特征
D
sge
,其中第
i
个输出特征为:其中,为第
i
个卷积组,
σ
()
为激活函数,
a
i
为第...

【专利技术属性】
技术研发人员:李宝奇黄海宁刘纪元刘正君韦琳哲
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1