当前位置: 首页 > 专利查询>浙江大学专利>正文

一种自监督的修复前视声呐图像卷帘门效应的方法技术

技术编号:38889314 阅读:18 留言:0更新日期:2023-09-22 14:15
本发明专利技术公开了一种自监督的修复前视声呐图像卷帘门效应的方法。本发明专利技术利用隐式神经表示拟合因受卷帘门效应污染而产生分裂效果的声学图像,自适应地恢复出不同时刻所激活的传感通道之间所经过的位移距离。将得到的位移距离在声学图像中补偿,可得到去除卷帘门效应的声学图像。本发明专利技术所提出的修复前视声呐图像卷帘门效应的方法适应于基于声学透镜的前视声呐于高速运动下获取的声学图像,克服了卷帘门效应所导致的声学图像分裂的缺点。该方法仅需单张声学图像,无需训练数据,无需外部定位、测速数据输入。恢复后声学图像可用于图像拼接、目标识别、三维重建等后续工作,拓展了基于声学透镜的前视声呐的使用范围。学透镜的前视声呐的使用范围。学透镜的前视声呐的使用范围。

【技术实现步骤摘要】
一种自监督的修复前视声呐图像卷帘门效应的方法


[0001]本专利技术属于计算机视觉领域,具体涉及一种自监督的修复前视声呐图像卷帘门效应的方法。

技术介绍

[0002]水下探测技术是应用最为广泛的海洋技术之一。水下搜救、船坞安全检测、水底生物栖息地探查等任务均需水下探测技术的支持。声呐因其探测介质几乎不受水体浑浊程度的影响,作用距离较远等特点而备受关注。其中,前视声呐作为新兴的声呐类型,因其成像分辨率极高、成像帧率极高、价格相对较低等特点,而成为水下探测技术的研究热门。在这之中,基于声学透镜的前视声呐因其极高的波束分辨率以及较多的采样点数而受到学界、业界的喜爱。其中,基于声学透镜的前视声呐因其分周期的成像方式而具备目前最好的成像清晰度,并广受学界、业界的青睐。型号主要为美国SoundMetrics公司所研发的DIDSON系列与ARIS系列前视声呐。
[0003]基于声学透镜的前视声呐的高信噪比主要得益于较低的通道间串扰,其达成这一效果的主要方式为其特有的分周期通道激活的成像策略。假设其具有N
beams
个波束,其分N
cycles
={4,8}次形成图像,每次激活通道数N
once
=N
beams
/N
cycles
个,激活时间t
once
=t
full
/N
cycles
。其中,t
full
为形成一张声学图像的总时间。第n
c
∈{0,1,...,N
cycles

1}个周期激活的通道序号为{0,1,...,N
once

1}*N
cycles
+n
c
。这种成像策略从空间和时间上错开通道,使波束旁瓣能量导致的通道间串扰尽可能降低。然而,激活时间上的错开导致不同时刻声呐坐标原点不一定相同。如,当声呐处于高速运动时,不同激活时刻声呐所处位置较远,则采集到的声学图像有明显的分裂效果。这一现象的形成原理与卷帘门摄像头的卷帘门效应类似,因此称其为声呐的卷帘门效应。在这一效应影响下的声学图像无法直接作用于图像拼接、三维重建、目标识别的计算机视觉任务。这对基于声学图像的导航定位、目标识别、三维重建任务提出了巨大的挑战。
[0004]目前尚没有技术针对基于声学透镜的前视声呐的卷帘门效应进行自监督修复。SoundMetrics官方给出的解决方法需外部测速数据输入。然而,受限于平台的装载能力、功耗要求、经费预算、标定精度等影响,外部测速数据不一定总是精确存在。因此,提出一种自监督的修复前视声呐图像卷帘门效应的方法尤为重要。其仅需单张声学图像,无需训练数据,无需外部定位、测速数据输入,降低对测速设备的需求,减少平台的载荷压力与功耗。其拓展了基于声学透镜的前视声呐的应用场景,无论水下平台是对静物进行低速、高清晰度的观测,还是对海底进行高速的扫描,都可采用同一种前视声呐设备,于实际应用有显著、重要的帮助。

技术实现思路

[0005]本专利技术的目的在于针对现有技术的不足,提供一种自监督的修复前视声呐图像卷帘门效应的方法。
[0006]本专利技术的目的通过如下方式实现:一种自监督的修复前视声呐图像卷帘门效应的方法,该方法包括以下步骤:
[0007]S1、获取原始声学图像并生成表示采样点所处空间的坐标矩阵;
[0008]S2、对生成的图像经表示通道间位移的可学习参数进行调整,通过映射函数获取高频信息,得到最终坐标矩阵;
[0009]S3、将最终坐标矩阵进行隐式神经表示,将隐式神经表示的输出与采集到的真值形成损失函数更新可学习参数和权重;
[0010]S4、将声学图像生成网格坐标,利用训练好的隐式神经表示得到去卷帘门效应的声学图像。
[0011]进一步地,所述S1中坐标矩阵其中N
beams
为声呐的波束数量,N
bins
为每一个波束沿时间轴的采样点个数;该矩阵的长边归一化至1,其余维度保持比例缩放。
[0012]进一步地,所述可学习参数用于表示相邻时刻所激活的通道所表示的声呐原点经过的物理位移,用表示,其中,x与y表示位移,θ表示旋转。
[0013]进一步地,所述映射函数为其中,C为坐标输入,为可以表征输入C高频信息的映射函数,L控制高频信息表征时频率个数的选择,α为使能因子,控制高频信息表征时不同频率的使能状态;
[0014]进一步地,所述映射函数具体为:
[0015][0016]其中,x∈C为某一点的二维坐标,
[0017]f
k
(x;α)=w
k
(α)[cos(2
k
πx),sin(2
k
πx)],
[0018]其中,k∈{0,1,...,L

1}表示第k个频率,
[0019][0020]进一步地,所述映射函数中,使能因子α倾向于随拟合过程进行,使映射得到的高频信息逐渐增多。
[0021]进一步地,所述隐式神经表示具体为:以可学习参数和映射函数调整后的图像坐标为输入,多层感知机作为网络主体,声学图像像素值作为输出的神经网络。
[0022]进一步地,所述损失函数更新中,可学习参数参与计算的过程可微,更新过程中通过反向传播一起更新的权重与可学习参数。
[0023]进一步地,所述S4中,拟合完成的隐式神经表示包含去卷帘门效应后的声学图像信息,使用图片坐标网格进行采样后即可得到去卷帘门效应后的声学图像。
[0024]本专利技术的有益效果在于:本方法无需训练数据,无需外部定位、测速数据输入,可自监督地去除高速移动下的基于声学透镜的前视声呐所采集的声学图像中所出现的卷帘门效应。其修复了图像的分裂效果,为后续基于声学图像的计算机视觉任务的成功解决提供基础。
附图说明
[0025]图1自监督修复前视声呐图像卷帘门效应的流程图;
[0026]图2隐式神经表示的网络结构示意图。
具体实施方式
[0027]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。
[0028]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施例的限制。下面结合附图对本专利技术的具体实施方法作进一步说明:
[0029]本专利技术公开了一种自监督的修复前视声呐图像卷帘门效应的方法,其仅需单张声学图像,无需训练数据,无需外部定位、测速数据输入,可自适应地恢复出不同时刻所激活的传感通道之间所经过的位移距离。将得到的位移距离在声学图像中补偿,可得到去除卷帘门效应的声学图像,
[0030]整体过程如图1所示:将获取的声学图像生成坐标,由表示通道间位移本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自监督的修复前视声呐图像卷帘门效应的方法,其特征在于,该方法包括以下步骤:S1、获取原始声学图像并生成表示采样点所处空间的坐标矩阵;S2、对生成的图像经表示通道间位移的可学习参数进行调整,通过映射函数获取高频信息,得到最终坐标矩阵;S3、将最终坐标矩阵进行隐式神经表示,将隐式神经表示的输出与采集到的原始声学图像真值形成损失函数更新可学习参数和权重;S4、将声学图像生成网格坐标,利用拟合完成的隐式神经表示得到去卷帘门效应的声学图像。2.根据权利要求1所述的一种自监督的修复前视声呐图像卷帘门效应的方法,其特征在于,所述S1中坐标矩阵其中N
beams
为声呐的波束数量,N
bins
为每一个波束沿时间轴的采样点个数;该矩阵的长边归一化至1,其余维度保持比例缩放。3.根据权利要求1所述的一种自监督的修复前视声呐图像卷帘门效应的方法,其特征在于,所述可学习参数用于表示相邻时刻所激活的通道所表示的声呐原点经过的物理位移,用表示,其中,x与y表示位移,θ表示旋转。4.根据权利要求1所述的一种自监督的修复前视声呐图像卷帘门效应的方法,其特征在于,所述映射函数为其中,C为坐标输入,为用于表征输入C高频信息的映射函数,L控制高频信息表征时频率个数的选择,α为使能因子,控制高频信息表征时不同频率的使能状态。5.根据权利...

【专利技术属性】
技术研发人员:魏艳苏家艺涂星滨瞿逢重
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1