当前位置: 首页 > 专利查询>吉林大学专利>正文

一种水下深度图超分辨率方法技术

技术编号:36798688 阅读:19 留言:0更新日期:2023-03-08 23:23
本发明专利技术是一种水下深度图超分辨率方法。本发明专利技术涉及超分辨率技术领域,本发明专利技术包括:步骤1通过Kinect相机采集训练时所需要的数据,步骤2确定合适的评价指标来衡量模型输出的深度图像和原始高分辨率深度图像的几何差距,本方法中使用到的是均方根误差和感知误差;步骤3搭建适用于水下环境的深度图像超分辨率网络(DSTN网络),其主要包含以下四个模块:特征融合模块、独立特征提取模块、深度图像变换器、多尺度学习模块;步骤4网络的参数更新与训练。通过本申请中的技术方案,对水下拍摄的深度图像实现超分辨率,还原水下深度图像更多的细节,从而弥补大多数深度相机拍摄的深度图的分辨率和精度都不足以满足实际应用的缺陷。率和精度都不足以满足实际应用的缺陷。率和精度都不足以满足实际应用的缺陷。

【技术实现步骤摘要】
一种水下深度图超分辨率方法


[0001]本专利技术涉及超分辨率
,是一种水下深度图超分辨率方法。

技术介绍

[0002]水下图像在海洋研究和水下机器人领域都具有重要的应用,观察海洋生物、进行水下作业都需要清晰的图像。然而由于水的折射和水中悬浮颗粒的散射对光造成大幅度的衰减,同时水体的多样性也造成了水下图像的质量不尽如人意,很多视觉任务都会在质量较低的水下图像上失效。而在当今生活中,深度图逐渐成为各了许多水下任务中广泛使用的元素之一,有了深度图提供的补充性的几何信息,这些任务有了更好的性能表现。然而,由于传感器技术的限制,大多数深度相机拍摄的水下深度图的分辨率和精度都不足以满足实际应用。这些低精度的深度图像会出现边缘模糊、精度下降等问题,大大影响了其在现实生活中的应用。因此,水下深度图的超分辨率,旨在从低分辨率的水下深度图中获得高分辨率的水下深度图。这已经成为计算机视觉中的一项重要和具有挑战性的任务。然而,深度图像超分辨率尤其是拍摄于水下的深度图有以下两个缺点:第一,将一个深度图像从低分辨率变成高分辨率是复杂而不确定的,生成的高分辨率图像并不是唯一的。第二,由于在水下环境中光线相对较暗,大多数模型不能恢复低分辨率深度图的模糊边缘,难以将深度图像超分辨率到满意的精度。所以,本专利技术所提出的红外图像指导的深度图像超分辨率在这种情况下会有很好的应用前景,即使在光线不充足的水下能够达到良好的效果。

技术实现思路

[0003]本专利技术为克服现有技术的不足,本专利技术对水下拍摄的深度图像实现超分辨率,还原水下深度图像更多的细节。
[0004]本专利技术提供一种水下深度图超分辨率方法,该方法可以完成水下光线不充足条件下的深度图像超分辨率任务,生成满足实际应用需求的高精度深度图像。
[0005]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0006]本专利技术提供了一种水下深度图超分辨率方法,本专利技术提供了以下技术方案:一种水下深度图超分辨率方法,所述方法包括以下步骤:步骤1:通过相机采集训练时所需要的水下图像数据;步骤2:确定评价指标,确定合适的评价指标来衡量模型输出的深度图像和原始高分辨率深度图像的几何差距;步骤3:进行网络模型搭建,通过网络模型生成高精度的深度图像;
步骤4:进行网络的参数更新和训练,实现红外图像指导的水下深度图像超分辨率,还原水下深度图像。
[0007]优选地,所述步骤1具体为:采用Kinect相机,在设定好Kinect相机的拍摄模式、拍摄分辨率后,通过Kinect对数千个光线差的水下场景拍摄配对的深度图像、红外图像和彩色图像,对图像进行裁剪和预处理,使用双三次插值算法将深度图像下采样,生成低分辨率的深度图像,用于模型的训练。
[0008]优选地,所述步骤2具体为:采用了均方根误差和感知误差作为评价输出的深度图像和原始高分辨率深度图像的差距,均方根误差等于两张相同尺寸图片对应像素之间差值的平方求和后开方;感知误差则是VGG网络计算出的两张图片之间特征图像的均方根误差:均方根误差通过下式表示:感知误差通过下式表示:总误差的公式通过下式表示:其中,表示生成的高分辨率深度图像,表示原始高分辨率深度图像,表示VGG网络的层数,为中间高分辨率深度图像,为经过VGG网络计算得出的原始高分辨率深度特征图像,为经过VGG网络计算得出的中间高分辨率深度特征图像。
[0009]优选地,所述步骤3具体为:搭建基于红外图像指导的适用于水下环境的深度图像超分辨率DSTN网络模型,所述网络模型包括特征融合模块、独立特征提取模块、深度图像变换器和多尺度学习模块,所述DSTN网络模型通过特征融合模块将红外图像和彩色图像的特征融合在一起,特征融合模块中运用了通道注意力机制来对特征层加权,融合后的图像会被独立特征提取模块提取特征,而后经过深度图像变换器和多尺度学习模块和深度图像相融合,生成高精度的深度图像。
[0010]优选地,所述特征融合模块用于将红外图像和彩色图像的特征融合在一起;所述独立特征提取模块用于提取融合后的图像特征;所述深度图像变换器用于将RGB特征和红外图像IR特征与深度图DL特征相结合;所述多尺度学习模块用于在不同尺度上进一步融合深度图像变换器的输出。
[0011]优选地,特征融合模块的输出被用作基于VGG的特征提取器的输入,连接了高分辨
率彩色图像的三个通道和高分辨率红外图像的一个通道,根据一个卷积层Conv(4,3)和三个卷积层Conv(3,3)对所连接的图像进行非线性变换,从而实现红外图像引导的超分辨率;独立特征提取模块使用预先训练过的VGG19作为单独的特征提取器的主干,在进行特征提取之前,将低分辨率深度图DL进行双边缘上采样得到

DL,再对得到的特征图G进行顺序降采样和双上采样得到
↓↑
G,使用单独的特征提取器从G,
↓↑
G和

DL中分别提取4
×
、2
×
和1
×
尺度的特征图,具有不同尺度的特征图将被输入到三个深度图像变换器中去;深度图像变换器相关性计算和注意图,相关性计算操作通过计算特征图
↓↑
G和

DL之间的相关性来估计低分辨率深度图和指导标签之间的相似性,将输入的特征图展开成补丁序列和,并进行归一化的内积,得到相关性映射R,其中,C表示输入特征映射的通道号,k表示展开操作的核大小,L表示补丁序列的长度,具体公式如下:公式如下:公式如下:其中,表示展开操作,表示相关性计算,g表示展开后的相似性最大的补丁序列,d表示展开后的最大的补丁,Rij表示得到的相关性映射序列,Output表示输出序列;注意图方面使用硬注意和软注意,对于一个补丁

DL,硬注意通过在R上使用argmax函数找到其中相似性最大的补丁
↓↑
G,软注意使用传统的注意机制来计算空间权重通过下式表示:通过下式表示:其中,表示硬注意机制的空间权重,S表示软注意机制的空间权重;硬注意力操作根据H中的指标标识相应的特征补丁
↓↑
G,并将其融合到

DL,将硬注意操作的输出按元素方向乘以S,得到空间加权特征,如以下所示:其中,是元素级乘法,是硬注意操作;多尺度学习模块进一步融合1
×
、2
×
和4
×
深度图像变换器的输出,1
×
、2
×
和4
×
分支分别经历3个阶段;在每个阶段结束时,通过双尺度下采样和上采样来交换不同尺度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水下深度图超分辨率方法,其特征是:所述方法包括以下步骤:步骤1:通过相机采集训练时所需要的水下图像数据;步骤2:确定评价指标,确定合适的评价指标来衡量模型输出的深度图像和原始高分辨率深度图像的几何差距;步骤3:进行网络模型搭建,通过网络模型生成高精度的深度图像;步骤4:进行网络的参数更新和训练,实现红外图像指导的水下深度图像超分辨率,还原水下深度图像。2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:采用Kinect相机,在设定好Kinect相机的拍摄模式、拍摄分辨率后,通过Kinect对数千个光线差的水下场景拍摄配对的深度图像、红外图像和彩色图像,对图像进行裁剪和预处理,使用双三次插值算法将深度图像下采样,生成低分辨率的深度图像,用于模型的训练。3.根据权利要求2所述的方法,其特征是:所述步骤2具体为:采用了均方根误差和感知误差作为评价输出的深度图像和原始高分辨率深度图像的差距,均方根误差等于两张相同尺寸图片对应像素之间差值的平方求和后开方;感知误差则是VGG网络计算出的两张图片之间特征图像的均方根误差:均方根误差通过下式表示:感知误差通过下式表示:总误差的公式通过下式表示:其中,表示生成的高分辨率深度图像,表示原始高分辨率深度图像,表示VGG网络的层数,为中间高分辨率深度图像,为经过VGG网络计算得出的原始高分辨率深度特征图像,为经过VGG网络计算得出的中间高分辨率深度特征图像。4.根据权利要求3所述的方法,其特征是:所述步骤3具体为:搭建基于红外图像指导的适用于水下环境的深度图像超分辨率DSTN网络模型,所述网络模型包括特征融合模块、独立特征提取模块、深度图像变换器和多尺度学习模块,所述DSTN网络模型通过特征融合模块将红外图像和彩色图像的特征融合在一起,特征融合模块中运用了通道注意力机制来对特征层加权,融合后的图像会被独立特征提取模块提取特征,而后经过深度图像变换器和多尺度学习模块和深度图像相融合,生成高精度的深度图像。5.根据权利要求4所述的方法,其特征是:
所述特征融合模块用于将红外图像和彩色图像的特征融合在一起;所述独立特征提取模块用于提取融合后的图像特征;所述深度图像变换器用于将RGB特征和红外图像IR特征与深度图DL特征相结合;所述多尺度学习模块用于在不同尺度上进一步融合深度图像变换器的输出。6.根据权利要求5所述的方法,其特征是:特征融合模块的输出被用作基于VGG的特征提取器的输入,连接了高分辨率彩色图像的三个通道和高分辨率红外图像的一个通道,根据一个卷积层Conv(4,3)和三个卷积层Conv(3,3)对所连接的图像进行非线性变换,从而实现红外图像引导的超分辨率;独立特征提取模块使用预先训练过的VGG19作为单独的特征提取器的主干,在进行特征提取之前,将低分辨率深度图DL进行双边缘上采样得到

DL,再对得到的特征图G进行顺序降采样和双上采样得到
↓↑
G,使用单独的特征提取器从G,
↓↑
G和

DL中分别提取4
×
、2
×
和1
×

【专利技术属性】
技术研发人员:姜宇齐红赵明浩王跃航陈天悦魏枫林王凯
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1