基于联合隐式图像函数的RGB图像引导深度图超分辨率方法技术

技术编号：31610200 阅读：21 留言：0更新日期：2021-12-29 18:38

本发明专利技术公布了一种基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，建立用于深度图超分辨率图像恢复的深度神经网络模型，包含RGB图像编码器，深度图编码器以及JIIF解码器；采用隐式神经表示方法，建立适用于RGB引导的深度图超分辨率任务的联合隐式图像函数，对多模态输入进行建模；通过所建立深度神经网络模型的两个编码器从RGB图像以及输入的低分辨率深度图中分别提取特征；再通过JIIF解码器对高分辨率下的每个像素深度值进行预测并输出；实现基于联合隐式图像函数的RGB图像引导深度图超分辨率图像恢复。本发明专利技术方法在RGB图像引导的深度图像超分辨率恢复任务上取得了优于现有技术的图像恢复效果，具有较好的可解释性。释性。释性。

全部详细技术资料下载

【技术实现步骤摘要】
基于联合隐式图像函数的RGB图像引导深度图超分辨率方法

[0001]本专利技术涉及一种基于联合隐式图像函数的RGB图像引导的深度图超分辨率(图像恢复)方法，可应用于RGB图像引导的深度图超分辨率任务，具体涉及一种联合隐式图像函数的定义以及一个用于从数据中学习此函数的深度神经网络模型，用于将低分辨率、含有噪声的深度图恢复为高分辨率、无噪声的深度图，属于计算机视觉图像处理

技术介绍

[0002]RGB图像引导的深度图超分辨率任务指的是从一张低分辨率、含有噪声的深度图以及一张对应的高分辨率的RGB图像中恢复高分辨率、无噪声的深度图的任务，在三维重建等任务中有着实际的应用。受限于深度传感器的精度，采集到的深度图通常质量较低，但RGB相机的发展使得高质量的RGB图像可以较容易地获取。现有的深度图超分辨率图像恢复方法通常将这个深度图超分辨率图像恢复任务视为引导滤波(Guided Filtering)问题，通过构建显式的滤波器，将RGB图像中的结构细节转移到深度图中，从而提高深度图的质量，例如文献[1](He,Kaiming et al.“Guided Image Filtering.”IEEE Transactions on Pattern Analysis and Machine Intelligence 35,2013:1397
‑
1409.)。但由于RGB图像中信息的复杂性，这种方法可能会将不正确的信息转移到深度图中。另一种常见的方法将这个图像恢复任务视为一个稠密回归问题，通过监督学习的方法训练...

【技术保护点】

【技术特征摘要】
1.一种基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，其特征是，包括：建立深度神经网络模型，用于深度图超分辨率图像恢复；所建立的用于深度图超分辨率图像恢复的深度神经网络模型包含RGB图像编码器，深度图编码器以及联合隐式图像函数解码器(JIIF解码器)；采用隐式神经表示方法，建立适用于RGB引导的深度图超分辨率任务的联合隐式图像函数，对多模态输入进行建模；所述多模态的输入包括RGB图像和低分辨率深度图；通过所建立深度神经网络模型的RGB图像编码器和深度图编码器，从RGB图像以及输入的低分辨率深度图中分别提取特征；对于输出的高分辨率深度图中每一个像素，通过联合隐式图像函数预测插值公式中的权重与值；按照插值公式对每个像素的特征进行插值，得到高分辨率下的每一个像素的深度值；再通过JIIF解码器对高分辨率下的每个像素深度值进行预测并输出；利用训练好的用于深度图超分辨率图像恢复的深度神经网络模型，输入待恢复的RGB图像，进行深度图超分辨率图像恢复，即输出恢复好的深度图超分辨率图像，由此实现基于联合隐式图像函数的RGB图像引导深度图超分辨率图像恢复。2.如权利要求1所述基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，其特征是，具体包括如下步骤：A.通过两个编码器从输入的RGB图像以及低分辨率深度图中分别提取特征，提取的特征的分辨率保持不变，即与输入图像的分辨率相同，；A1.通过RGB图像编码器提取高分辨率RGB图像中每个像素处的特征；A2.通过深度图编码器提取低分辨率深度图像中每个像素处的特征；B.通过JIIF解码器输出预测的高分辨率深度图：通过神经网络学习目标像素与任一近邻像素的RGB特征之间的相似性，归一化处理后作为深度特征的插值权重；进一步使用联合隐式图像函数同时学习插值权重与值；再使用学习得到的权重与值进行加权求和，输出深度值预测值；具体包括：B1.对于高分辨率深度图中的每一个像素，即目标像素，寻找低分辨率深度图中坐标最近的四个近邻像素以及提取的深度特征；B2.在高分辨率RGB图像中找到目标像素对应的坐标处的RGB特征，以及四个近邻像素对应的坐标处的RGB特征；B3.使用联合隐式图像函数，输入上述目标像素以及近邻像素的坐标、深度特征以及RGB特征，输出目标像素与每个近邻像素间的插值权重以及值；B4.通过插值公式，计算B3中的插值权重以及值在目标像素处的插值结果，作为目标像素处预测的深度值。3.如权利要求1所述基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，其特征是，RGB图像编码器和深度图编码器分别提取输入图像的像素特征图，表示为：其中，x
i
与x
j
分别代表像素i与j的坐标，z
i
代表像素i处的RGB特征，g
j
代表像素j处的深
度图特征；使用连续图像表示方法，将坐标放缩到[
‑
1,1]内，使得不同分辨率下的坐标共享；将这些RGB特征和深度图特征作为输入图像空间中一系列的隐式编码，用来编码对应像素处的局部特征。4.如权利要求3所述基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，其特征是，编码器包括一系列的残差模块；具体可包含12个残差模块，每个模块提取的特征维度为128维。5.如权利要求3所述基于联合隐式图像函数的RGB图像引导深度图超分辨率方法，其特征是，根据图像插值公式定义联合隐式图像函数；对于低分辨率的输入图像M，通过如下插值公式得到高分辨率图像I中任一像素x
q
的值I(x
q
)：其中，N
q
是像素q的邻域...

【专利技术属性】
技术研发人员：唐嘉祥，陈小康，曾钢，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人