一种基于双支感知的深度图超分辨率重建网络构建方法技术

技术编号：24500337 阅读：23 留言：0更新日期：2020-06-13 04:49

本发明专利技术公开了一种基于双支感知的深度图超分辨率重建网络构建方法。传统的深度图像超分辨方法在效果和速度都不如基于卷积神经网络的方法，但大部分的超分辨卷积神经网络框架都都只是堆叠的卷积层，没有网络结构能判断彩色图像的纹理区域是否和深度图像中的纹理区域相关。本发明专利技术的基于注意力机制的卷积神经网络结构可以利用可学习参数判断彩色特征图像的纹理是否是深度图像重建所需要的，即可以更好的利用彩色图像所提供的信息，经过多级的感知机制最终获得筛选后的精细化的特征图像，融合这些信息对深度图像进行超分辨率重建。并且利用残差学习的思想，减轻了卷积神经网络的负担，提升了深度图像的重建效果。

A network construction method of super-resolution reconstruction of depth map based on two branch perception

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双支感知的深度图超分辨率重建网络构建方法
本专利技术属于计算机视觉领域，具体涉及一种基于双支感知的深度图超分辨率重建网络构建方法。
技术介绍
随着获取深度信息的技术的发展，如激光雷达，飞行时间(TOF)相机，三维结构光，深度图像已被广泛应用于移动机器人，人机交互，人体姿态估计和三维场景重建等。然而，从这些技术获得的深度图像仍然无法满足实际需求，尤其是获取的深度图像分辨率较低，质量较差。因此，如何将低分辨率的深度图像重建成高质量高分辨率深度图像成为计算视觉领域的研究热点。近年来，随着深度学习的发展，越来越多的基于卷积神经网络的超分辨方法被提出。经过在大量图片数据集上的训练，卷积神经网络能够充分学习图像的特征，并将这些特征进行组合得到最后的重建结果。相较传统的超分辨算法，基于卷积神经网络的超分辨算法需要依赖于非常大的数据集，所以通过卷积层提取出的特征更具有普适性，更能代表物体的通用特征。通常，基于CNN的深度超分辨率方法可以实现比传统方法更好的性能。目前大量的传统深度图像超分辨算法都是基于同场景的彩色图像引导的重建，获取高分辨率高质量的彩色图像的方法已经比较成熟，但相较于深度图像，彩色图像纹理区域会更多，利用普通的卷积神经网进行彩色图像引导深度图像重建可能会将这些无关纹理也带入重建中，因此需要一种方法可以判别彩色图像中的纹理区域是否能对深度图像超分辨重建提供有用信息。
技术实现思路
本专利技术的目的就是克服现有技术的不足，一种基于注意力机制的深度图超分辨率重建网络。本方法设计了...

【技术保护点】
1.一种基于双支感知的深度图超分辨率重建网络构建方法，其特征在于该方法的具体步骤是：/n步骤(1)：利用RGB-D相机获取同场景彩色图像和深度图像/n使用RGB-D相机得到一张低分辨率深度图像I

【技术特征摘要】
1.一种基于双支感知的深度图超分辨率重建网络构建方法，其特征在于该方法的具体步骤是：
步骤(1)：利用RGB-D相机获取同场景彩色图像和深度图像
使用RGB-D相机得到一张低分辨率深度图像Idepth其分辨率为M*N，和一张相同视角下的高分辨率彩色图像Icolor其分辨率为rM*rN，其中r为倍率，M和N分别为图像的高和宽；对低分辨率的深度图像Idepth进行双三次上采样操作放大至rM*rN，获得了初始的低质量高分辨率深度图像并把彩色图像Icolor转为YCbCr色彩空间，并取Y通道图像得到
步骤(2)：基于卷积神经网络的双支图像特征提取结构构建，在图像特征提取阶段两支结构相同，每一支在特征提取的阶段由七层卷积核大小为3*3的卷积层，双支之间设有五个双支通道感知模块和五个双支空间感知模块，这样得到深度图像特征与彩色图像特征交叉感知阶段部分；
(a)和首先各自通过各支的两层卷积核大小为3*3卷积层得到初始的特征图和
(b)双支感知结构构建，然后各自经过五层卷积核大小为3*3卷积层提取并精细化特征，这五层卷积层，每层后面都带有一个双支通道感知模块和一个双支空间感知模块，五层卷积层和五个双支通道感知模块和五个双支空间感知模块组成五级双支感知结构，假设输入深度特征图为Xd-1，彩色特征图为Xc-1，每级的双支感知结构的计算步骤如下：
①

首先将深度特征图为Xd-1∈RB×C×H×W，彩色特征图为Xc-1∈RB×C×H×W各自经过一层卷积核大小为3*3的卷积层之后通过激活层得到各种的特征图Rd∈RB×C×H×W和Rc∈RB×C×H×W；其中σ(·)代表RectifiedLinearUnit激活层，和为卷积核大小为3*3的卷积层权值，其上标表示该卷积层属于哪一支，d为深度图像一支，c为彩色图像一支，下标表示卷积核大小；
②
R′d＝MChannel*Rd(3)
R′c＝MChannel*Rc(4)
将特征图Rd和Rc拼接在一起，输入到双支通道感知模块中得到通道权重MChannel，并分别与特征图Rd和Rc做一次元素相乘得到双支通道感知后的特征图R′d∈RB×C×H×W和R′c∈RB×C×H×W；其中，双支通道感知模块权重MChannel的计算方式如下：

将特征图Rd和Rc拼接在一起，分别沿着空间维度进行max-pooled和averag...

【专利技术属性】
技术研发人员：曹旗，杨宇翔，高明煜，董哲康，何志伟，曾毓，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人