【技术实现步骤摘要】
基于单张图像的多任务增强的深度估计系统
本专利技术涉及图像处理,深度学习,尤其涉及一种基于单张图像的多任务增强的深度估计系统。
技术介绍
随着计算机技术的显著发展,图像处理技术能够在越来越多的方面发挥作用。图片的深度信息估计是许多视觉任务的基础,例如三维重建,机器人感知领域,自动驾驶的距离等等方面。图像的深度信息估计的精度影响着视觉任务的精度。目前对深度信息的估计研究是从多个方入手的,有基于摄相头参数的图像深度估计,有基于深度摄像头的深度估计,有基于多目图像的深度估计,有基于连续图像序列的图像估计,更有基于单张的图像的深度估计。本文主要提出一种基于单张图片的深度估计。基于单张图像的深度估计有着其他方法不可忽视的优势。该方法需要的硬件设备简单,需要的图像少等优点。但是该方法目前相对其他方法存在以下问题,精度低,深度估计难度大,数据需求大,误估计严重等问题。针对这些问题,本文公开一种基于分割和深度估计双任务的深度学习模型,能够有效数据不足问题和误估计严重问题,并改善精度低问题。由于单张图像的深度估计问题和分割问题有着相似 ...
【技术保护点】
1.一种基于单张图像的多任务增强的深度估计系统,所述方法包括:/n(1)对带深度标签图片和带有分割标签的图片和带有深度标签和分割标签的图片,进行预处理,得到训练样本和验证样本;/n(2)构建双任务模型,利用(1)中得到的训练样本,间隔着用带有深度标签的图片和带有分割标签的图片对网络进行训练,得到训练好的模型;/n(3)利用带有深度标签和分割标签的数据对(2)训练得到的模型进行微调,得到最后的模型;/n(4)对带有深度标签的测试图片按照(1)中的预处理方法,得到处理后的测试图片;/n(5)利用(3)中训练好的网络,预测(4)中处理后的预测图片,得到预测结果。/n
【技术特征摘要】
1.一种基于单张图像的多任务增强的深度估计系统,所述方法包括:
(1)对带深度标签图片和带有分割标签的图片和带有深度标签和分割标签的图片,进行预处理,得到训练样本和验证样本;
(2)构建双任务模型,利用(1)中得到的训练样本,间隔着用带有深度标签的图片和带有分割标签的图片对网络进行训练,得到训练好的模型;
(3)利用带有深度标签和分割标签的数据对(2)训练得到的模型进行微调,得到最后的模型;
(4)对带有深度标签的测试图片按照(1)中的预处理方法,得到处理后的测试图片;
(5)利用(3)中训练好的网络,预测(4)中处理后的预测图片,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中具体包括:
(11)对样本库中带有分割标签的图片,进行左右翻转,一定比例的拉伸的数据增强,对所有图片都进行改变对比度,饱和度,光照的数据增强,和随机裁剪,得到数据增强后图片,将其按照一定比例分成训练样本和验证样本,样本大小是224×224;
(12)对带分割标签的图片的分割标签进行如(11)中的左右翻转和一定比例的拉伸,保持与图片的形变的一致,对所有被裁剪的图片的标签进行与图片一致的裁剪;
(13)用(12)中的数据增强后的带分割标签的图片和带深度信息的图片分别进行归一化,得到可训练样本和验证样本。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中具体包括:
(21)首先构建一个如图(1)的网络,其中网络使用四倍下采样残差网络模块提取特征(ResidualBlock),之后特征依次通过卷积模块(convolutionblock),池化层(poolingblock),直到特征图大小是原图的八分之一,再经过一个多尺度的模块(multiscaleblock)融合特征,之后和之前的卷积模块输出特征连接,进入二插值上采样模块(interpolation)和反卷积模块(deconvolutionblock),最后是一个卷积和二插值联合模块输出图像的分割预测和深度估计;
网络中的卷积模块和反卷积模块如图(2)是由许多不同尺寸的卷积模块堆叠而成,卷积模块和反卷积模块不同之处在于卷积层分别是卷积层和反卷积层,模块是先由一个3×3的卷积核,再分别将特征输出到带1×1卷积核的卷积层的通道,带3×3卷积核的卷积层和pool层的通道,带5×1卷积核的卷积层核带1×5的卷积核的卷积层的通道,带3×1卷积核的卷积层核带1×3的卷积核的卷积层的通道,最后由一个带3×3的卷积核卷积层融合特征,之后重复刚刚的多通道卷积,构建如图(2)的卷积模块,该模块中的卷积层都是卷积层加上批次标准化层(batchnormlization)和指数线性单元层(...
【专利技术属性】
技术研发人员:漆进,胡顺达,秦金泽,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。