一种多视角深度获取方法技术

技术编号:32016329 阅读:21 留言:0更新日期:2022-01-22 18:34
一种多视角深度获取方法,涉及计算机视觉领域和深度学习技术领域,使用机器学习的方式求深度图,对宽基线等拍摄角度问题及粗糙区域,弱纹理区域,遮挡等复杂的纹理和光影问题有更好的鲁棒性。在特征提取模块引入了CBAM注意力机制,从通道维度和空间维度两个方向整理每次卷积得到的特征。使用特征提取Unet结构中的跳层连接保证了高层信息不被覆盖,同时兼顾获取低层信息。特征提取Unet配合CBAM注意力机制充分考虑不同视角几何映射的关系,提高了特征提取模块对不同视角特征的识别能力。在代价正则化部分使用3D卷积和双向长短期记忆LSTM组合的方式,从深度维度和通道维度两个方面正则化三维方差特征,从而提高网络的处理,生成速度快。速度快。速度快。

【技术实现步骤摘要】
一种多视角深度获取方法


[0001]本专利技术涉及计算机视觉领域和深度学习
,具体涉及一种多视角深度获取方法。

技术介绍

[0002]三维重建是指使用现实世界中三维物体的图像建立由计算机存储的三维模型,它是使用计算机存储客观世界三维几何结构的关键技术。三维重建应用于3D建模和绘图、机器人、医学成像、监视、跟踪和导航。同时深度获取在逆向工程、游戏和娱乐业等各行各业都有着广阔的应用前景。
[0003]使用计算机视觉实现三维重建是一个完整过程,包括相机标定、特征匹配和重建。三维重建目的是恢复物体完整的结构信息,因此需要获取物体的位置信息,通常包括法向量、深度等信息,其中深度是三维重建需要的重要信息,直接影响到重建的精确度和完整度。深度是指物点到相机的向量在相机的光轴上距离。深度获取容易受到干扰,场景中的光照和噪声等干扰都会影响到深度获取,因此深度获取是三维重建的关键技术。
[0004]多视角的深度获取,是指获取物体的一组图像序列或一段视频作为输入,并对输入进行处理,最终得到相机和每一个特征点的位置关系。多视角获取深度计算量巨本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多视角深度获取方法,其特征在于:该方法包括:图像输入:同一相机在多个位置获取多幅输入图像组成的图像序列,图像序列中图像分为一幅参考图像和多幅目标图像;图像序列通过下采样的方法得到n组不同尺度的图像序列;获取的原始图像组成的图像序列定义组数L=0,而下采样得到的n组图像序列按照下采样的次数定义组数L分别为1,2,

,n,两者总共n+1组图像序列;将这n+1组图像序列按照尺度由小到大的顺序送入特征提取部分;特征提取:将图像输入部分获得的n+1组多尺度图像序列送入特征提取Unet提取特征;使用特征提取Unet对每一组图像序列提取特征,得到由图像序列中的多张图像获取的特征组成的二维特征序列,并且这n+1组二维特征序列和其对应的图像序列相比通道数增加,长和宽不变;然后按照L=n,n

1,

,0,的顺序将这n+1组二维特征序列送入深度求精;深度求精:在获得特征提取部分提取的n+1组二维特征序列以后,按照L=n,n

1,

,0,的顺序分别对这n+1组二维特征序列使用深度求精的方法求估计深度图,整个过程需要重复n+1次;深度求精包括三个部分:单应性变换、代价正则化、深度获取;每次深度求精输出的估计深度图使用上采样后作为下次深度求精的输入,如此循环进行深度求精的三个部分得到与原始图像尺度一致的估计深度图;深度求精的三个部分如下:一、单应性变换:对特征提取获取的每一组二维特征序列中的多个目标图像的特征通过空间变换投射到参考图像所在的坐标系中获得反转的特征;然后使用目标图像的反转特征序列和参考图像的特征求方差,得到三维方差特征输出;单应性变换主要为以下两个部分:获取深度数据、可微性单应;(1)获取深度数据:空间变换投射时需要深度数据;对于第n组二维特征序列,在深度范围内按照48等分进行深度值的离散化得到初始深度数据;而对于其余的二维特征序列,获取上一组的估计深度图后,使用上采样后再复制多组的策略构造深度数据;(2)可微性单应:同一二维特征序列中,首先将多个目标图像的二维特征映射到参考图像所在的坐标系下;由于遍历获取的深度数据,映射后的目标图像的特征序列为三维特征序列;此三维特征序列和由参考图像的二维特征复制形成的三维特征计算方差,作为此图像序列对应的三维方差特征;二、代价正则化:将单应性变换获得的L=n,

【专利技术属性】
技术研发人员:魏东于璟玮何雪刘涵
申请(专利权)人:沈阳工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1