The embodiment of the invention discloses a three-dimensional reconstruction method, device, device and storage medium based on a depth camera, wherein the method comprises: acquiring at least two frames of images captured by a depth camera for a target scene; determining the relative camera position and pose at the time of acquisition according to the at least two frames of images; and targeting each frame of images. At least one feature voxel is determined from the image by a nested filtering method of at least two stages, in which each stage adopts the corresponding voxel blocking rule, and the raster voxel model of the target scene is generated by fusing at least one feature voxel of each frame image according to the relative camera position and attitude of each frame. The isosurface of the raster voxel model is used to get the 3D reconstruction model of the target scene. The embodiment of the invention solves the problem of large amount of computation in 3D reconstruction of the target scene, realizes the application of 3D reconstruction in portable equipment, and makes the application of 3D reconstruction more extensive.
【技术实现步骤摘要】
基于深度相机的三维重建方法、装置、设备及存储介质
本专利技术实施例涉及图像处理
,尤其涉及一种基于深度相机的三维重建方法、装置、设备及存储介质。
技术介绍
三维重建是通过特定的装置及算法对现实世界中的三维物体的数学模型进行重新构建,对于虚拟现实、增强现实、机器人感知、人机交互及机器人路径规划等具有极其重要的意义。目前的三维重建方法中,为保证重建结果的质量、一致性及实时性,通常需要由高性能的图形处理器(GraphicsProcessingUnit,GPU)和深度相机(RGB-D相机)来完成。首先利用深度相机对目标场景进行拍摄,获得至少两帧图像;利用GPU对每帧图像进行求解,以获取拍摄各帧图像时深度相机的相对相机位姿;依据每帧图像对应的相对相机位姿,遍历该帧图像中的所有体素,以确定满足一定条件的体素作为候选体素;进而依据每帧图像中的候选体素来构建该帧图像的截断符号距离函数(TruncatedSignedDistanceFunction,TSDF)模型;最后在TSDF模型的基础上,对每帧图像生成等值面,从而能完成对目标场景的实时重建。但是现有的三维重建方法运算量较大,对专用于图像处理的GPU依赖性很强。而GPU无法便携化,难以应用于移动机器人、便携化设备及可穿戴设备(如增强现实头显设备MicrosoftHoloLens)等。
技术实现思路
本专利技术实施例提供一种基于深度相机的三维重建方法、装置、设备及存储介质,解决了对目标场景进行三维重建时运算量大的问题,实现了将三维重建应用于便携化的设备中,使得三维重建的应用更加广泛。第一方面,本专利技术实施例提供了一种基 ...
【技术保护点】
1.一种基于深度相机的三维重建方法,其特征在于,包括:获取深度相机对目标场景进行采集得到的至少两帧图像;根据所述至少两帧图像确定采集时的相对相机位姿;针对每帧图像,采用至少两级嵌套筛选方式从图像中确定至少一个特征体素,其中,每级筛选采用对应的体素分块规则;依据各帧图像的相对相机位姿对各帧图像的至少一个特征体素进行融合计算,得到目标场景的栅格体素模型;生成所述栅格体素模型的等值面,得到所述目标场景的三维重建模型。
【技术特征摘要】
1.一种基于深度相机的三维重建方法,其特征在于,包括:获取深度相机对目标场景进行采集得到的至少两帧图像;根据所述至少两帧图像确定采集时的相对相机位姿;针对每帧图像,采用至少两级嵌套筛选方式从图像中确定至少一个特征体素,其中,每级筛选采用对应的体素分块规则;依据各帧图像的相对相机位姿对各帧图像的至少一个特征体素进行融合计算,得到目标场景的栅格体素模型;生成所述栅格体素模型的等值面,得到所述目标场景的三维重建模型。2.根据权利要求1所述的方法,其特征在于,根据所述至少两帧图像确定采集时的相对相机位姿,包括:对每帧图像进行特征提取,得到每帧图像的至少一个特征点;将相邻两帧图像间的各特征点进行匹配运算,得到所述相邻两帧图像间的特征点对应关系;移除所述特征点对应关系中的异常对应关系,通过包含剩余特征点二阶统计量的线性成分以及包含相对相机位姿的非线性成分计算J(ξ)TJ(ξ)中的非线性项对δ=-(J(ξ)TJ(ξ))-1J(ξ)Tr(ξ)进行多次迭代计算,求解重投影误差小于预设误差阈值时的相对相机位姿;其中,r(ξ)表示包含所有重投影误差的向量,J(ξ)为r(ξ)的雅克比矩阵,ξ表示相对相机位姿的李代数,δ表示每次迭代时r(ξ)的增量值;Ri表示采集第i帧图像时相机的旋转矩阵;Rj表示采集第j帧图像时相机的旋转矩阵;表示第i帧图像上的第k个特征点;表示第j帧图像上的第k个特征点;Ci,j表示第i帧图像与第j帧图像的特征点对应关系的集合;||Ci,j||-1表示第i帧图像与第j帧图像的特征点对应关系的数量;[]×表示向量积;||Ci,j||表示取Ci,j的范数。3.根据权利要求2所述的方法,其特征在于,所述非线性项的表达式为:其中,表示线性成分;rilT和rjl表示非线性成分,rilT是旋转矩阵Ri中的第l行,rjl是旋转矩阵Rj中的第l行的转置,l=0,1,2。4.根据权利要求1或2所述的方法,其特征在于,根据所述至少两帧图像确定采集时的相对相机位姿之后,还包括:若采集所述目标场景得到的当前帧图像为关键帧,则根据当前关键帧和历史关键帧进行回环检测;若回环成功,根据所述当前关键帧对已确定的相对相机位姿进行全局一致的优化更新。5.根据权利要求4所述的方法,其特征在于,在根据当前关键帧和历史关键帧进行回环检测之前,还包括:将采集所述目标场景得到的当前帧图像与上一关键帧图像进行匹配运算,得到两帧图像之间的转换关系矩阵;若所述转换关系矩阵大于或等于预设转换阈值,则确定所述当前帧图像为所述当前关键帧。6.根据权利要求1所述的方法,其特征在于,针对每帧图像,采用至少两级嵌套筛选方式从图像中确定至少一个特征体素,包括:针对每帧图像,将图像作为当前级筛选对象,并确定当前级体素单位;将所述当前级筛选对象按照当前级体素单位划分为体素块,根据体素块确定至少一个当前索引块;其中,所述当前索引块包含预设个数的体素块;在所有当前索引块中选取到目标场景表面的距离小于所述当前级体素单位对应距离阈值的至少一个特征块;如果所述特征块满足最小级体素单位的划分条件,则将所述特征块作为特征体素;如果所述特征块不满足最小级体素单位的划分条件,则将当前级筛选对象确定的所有特征块替换为新的当前级筛选对象,并选择下一级体素单位替换为新的当前级体素单位,返回执行针对当前级筛选对...
【专利技术属性】
技术研发人员:方璐,韩磊,苏卓,戴琼海,
申请(专利权)人:清华伯克利深圳学院筹备办公室,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。