基于相机运动和图像明暗的Kinect深度重建算法制造技术

技术编号：15504926 阅读：119 留言：0更新日期：2017-06-04 00:42

本发明专利技术公开了一种基于相机运动和图像明暗的Kinect深度重建算法，包括步骤：1)在Kinect深度摄像头和RGB摄像头标定对齐的情况下，通过第三方接口将Kinect采集的数据上传到电脑；2)从RGB视频序列中恢复三维场景结构和kinect RGB相机的运动轨迹，得到点云和相机运动关系；3)结合步骤2)中获得的点云和相机运动关系，利用图像的明暗情况信息对图像深度进行重建。本算法不需要对深度摄像头进行物理上的改进，也不需要设计复杂的装置组合，以及不需要传统深度重建方法中经常使用的一般只能局限在实验室条件下而不具备现实应用价值的复杂而条件苛刻的光照标定步骤，相比传统的方法而言，具有更大的现实应用价值和意义。

Kinect depth reconstruction algorithm based on camera motion and image brightness

The invention discloses a method comprises the steps of Kinect depth reconstruction algorithm, camera motion and image brightness based on: 1) in the depth of Kinect camera and RGB camera calibration alignment case, Kinect collected data uploaded to the computer through the third party interface; 2) trajectory recovery of 3D scene structure and camera from RGB RGB Kinect the video sequence in the relationship between the point cloud and camera motion; 3) with step 2) point cloud and camera motion relations obtained, using image shading information for image depth reconstruction. This algorithm does not need to be improved physically on the depth camera, also do not need to design complex assembly, and need not generally only often use traditional depth reconstruction methods limitations under laboratory conditions and do not have complex and demanding light calibration steps practical application value, compared with the traditional method, practical application value and greater significance.

全部详细技术资料下载

【技术实现步骤摘要】
基于相机运动和图像明暗的Kinect深度重建算法
本专利技术涉及计算机图像处理中的深度重建领域，尤其是指一种基于相机运动和图像明暗的Kinect深度重建算法。
技术介绍
随着近些年一些价格相对低廉的民用深度摄像头，例如MicrosoftKinect和AsusXtionPro等的面世和推广，深度信息被广泛用于体感游戏、实时三维重建、增强现实、虚拟现实等各个领域，对深度信息的应用已经成为了新型人机交互方式的发展的重要依托。然而，目前市面上较为流行的民用深度摄像头大多存在深度探测精度不够以及干扰噪声太大的问题，严重地影响了基于深度信息的应用产品的质量。因此，如何获取更为精确的深度信息，对于基于深度信息开发的应用而言具有非常重要的意义。正因为上述的需求，深度重建算法越来越受到学术界和产业界的关注。目前有一种新颖的办法是结合计算机图形学中三维重建方面的思路辅助深度图进行重建，而本专利也是沿用了这个思路。而目前三维重建方面主要方法有从运动信息中恢复三维场景结构、从图像的明暗情况重构物体形状、光度立体法等。而本专利主要是利用从运动信息中恢复三维场景结构以及从图像的明暗情况重构物体形状两种方法。从运动信息中恢复三维场景结构的方法主要利用摄像机的运动过程而动态生成和修正三维点云，它的典型代表是基于单目摄像头的SLAM系统。而从图像的明暗情况重构物体形状的方法则是利用图像的明暗情况，建立有效的光照模型并使用优化的方法对其进行求解，进而可以获取目标的表面形状信息。对上述两种方法的思想加以利用和改进，以及利用深度图与点云二者之间紧密的关系，就可以有效的对深度图进行优化和重建，得到...

【技术保护点】
基于相机运动和图像明暗的Kinect深度重建算法，其特征在于，包括以下步骤：1)在Kinect深度摄像头和RGB摄像头标定对齐的情况下，通过第三方接口将Kinect采集的数据上传到电脑；2)从RGB视频序列中恢复三维场景结构和kinect RGB相机的运动轨迹，得到点云和相机运动关系；3)结合步骤2)中获得的点云和相机运动关系，利用图像的明暗情况信息对图像深度进行重建。

【技术特征摘要】
2016.06.30 CN 20161051154391.基于相机运动和图像明暗的Kinect深度重建算法，其特征在于，包括以下步骤：1)在Kinect深度摄像头和RGB摄像头标定对齐的情况下，通过第三方接口将Kinect采集的数据上传到电脑；2)从RGB视频序列中恢复三维场景结构和kinectRGB相机的运动轨迹，得到点云和相机运动关系；3)结合步骤2)中获得的点云和相机运动关系，利用图像的明暗情况信息对图像深度进行重建。2.根据权利要求1所述的基于彩色摄像头与深度摄像头融合的深度重建算法，其特征在于，所述步骤2)包括以下步骤：2.1)在系统初始化的时候读入一张RGB图片并作为关键帧，给关键帧绑定一个深度图，深度图和灰度图有相同的维度，遍历深度图，给每个像素位置赋一个随机值；2.2)每读取一张RGB图片，都构造如下的代价函数：其中||·||δ是哈勃算子，rp代表误差，代表误差的方差；哈勃算子的定义如下：δ是哈勃算子的参数；误差函数的定义rp如下：rp(p,ζji)＝Ii(p)-Ij(w(p,Di(p),ζji))Ii(p)表示当前帧中像素p的位置的灰度值，ζji表示将i坐标下的三维点旋转平移到j坐标下的刚体变换的李代数，Di(p)表示参考帧的深度图中像素p对应的位置的深度值，w(p,Di(p),ζji)表示参考帧i中像素p位置对应的三维点经过旋转平移刚体变换到当前帧中j位置，变换公式如下：其中X,Y,Z分别表示相机坐标系下的三维点在XYZ三个方向上的坐标；u，v表示像素坐标；fx，fy分别表示X，Y方向上焦距；方差的定义如下：其中表示图片灰度的方差，Vi(p)表示参考帧深度图像素点p的方差；2.3)用高斯牛顿迭代法求解步骤2.2)中代价函数最小时的ζ，得到参考帧和当前帧之间的旋转平移关系；2.4)对参考帧灰度图上所有点求梯度，选取其中梯度大于门限的点；接着对这些点进行筛选；遍历所有符合要求的点，根据极线集合搜索这些点在当前帧极线上的对应点；并根据单目视觉三维重建几何知识计算点的空间坐标；2.5)用卡曼滤波器对新得到的深度值与参考帧深度图中的深度值融合。3.根据权利要求1所述的基于彩色摄像头与深度摄像头融合的深度重建算法，其特征在于，所述步骤3)包括以下步骤：3.1)进行当前帧下的深度摄像头采集到的深度图像与单目彩色摄像头采集到的彩色图像的对齐；由于彩色摄像头与深度摄像头之间存在视场范围的差异，所以只有二者视场重叠部分才具有有效的深度值，因此对齐后得到的是不完整的深度图；3.2)按照深度摄像头中针孔相机的模型，将该不完整的深度图进行三维点云的生成；针孔相机模型简述为：一个空间点的空间坐标[x,y,z]与它在图像中的像素坐标[u,v,d]之间的关系表述为：z＝d/sx＝(u-cx)·z/fxy＝(v-cy)·z/fy其中，d是深度图中每个像素的深度值，s是深度图的缩放因子，cx与cy是主点的横纵坐标，fx与fy是横坐标方向和纵坐标方向的焦距分量；利用上述公式对每个像素的像素坐标转换成对应的空间坐标，即可完成深度图到三维点云的转换；3.3)将单目算法中生成的点云与上述不完整的深度图生成的点云二者使用点对点的迭代最近邻点ICP算法进行配准得到二者之间的旋转矩阵R和平移矩阵T；3.4)根据上述得到的旋转矩阵和平移矩阵，将单目算法获得的点云转换到不完整的深度图生成的点云的坐标体系下，并将二者拼接成一个大的点云；3.5)对于深度图中由于视场范围不重叠而形成的深度值无效区域，对每个处于无效区域中的像素，计算其空间位...

【专利技术属性】
技术研发人员：青春美，黄韬，袁书聪，徐向民，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人