The present invention provides a method for visual identification and localization of RGB based on D camera, which comprises the following steps: 1), through the depth image and color image using the Microsoft Kinect camera sensor and converted into 3D point cloud, and on the plane in the scene is extracted; 2), step 1) extract in the plane, extraction and segmentation of objects for the rest of the point cloud; 3), step 2) obtained object point cloud collection were identified and matched; 4), step 2) to obtain the object point cloud through calculation, achieve the object location. The method of identification and localization of 3D RGB D sensor Kinect II acquisition of Microsoft's cloud based image, not related to the object location among multi images, complex operation, greatly improves the computational efficiency, but also has the advantages of real-time, suitable for daily life in complex environment.
【技术实现步骤摘要】
本专利技术涉及机器视觉的识别与定位领域,尤其是一种基于RGB-D摄像头的视觉识别与定位方法。
技术介绍
目前,现有的基于多目彩色图像相机的物体识别与定位系统,大多是通过立体匹配不同传感器采集的图像,获取每一个像素点在空间中的位置,存着在成本较大、运行速度缓慢、系统复杂等问题。物体边缘分割大多是基于彩色摄像机的图像进行凸包提取的方法实现,该处理方法需要考虑物体外表色彩,在碰到背景颜色与物体相似的情况时容易产生误判,而凸包提取的方法也存在物体凸包轮廓错误及包含背景部分的问题。相对于现有的基于多目彩色图像相机进行物体识别与定位的方法,使用RGB-D传感器进行物体识别和定位的方法具有很多优势:首先,计算量小、运算速度快、实时性强、物体定位成本低,微软公司推出的RGB-D传感器KinectII降低了三维扫描的成本,直接向用户提供分辨率较高的彩色图像、深度图像及点云图像,仅通过一个RGB-D传感器,便可以直接获得每一个像素点在相机坐标系中的位置,无须通过立体匹配多目系统中不同传感器采集的图像来获取每一个像素点在空间中的位置;其次,精确度与鲁棒性有所提高,基于RGB-D摄像头提供的深度图像及点云图像,可直接进行平面提取和物体的分割及定位,有效避免了物体本身外表和背景颜色的影响,可以减少误判情况的发生,提高系统的准确性和稳定性。
技术实现思路
本专利技术的目的是针对上述现有技术的不足,提供了一种基于RGB-D摄像头的视觉识别与定位方法,该方法计算量小、实时性强,并且能够适应日常生活场景。本专利技术的目的可以通过如下技术方案实现:一种基于RGB-D摄像头的视觉识别与定位方法, ...
【技术保护点】
一种基于RGB‑D摄像头的视觉识别与定位方法,其特征在于:所述方法包括以下步骤:1)通过微软Kinect摄像头传感器对物体进行彩色图像和深度图像的采集后转化为三维点云图像;2)对步骤1)获得的三维点云图像的每一个点进行相应的法向量计算;3)对步骤2)获得的法向量集合,运用区域生长算法对物体所放置的背景平面进行提取;4)将步骤3)中提取出的背景平面的点去除,并对剩下的点云进行物体点云集合提取和凸包提取处理;5)将步骤4)中提取的各物体点云集合与对应的凸包相结合,进行二次区域生长,实现各物体完整轮廓的分割及完整点集的提取;6)根据步骤5)中获得的各物体的完整轮廓,提取相应的彩色图像并分别进行特征提取和匹配识别;7)将步骤5)获得的各物体的完整轮廓内的点云集合进行求均值运算,获得各物体在相机坐标系中的位置信息;8)将步骤7)得到的各物体在相机坐标系中的位置信息,进行坐标系变换,转换到世界坐标系当中,实现各物体的定位。
【技术特征摘要】
1.一种基于RGB-D摄像头的视觉识别与定位方法,其特征在于:所述方法包括以下步骤:1)通过微软Kinect摄像头传感器对物体进行彩色图像和深度图像的采集后转化为三维点云图像;2)对步骤1)获得的三维点云图像的每一个点进行相应的法向量计算;3)对步骤2)获得的法向量集合,运用区域生长算法对物体所放置的背景平面进行提取;4)将步骤3)中提取出的背景平面的点去除,并对剩下的点云进行物体点云集合提取和凸包提取处理;5)将步骤4)中提取的各物体点云集合与对应的凸包相结合,进行二次区域生长,实现各物体完整轮廓的分割及完整点集的提取;6)根据步骤5)中获得的各物体的完整轮廓,提取相应的彩色图像并分别进行特征提取和匹配识别;7)将步骤5)获得的各物体的完整轮廓内的点云集合进行求均值运算,获得各物体在相机坐标系中的位置信息;8)将步骤7)得到的各物体在相机坐标系中的位置信息,进行坐标系变换,转换到世界坐标系当中,实现各物体的定位。2.根据权利要求1所述的一种基于RGB-D摄像头的视觉识别与定位方法,其特征在于:步骤2)中,计算法向量的方法为:设Pk为想要求得表面法向量的点,首先找到点Pk在图像中上下左右附近四个点P1、P2、P3和P4,P1和P3组成向量P2和P4组成向量则点Pk的表面法向量可以通过叉乘得到,具体如下:νp→=ν2→×ν1→]]>三维点云图像的每一个点的法向量均通过如上公式计算得到。3.根据权利要求1所述的一种基于RGB-D摄像头的视觉识别与定位方法,其特征在于:步骤3)中,先顺序扫描三维点云图像的每一个点的法向量,遇到近似竖直的法向量则继续寻找该点附近且法向量为近似竖直的点,加入到潜在平面点集中,若潜在平面点集中点的数目大于设定的阈值,则认为该潜在平面点集为一个平面点集合并且把潜在平面点集加入到平面集合中,否则继续扫描剩下的法向量...
【专利技术属性】
技术研发人员:张智军,张文康,黄永前,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。