基于RGB‑D图像的室内场景布局估计及目标区域提取方法技术

技术编号：16606197 阅读：101 留言：0更新日期：2017-11-22 16:12

本发明专利技术公开一种基于RGB‑D图像的室内场景布局估计及目标区域提取方法，包括：场景布局估计；利用基于图的分割算法与约束参数最小割算法对预处理后的深度图与RGB图做过分割，得到不同大小的区域集合；过分割层次分组，利用四种不同的相似度衡量方式进行区域合并以完成区域层次分组，获取所有尺度大小的目标区域；以及目标边界框匹配。本发明专利技术实现了室内场景的高效、高召回率的目标区域提取。

The extraction method of indoor scene layout estimation and target area RGB based on D images

The invention discloses an extraction method, indoor scene layout estimation and target area RGB based on D image includes scene layout estimation; using segmentation algorithm and constraint parameter graph based on minimum cut algorithm on the preprocessed depth map and RGB map did get the regional segmentation, the small set of different levels of over segmentation; the packet, using four different similarity measure way to complete the regional level grouping region merging, obtain the target area of all sizes and bounding box matching. The invention realizes the extraction of the target area with high efficiency and high recall rate.

全部详细技术资料下载

【技术实现步骤摘要】
基于RGB-D图像的室内场景布局估计及目标区域提取方法
本专利技术属于人工智能计算
，特别是一种基于RGB-D图像的室内场景布局估计及目标区域提取方法，应用于室内服务机器人技术。
技术介绍
室内场景解析的研究是国内外学者的研究热点之一，对于室内机器人语义定位和地图生成有着重要的应用价值，同时对于解决一些高级计算机视觉问题也有着非常重要的意义。目标分割与提取算法目的在于得到高质量的目标定位与实例分割结果，是场景解析的关键步骤之一。目标提取结果通常为目标候选区域或目标边界框，经过多年的发展，目标提取算法目前可分为两类：第一类是基于滑动窗口检测思想的算法，第二类是基于分割的算法，包含图像过分割与分割拼合策略。第一类算法比较经典的是DPM(DeformablePartsModel)目标检测算法，采用改进HOG特征和SVM分类器，对目标的形变具有很强的鲁棒性，但是这类算法计算代价较大，并且不能使用比较复杂的特征表示。第二类算法中较为经典的是GBS(graphbasedsegmentation)基于图的图像分割算法，该算法实现简单，速度较快，能够找出视觉上一致的区域，但是容易导致过分割；还有约束参数最小割的目标分割算法，该算法分割效果良好，但只包含前景分割区域。近些年由于深度传感器的普及，出现了大量包含深度图像的RGB-D图像数据集，研究者开始利用RGB-D数据集通过增加几何特征或深度信息来提升效果，但这些算法通常都为有监督算法，需要训练预先得到的轮廓模型，计算复杂度较大，虽然部分提高了目标提取的准确度，但是目标类别较少且召回率较低，并且检测时容易忽视平面区域物...
<a href="http://www.xjishu.com/zhuanli/55/201710442910.html" title="基于RGB‑D图像的室内场景布局估计及目标区域提取方法原文来自X技术">基于RGB‑D图像的室内场景布局估计及目标区域提取方法</a>

【技术保护点】
基于RGB‑D图像的室内场景布局估计及目标区域提取方法，其特征在于：包括以下步骤，步骤1、场景布局估计：将深度图转化为密集3D点云，通过计算点云间的三维欧式距离进行平面分割划分平面区域与非平面区域，并将所得平面区域进行分类，分为边界平面与非边界平面；步骤2、图像过分割：利用基于图的分割算法与约束参数最小割算法对预处理后的深度图与RGB图做过分割，得到不同大小的区域集合；步骤3、过分割层次分组：利用颜色、纹理、尺寸、吻合四种不同的相似度衡量方式进行区域合并以完成区域层次分组，获取所有尺度大小的目标区域；步骤4、目标边界框匹配：对平面区域与非平面区域的目标，分为边界平面、非边界平面、平面区域中、非平面区域四种情况采取不同的策略匹配包含目标的最小矩形边界框，得到目标区域边界框。

【技术特征摘要】
1.基于RGB-D图像的室内场景布局估计及目标区域提取方法，其特征在于：包括以下步骤，步骤1、场景布局估计：将深度图转化为密集3D点云，通过计算点云间的三维欧式距离进行平面分割划分平面区域与非平面区域，并将所得平面区域进行分类，分为边界平面与非边界平面；步骤2、图像过分割：利用基于图的分割算法与约束参数最小割算法对预处理后的深度图与RGB图做过分割，得到不同大小的区域集合；步骤3、过分割层次分组：利用颜色、纹理、尺寸、吻合四种不同的相似度衡量方式进行区域合并以完成区域层次分组，获取所有尺度大小的目标区域；步骤4、目标边界框匹配：对平面区域与非平面区域的目标，分为边界平面、非边界平面、平面区域中、非平面区域四种情况采取不同的策略匹配包含目标的最小矩形边界框，得到目标区域边界框。2.根据权利要求1所述的基于RGB-D图像的室内场景布局估计及目标区域提取方法，其特征在于：步骤1具体过程为，步骤1.1、平面分割：在深度图上进行一致性采样得到三角点集，对于其中的每个三角点组采用RANSAC算法匹配一个候选平面；然后在3D点云空间搜寻平面内点，当一个点到该平面的三维欧氏距离小于内点距离公差Dtol时，定义该点为平面的内点，内点距离公差Dtol计算如式(1)；最后移除内点细小平面，并拼合空间上相近或者接近共面的平面；式中，f为焦距，b为传感器的基线长度，m为线性归一化参数，Z代表深度值；步骤1.2、平面分类：根据得到的主要平面区域，假设平面的法线向量面向观察者，计算在平面另一面的点云数与整个场景的点云总数量之比，将小于阈值的平面分类为边界平面，大于阈值的平面分类为非边界平面。3.根据权利要求1所述的基于RGB-D图像的室内场景布局估计及目标区域提取方法，其特征在于：步骤2具体过程为，步骤2.1、基于RGI颜色空间的分割：将RGB三通道图像转换为归一化RG通道加上亮度I通道，即RGI颜色空间，然后采用基于图的分割方法对RGI图像做过分割；步骤2.2、基于同态滤波后的灰度图的分割：对RGB图像加上同态滤波处理，对处理后输出的灰度图采用基于图的分割方法进行过分割；步骤2.3、基于空洞填补后的深度图的分...

【专利技术属性】
技术研发人员：吴晓秋，霍智勇，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人