深度图像中的高精度指尖定位方法及装置制造方法及图纸

技术编号：14517324 阅读：72 留言：0更新日期：2017-02-01 19:50

本发明专利技术公开一种深度图像中的高精度指尖定位方法及装置，能够提高定位精度。所述方法包括：S1、从深度图中提取出边缘梯度图；S2、将所述深度图及边缘梯度图分别利用卷积神经网络提取特征；S3、将两路特征利用卷积神经网络进行融合，并回归出指尖的三维位置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，具体涉及一种深度图像中的高精度指尖定位方法及装置。
技术介绍
基于深度图的手部关键点定位在人机交互中十分关键，在近年来一直是研究热点。在所有手部关键点中，指尖是最重要的部分，和诸如点击、滑动等手势都有密切的关系。同时由于手势的巨大变化、严重的自遮挡和各种深度成像中在指尖处的较大误差，导致指尖位置的估计十分困难，位置误差大于1厘米。现有的关键点检测算法主要分为两类：(1)生成式方法：基于模型的方法，主要有四个组成部分，即模型定义、模型与图像的相似性度量，初始模型参数及最优化模型参数使得相似性最大的算法。其中最优化方法常用的有基于关节的迭代最近点算法和粒子群优化算法。这类方法对于遮挡比较鲁棒，且不需要复杂的模型训练过程，在最优值附近优化时能准确找到解，但算法需要很强的先验和较为准确的初始化参数，对于局部最优比较敏感，而且速度通常较慢，不能满足实时性的要求，这严重制约了算法的适用范围。(2)判别式方法：通过图像特征直接预测关键点位置，即直接从特征训练一个机器学习的模型来对关键点参数进行预测。判别式方法一般采用回归的算法，回归的目标通常有两类，一类是位置偏移，即回归当前位置到目标关键点的位置偏移量，另一类是误差偏移，即回归当前预测的关键点位置和真实关键点位置的残差。常用的模型有随机森林和卷积神经网络。直接预测的方法计算速度比基于模型的方法要快，而且不需要初始化，预测值更为全局，但需要更多的训练，容易过拟合到训练集，在时间维度上会跳变，且对于遮挡更为敏感。目前这类方法大部分均基于手部的拓扑结构，从手掌逐步定位到指尖，这导致在指尖处的...

【技术保护点】
一种深度图像中的高精度指尖定位方法，其特征在于，包括：S1、从深度图中提取出边缘梯度图；S2、将所述深度图及边缘梯度图分别利用卷积神经网络提取特征；S3、将两路特征利用卷积神经网络进行融合，并回归出指尖的三维位置。

【技术特征摘要】
1.一种深度图像中的高精度指尖定位方法，其特征在于，包括：S1、从深度图中提取出边缘梯度图；S2、将所述深度图及边缘梯度图分别利用卷积神经网络提取特征；S3、将两路特征利用卷积神经网络进行融合，并回归出指尖的三维位置。2.根据权利要求1所述的方法，其特征在于，所述S1，包括：将所述深度图或从所述深度图中提取出来的特征输入到预设的机器学习模型，预测每个位置的边缘梯度信息，从而得到所述边缘梯度图。3.根据权利要求2所述的方法，其特征在于，所述机器学习模型包括随机森林、卷积神经网络。4.根据权利要求1所述的方法，其特征在于，所述S2，包括：将所述深度图和边缘梯度图进行像素值的归一化，使像素范围在-1到1之间；利用相同的两路卷积神经网络分别从归一化后的所述深度图和边缘梯度图提取出特征，其中，所述两路卷积神经网络的结构主要由交替的卷积层、降采样层和非线性层组成。5.根据权利要求1所述的方法，其特征在于，所述S3，包括：利用慢融合的技术，利用卷积神经网络将两路特征进行融合，并通过全连接层回归出指尖的三维空间坐标。6.一种深度图像中的高精度...

【专利技术属性】
技术研发人员：王贵锦，郭亨凯，陈醒濠，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人