手势骨架构建方法、装置、设备及存储介质制造方法及图纸

技术编号：19055814 阅读：20 留言：0更新日期：2018-09-29 11:59

本申请公开了一种手势骨架构建方法、装置、设备及存储介质，属于手势识别领域。该方法包括：将深度图片输入手势分割神经网络，输出手部置信区域，深度图片中包含各个像素点的深度值，深度值用于表征像素点对应物体与深度摄像头之间的距离；根据手部置信区域中各个像素点的深度值，从深度图片中提取出手部图像；将手部图像输入手势识别神经网络，得到手部各个关节的三维坐标；根据所述三维坐标在三维空间中构建手势骨架。相较于在指定区域进行手势交互，本申请实施例中，借助手势分割神经网络输出的手部置信区域进行手部图像提取，用户可以在深度摄像头前任意区域进行手势交互，有助于提高识别手势图像以及构建手势骨架的准确率，以及后续手势交互的交互效果。

全部详细技术资料下载

【技术实现步骤摘要】
手势骨架构建方法、装置、设备及存储介质
本申请实施例涉及手势识别
，特别涉及一种手势骨架构建方法、装置、设备及存储介质。
技术介绍
随着人工智能技术的不断成熟，越来越多的应用场景开始支持人机交互，而手势交互则是一种常见的人机交互方式。手势交互的关键在于三维手势骨架构建。在一种手势构建方式中，终端通过深度摄像头进行图像采集，并标记出深度图片中手指关节的三维坐标，从而绘制出手势对应的三维手势骨架。为了提高深度图片中手势图像的识别准确性，用户需要在距离深度摄像头预定距离的区域进行手势交互，比如，在距离摄像头1至1.5米处进行手势交互。后续终端即根据深度图片中各个像素点的深度值去除深度图片中的干扰因素，进而提取出深度图片中的手势图像。然而，采用上述方法进行手势交互时，若用户未在预定距离处进行手势交互，终端识别手势图像的准确率降低，导致三维手势骨架构建的准确率较低，甚至无法构建，影响手势交互的交互效果。
技术实现思路
本申请实施例提供了一种手势骨架构建方法、装置、设备及存储介质，可以解决相关技术中，用户未在预定距离处进行手势交互时，终端识别手势图像的准确率降低，导致三维手势骨架构建的准确率较低，甚至无法构建，影响手势交互效果的问题。所述技术方案如下：第一方面，提供了一种手势骨架构建方法，所述方法包括：将深度图片输入手势分割神经网络，输出手部置信区域，所述深度图片中包含各个像素点的深度值，所述深度值用于表征像素点对应物体与深度摄像头之间的距离；根据所述手部置信区域中各个像素点的所述深度值，从所述深度图片中提取出手部图像；将所述手部图像输入手势识别神经网络，得到手部各...

【技术保护点】
1.一种手势骨架构建方法，其特征在于，所述方法包括：将深度图片输入手势分割神经网络，输出手部置信区域，所述深度图片中包含各个像素点的深度值，所述深度值用于表征像素点对应物体与深度摄像头之间的距离；根据所述手部置信区域中各个像素点的所述深度值，从所述深度图片中提取出手部图像；将所述手部图像输入手势识别神经网络，得到手部各个关节的三维坐标；根据所述三维坐标在三维空间中构建手势骨架。

【技术特征摘要】
1.一种手势骨架构建方法，其特征在于，所述方法包括：将深度图片输入手势分割神经网络，输出手部置信区域，所述深度图片中包含各个像素点的深度值，所述深度值用于表征像素点对应物体与深度摄像头之间的距离；根据所述手部置信区域中各个像素点的所述深度值，从所述深度图片中提取出手部图像；将所述手部图像输入手势识别神经网络，得到手部各个关节的三维坐标；根据所述三维坐标在三维空间中构建手势骨架。2.根据权利要求1所述的方法，其特征在于，所述手势分割神经网络包括2n+1级卷积激活层、n级池化层和n级反卷积层，n≥2，n为整数；所述将深度图片输入手势分割神经网络，输出手部置信区域，包括：通过2n+1级所述卷积激活层、n级所述池化层和n级所述反卷积层，对所述深度图片进行处理，得到所述深度图片对应的目标特征图；根据所述目标特征图输出所述手部置信区域；其中，所述卷积激活层用于提取特征，所述池化层用于缩小特征图的尺寸，所述反卷积层用于放大特征图的尺寸。3.根据要求2所述的方法，其特征在于，所述通过2n+1级所述卷积激活层、n级所述池化层和n级所述反卷积层，对所述深度图片进行处理，得到所述深度图片对应的目标特征图，包括：通过第1至第n级卷积激活层和所述n级池化层，对所述深度图片进行卷积激活以及池化处理，得到中间特征图，所述中间特征图的通道数大于所述深度图片的通道数，且所述中间特征图的尺寸小于所述深度图片的尺寸；通过第n+1至第2n+1级卷积激活层和所述n级反卷积层，对所述中间特征图进行卷积激活以及反卷积处理，得到所述目标特征图，所述中间特征图的通道数等于所述深度图片的通道数，且所述目标特征图的尺寸等于所述深度图片的尺寸。4.根据权利要求23所述的方法，其特征在于，所述通过第1至第n级卷积激活层和所述n级池化层，对所述深度图片进行卷积激活以及池化处理，得到中间特征图，包括：通过第i级卷积激活层对第i-1特征图进行卷积激活处理，并将处理后的所述第i-1特征图输入第i级池化层，2≤i≤n；通过所述第i级池化层对处理后的所述第i-1特征图进行池化处理，得到第i特征图；将所述第i特征图输入第i+1级卷积激活层。5.根据权利要求3所述的方法，其特征在于，所述通过第n+1至第2n+1级卷积激活层和所述n级反卷积层，对所述中间特征图进行卷积激活以及反卷积处理，得到所述目标特征图，包括：通过第j级反卷积层对第j+n级卷积激活层输出的特征图进行反卷积处理，1≤j≤n；对反卷积处理后的特征图与第n-j+1级卷积激活层输出的特征图进行拼接，并将拼接后的特征图输入第j+n+1级卷积激活层，所述反卷积处理后的特征图与所述第n-j+1级卷积激活层输出的特征图的尺寸相同；通过第j+n+1级卷积激活层对所述拼接后的特征图进行卷积激活处理。6.根据权利要求2所述的方法，其特征在于，所述根据所述目标特征图输出所述手部置信区域，包括：根据所述目标特征图对所述深度图片中的各个像素点进行识别分类，生成概率矩阵，所述概率矩阵用于表征所述深度图片中各个像素点是手部的概率，所述概率矩阵与所述深度图片的尺寸相同；对所述概率矩阵进行二值化处理，输出所述手部区域对应的评分图，所述评分图用于指示所述深度图片中的所述手部置信区域。7.根据权利要求1至6任一所述的方法，其特征在于，所述根据所述手部置信区域的深度值，从所述深度图片中提取出手部图像，包括：根据所述手部置信区域从所述深度图片中提取出候选图像，所述候选图像中包含所述...

【专利技术属性】
技术研发人员：赵世杰，左小祥，李峰，程君，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人