姿态识别方法、装置、介质和计算设备制造方法及图纸

技术编号：21433215 阅读：18 留言：0更新日期：2019-06-22 12:13

本发明专利技术的实施方式提供了一种姿态识别方法。该方法包括获取待识别图像，该待识别图像中包括目标对象；根据待识别图像确定第一向量，该第一向量表征目标对象的姿态；以第一向量作为深度神经网络模型的输入，输出第二向量，该第二向量包括表征目标对象关于多个预定姿态中每一个的置信度；以及根据第二向量，确定目标对象的姿态。本发明专利技术的方法通过确定表征目标对象姿态的第一向量来确定目标对象关于预定姿态的置信度，可以提高目标对象姿态识别的准确性。此外，本发明专利技术的实施方式提供了一种姿态识别装置、介质和计算设备。

全部详细技术资料下载

【技术实现步骤摘要】
姿态识别方法、装置、介质和计算设备
本专利技术的实施方式涉及信息处理领域，更具体地，本专利技术的实施方式涉及一种姿态识别方法、装置、介质和计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着电子技术的发展，为了提高交互体验，各种人机交互方式应运而生。人机交互模式随着使用人群的扩大，不断向非专业人群渗透，因此，越来越回归至一种“自然”的方式。其中，姿态(具体例如可以是手势)识别技术即为“自然”方式的一种。姿态识别技术中，静态姿态识别的准确性是进行人机交互的关键。不准确的静态姿态识别会造成交互误触发，延迟触发等严重影响用户体验的情况。目前主流的姿态识别方法主要有模板匹配方法、基于Hu不变距的深度图静态姿态识别方法及基于卷积神经网络的识别方法。其中，模板匹配方法对于复杂数据的鲁棒性较差，且处理效率较低。基于Hu不变距的姿态识别对图像噪声(例如部分姿态被遮挡)比较敏感，且计算比较复杂，用时较长。基于卷积神经网络的识别方法由于以彩色图像作为输入，因此容易受到环境光照的影响，需要进行一些复杂的预处理来修正图像，且其对于轮廓外形相似的姿态(例如单独伸出食指的姿态和单独伸出中指的姿态)，在没有额外信息作为输入的情况下，很难对该姿态进行正确识别。
技术实现思路
因此在现有技术中，采用现有的姿态识别方法存在识别精确度低、识别操作复杂等问题。为此，非常需要一种改进的姿态识别方法，以提高姿态识别准确率及姿态识别效率。在本上下文中，本专利技术的实施方式期望提供能够准确识别外形轮廓相似的姿态，并因此...

【技术保护点】
1.一种姿态识别方法，包括：获取待识别图像，所述待识别图像中包括目标对象；根据所述待识别图像确定第一向量，所述第一向量表征所述目标对象的姿态；以所述第一向量作为深度神经网络模型的输入，输出第二向量，所述第二向量包括表征所述目标对象关于多个预定姿态中每一个的置信度；以及根据所述第二向量，确定所述目标对象的姿态。

【技术特征摘要】
1.一种姿态识别方法，包括：获取待识别图像，所述待识别图像中包括目标对象；根据所述待识别图像确定第一向量，所述第一向量表征所述目标对象的姿态；以所述第一向量作为深度神经网络模型的输入，输出第二向量，所述第二向量包括表征所述目标对象关于多个预定姿态中每一个的置信度；以及根据所述第二向量，确定所述目标对象的姿态。2.根据权利要求1所述的方法，其中，所述根据所述待识别图像确定第一向量包括：以所述待识别图像作为卷积神经网络模型的输入，输出所述第一向量。3.根据权利要求1所述的方法，其中，所述根据所述待识别图像确定第一向量包括：确定表征所述目标对象的姿态的一个或多个关键点；以所述待识别图像的任一点为原点，确定所述一个或多个关键点的三维坐标值；以及对所述一个或多个关键点的三维坐标值进行归一化处理，由经归一化处理得到的所述一个或多个关键点的归一化三维坐标值组成所述第一向量。4.根据权利要求3所述的方法，其中，所述目标对象包括手，所述一个或多个关键点为多个关键点，所述多个关键点中的一个关键点为所述手的掌心对应的关键点，其他关键点为所述手的关节对应的关键点。5.根据权利要求1所述的方法，还包括：获取多个样本图像，每个样本图像包括所述目标对象，且所述每个样本图像各自具有标签，所述标签指示了所述每个样本图像包括的目标对象的姿态信息；根据所述多个样本图像，逐样本图像的确定第三向量，所述第三向量表征样本图像包括的目标对象的姿态，所述第三向量具有所述标签；对至少一个第三向量进行向量变换，得到与所述至少一个第三向量对应的至少一个第四向量，其中，以所述至少一个第三向量的标签分别作为对应的所述至少一个第四向量...

【专利技术属性】
技术研发人员：简睿卿，周志敏，丛林，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人