手势识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35520316 阅读：30 留言：0更新日期：2022-11-09 14:39

本申请提供一种手势识别方法、装置、电子设备及存储介质，涉及深度学习技术领域。该方法包括：获取至少一帧待识别手势图像；采用预先训练的手势识别模型，识别各待识别手势图像的感知编码，并基于感知编码识别获取至少一帧待识别手势图像的手势识别结果，感知编码用于表征待识别手势图像中的手势在预设空间中的位置信息。本方法通过所训练的手势识别模型，提取待识别手势图像的感知编码作为待识别手势图像的特征信息，由于感知编码表征的是手势在预设空间中的位置信息，不同的手势对应的位置信息不同，也即，不同的手势均有唯一对应的感知编码，通过引入感知编码作为手势图像的特征信息，可有效提高相似手势的感知能力。可有效提高相似手势的感知能力。可有效提高相似手势的感知能力。

全部详细技术资料下载

【技术实现步骤摘要】
手势识别方法、装置、电子设备及存储介质

[0001]本申请涉及深度学习
，具体而言，涉及一种手势识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着深度学习以及神经网络技术的快速发展，手势识别由于其便捷性被广泛的应用在智能家电、游戏交互、AR(Augmented Reality，增强现实)/VR(Virtual Reality，虚拟现实)交互、智能手机操纵等场景中，用户体验的好坏很大程度上取决于手势识别的精确度。
[0003]目前大部分的手势识别方案是利用预先标注了手势类别的样本手势图像训练得到的网络模型进行手势识别。
[0004]但是，上述方式无法感知不同手势之间的细微差异，导致手势识别结果的精确度较差。

技术实现思路

[0005]本申请的目的在于，针对上述现有技术中的不足，提供一种手势识别方法、装置、电子设备及存储介质，以便于解决现有技术中不同手势差异无法感知，手势识别结果精确度较差的问题。
[0006]为实现上述目的，本申请实施例采用的技术方案如下：
[0007]第一方面，本申请实施例提供了一种手势识别方法，包括：
[0008]获取至少一帧待识别手势图像；
[0009]采用预先训练的手势识别模型，识别各所述待识别手势图像的感知编码，并基于所述感知编码识别获取所述至少一帧待识别手势图像的手势识别结果，所述感知编码用于表征所述待识别手势图像中的手势在预设空间中的位置信息。
[0010]第二方面，本申请实施例还提供了一种手势识别...

【技术保护点】

【技术特征摘要】
1.一种手势识别方法，其特征在于，包括：获取至少一帧待识别手势图像；采用预先训练的手势识别模型，识别各所述待识别手势图像的感知编码，并基于所述感知编码识别获取所述至少一帧待识别手势图像的手势识别结果，所述感知编码用于表征所述待识别手势图像中的手势在预设空间中的位置信息。2.根据权利要求1所述的方法，其特征在于，所述手势识别模型包括：手势感知编码网络和手势判别器；采用预先训练的手势识别模型，识别各所述待识别手势图像的感知编码，并基于所述感知编码识别获取所述至少一帧待识别手势图像的手势识别结果，包括：将所述至少一帧待识别手势图像输入所述手势感知编码网络，提取各所述待识别手势图像的感知编码；将各所述待识别手势图像的感知编码输入所述手势判别器，依次识别获取各所述待识别手势图像的手势识别结果。3.根据权利要求2所述的方法，其特征在于，所述手势识别模型采用如下方式训练得到：采集样本训练集，所述样本训练集中包括多个目标手势三元组，各目标手势三元组由第一手势图像、第二手势图像和第三手势图像组成，所述第二手势图像与所述第一手势图像的相似度大于第一预设阈值，所述第三手势图像与所述第一手势图像的相似度小于第二预设阈值，所述第一预设阈值大于所述第二预设阈值；各目标手势三元组具有标注信息，标注信息包括：图像相似度指示信息、以及各手势图像的手势类别；将所述样本训练集作为输入数据输入初始感知编码网络，训练获取所述手势感知编码网络；将所述样本训练集作为输入数据输入所述手势感知编码网络，获取所述手势感知编码网络输出的各目标手势三元组中各手势图像的感知编码；将所述样本训练集、以及所述手势感知编码网络输出的各目标手势三元组中各手势图像的感知编码作为输入数据输入初始判别器中，训练获取所述手势判别器。4.根据权利要求3所述的方法，其特征在于，所述采集样本训练集，包括：采集多个样本手势图像，并基于所述多个样本手势图像构建多个待选手势三元组；对各所述待选手势三元组进行有效性校验，将满足预设条件的待选手势三元组作为有效手势三元组；根据对各有效手势三元组的多条标注信息进行投票，确定各有效手势三元组的目标标注信息；将各有效手势三元组以及各有效手势三元组的目标标注信息作为所述目标手势三元组，得到所述样本训练集。5.根据权利要求3所述的方法，其特征在于，所述将所述样本训练集作为输入数据输入初始感知编码网络，训练获取所述手势感知编码网络，包括：将所述样本训练集作为输入数据输入初始感知编码网络，获取所述初始感知编码网络输出的各目标手势三元组中各手势图像的预测感知编码；根据各目标手势三元组中各手势图像的预测感知编码，计算所述初始感知编码网络的
第一损失参数；根据所述第一损失参数修正所述初始感知编码网络的网络参数，迭代执行，直至所述第一损失参数满足第三预设阈值，停止修正，将当前的初始感知编码网络作为所述手势感知编码网络。6.根据权利要求5所述的方法，其特征在于，所述根据各目标手势三元组中各手势图像的预测感知编码，计算所述初始感知编码网络的第一损失参数，包括：根据各目标手势三元组的标注信息中的图像相似度指示信息，分别确定各目标手势三元组中的第一手势图像、第二手势...

【专利技术属性】
技术研发人员：邱锋，丁彧，侯杰，吕唐杰，范长杰，胡志鹏，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人