一种手势识别方法以及相关装置制造方法及图纸

技术编号:29132169 阅读:37 留言:0更新日期:2021-07-02 22:27
本申请实施例公开了一种手势识别方法,涉及人工智能以及手势识别领域,方法包括:获取当前的目标应用场景,并从多个用于在不同应用场景中识别手势的手势识别模型中获取所述目标应用场景对应的目标手势识别模型,进而可以通过所述目标手势识别模型识别出所述手势数据对应的目标手势类型。本申请针对于目标应用场景,单独训练了一个目标手势识别模型,该目标手势识别模型用于识别目标应用场景需要识别的手势类型,只需要正确的识别出目标应用场景需要识别的手势类型,而不需要识别出除目标应用场景需要识别的手势类型之外的手势类别,能降低手势识别的混淆性,提高手势识别的准确性。

【技术实现步骤摘要】
一种手势识别方法以及相关装置
本申请涉及人工智能领域,尤其涉及一种应用操作方法以及相关装置。
技术介绍
近年来随着智能家居与可穿戴设备的迅速发展,用于计算的设备无处不在并融入到人们生活的环境当中。为方便人与计算设备的交互,相对于传统的接触式人机交互方式,有必要提出一种更加自然、使用户尽可能摆脱对输入设备等依赖的交互方式,如隔空手势。隔空手势是一类非接触式的、能够使用户以徒手方式进行操作的空中手势,其本质是一种不给用户手势交互带来任何不便的自然人机交互方式。隔空手势通过用户自然地利用手指、手腕和手臂动作表达其交互意图,主要包括指、挥手、握拳、手掌转动等,具有更广阔的交互空间、更高的灵活度和更好的交互体验等特点。依据感知设备的不同,目前主要分为基于计算机视觉、超声波和电磁波信号的三大类手势识别技术。在现有的实现方式中,可以通过预训练好的神经网络模型来进行手势类型的识别,该神经网络模型获取雷达装置采集得到的数据,并进行特征提取分割以及手势类别的识别。然而随着手势控制需求的增大,手势类型的数量不断增多,不同手势类型之间的区别度越来越小,使得准确识别手势类型成为一件较为困难的事情,现有的神经网络模型在进行手势类型识别的过程中,经常会出现手势误识别的现象。
技术实现思路
第一方面,本申请提供了一种手势识别方法,应用于计算设备,所述计算设备应用于多个手势控制的应用场景,所述多个手势控制的应用场景需要识别的手势类型不完全相同,其中手势控制的多类应用场景可以为同一个应用中的不同应用界面(例如应用场景可以是音频播放界面、视频播放界面或应用导航界面等等),或者是同一个终端设备的不同应用(例如应用场景可以是音频播放应用、聊天应用、视频播放应用或者是游戏应用),或者是同一个物理区域内的不同终端设备(例如应用场景可以电视、游戏机、空调等等终端设备)。所述方法包括:获取目标应用场景;从多个手势识别模型中获取所述目标应用场景对应的目标手势识别模型,其中,所述多个手势识别模型中的每个手势识别模型对应于一类应用场景,所述每个手势识别模型用于识别对应的一类应用场景中需要识别的手势类型;本申请实施例中,针对于每一类应用场景,训练了对应的手势识别模型,其中,每一类应用场景对应的手势识别模型可以识别出应用场景需要做出识别的手势类别。获取所述目标应用场景下的手势数据;通过所述目标手势识别模型识别出所述手势数据对应的目标手势类型。本申请实施例中,手势数据可以是基于对接收到雷达信号的反射信号进行处理得到的,其中雷达信号的种类可以包括但不限于连续波(continuouswave,CW)信号和chirp信号。在现有的实现方式中,可以通过预训练好的神经网络模型来进行手势类型的识别,该神经网络模型可以获取到雷达装置采集得到的数据,并进行特征提取分割以及手势类别的识别,为了能够识别出各类应用场景需要识别的全部手势类型,该神经网络模型需要具备识别出全部手势类型的能力。因而,该神经网络模型需要识别出的手势类型的种类较多(例如Y种手势类型),然而若目标应用场景只需要响应于其中的一部分手势类型(例如M种手势类型,且M小于Y),则在处于目标应用场景时,神经网络模型只需要正确的识别出M种手势类型即可。若采用现有的实现方式进行手势识别会存在着如下几种问题:一方面,可能会导致手势误识别的问题。例如,Y种手势类型中存在着两个非常相似的手势,例如画圈手势和画X手势,M种手势类型包括两个非常相似的手势中的一个手势,例如包括画圈手势而不包括画X手势或者包括画X手势而不包括画圈手势,若该神经网络模型具备着可以识别出两个非常相似的手势的能力,则神经网络模型需要区分出这两个非常相似的手势,在神经网络模型的训练过程中,由于手势之间的相似性很大,神经网络模型在更新参数时可能会有很大的概率出现局部最值,会对这两个非常相似的手势的识别出现混淆,例如将画圈手势识别成画X手势,或者将画X手势识别成画圈手势。目标应用场景只需要响应于画圈手势而不需要响应于画X手势,用户若进行了一个画X手势,神经网络模型可能将该画X手势识别为画圈手势,进而出现了手势的误识别。另一方面,原有神经网络模型可能无法识别新的手势类型。由于可识别出Y种手势类型的神经网络模型是预训练好的,在应用场景的类别越来越多、手势类型多样的情况下,出现了一些需要响应于不包括在Y种手势类型之内的手势类型的应用场景,例如在终端设备新安装了一些可响应于不包括在Y种手势类型之内的手势类型的应用时,上述可识别出Y种手势类型的神经网络模型就无法使用了,这种情况下,需要在原有的神经网络模型上继续训练,或者重新训练一个可以识别原有的Y类手势类别以及新增加的手势类别的神经网络模型,由于需要识别出的手势类别数量很大,因此模型本身的参数量很大,且训练过程需要花费的计算量和时间很多。此外,若新增加的手势类别与原本的Y类手势类别中的一个或多个手势类别之间的相似度很大,则同样会出现上述的识别混淆的问题。然而,若针对于目标应用界面,单独训练了一个目标手势识别模型,该目标手势识别模型用于识别M种手势类型,以M种手势类型包括画圈手势而不包括画X手势为例,神经网络模型不需要区分出画圈手势和画X手势,只需要正确的识别出画圈手势,由于不需要识别出画X手势,神经网络模型在更新参数时会较快收敛,并能准确地识别出画圈手势。且,M种手势类型的数量远远小于Y种手势类型,因此模型本身的参数量较小,训练过程需要花费的计算量和时间相比训练可识别出Y种手势类型的神经网络模型是少很多的。在出现了一些新的应用场景时(也就是在终端设备或云侧服务器上未存储有可识别新的应用场景需要识别的手势类别),只需要训练能识别出新的应用场景需要识别的手势类别的神经网络模型即可。本实施例针对于目标应用场景,单独训练了一个目标手势识别模型,该目标手势识别模型用于识别目标应用场景需要识别的手势类型,只需要正确的识别出目标应用场景需要识别的手势类型,而不需要识别出除目标应用场景需要识别的手势类型之外的手势类别,神经网络模型在更新参数时会较快收敛,并能降低手势识别的混淆性,提高手势识别的准确性。且,由于需要识别的手势类别数量较少,因此模型本身的参数量较小,训练过程需要花费的计算量和时间较少。此外,在出现一些新的应用场景时,只需要训练能识别出新的应用场景可以识别的手势类别的神经网络模型即可。在一种可能的实现中,所述目标应用场景需要识别M种手势类型;所述多个手势识别模型中还包括第一手势识别模型,所述第一手势识别模型用于在第一应用场景中,根据获取到的手势数据识别对应的手势类型,所述第一应用场景需要识别N种手势类型;所述M种手势类型与所述N种手势类型不完全相同。计算设备可以从本地存储或云端存储获取目标应用场景的场景下对应手势识别模型(目标手势识别模型),其中本地存储或云端存储中可以存储着多个手势识别模型,每个手势识别模型对应于一类应用场景,不同类的应用场景需要相应的手势类别不同,每个手势识别模型可以识别出对应的应用场景需要识别的手势类别,具体的本文档来自技高网...

【技术保护点】
1.一种手势识别方法,其特征在于,应用于计算设备,所述计算设备应用于多个手势控制的应用场景,所述多个手势控制的应用场景需要识别的手势类型不完全相同,所述方法包括:/n获取目标应用场景;/n从多个手势识别模型中获取所述目标应用场景对应的目标手势识别模型,其中,所述多个手势识别模型中的每个手势识别模型对应于一类应用场景,所述每个手势识别模型用于识别对应的一类应用场景中需要识别的手势类型;/n获取所述目标应用场景下的手势数据;/n基于所述目标手势识别模型识别所述手势数据对应的目标手势类型。/n

【技术特征摘要】
1.一种手势识别方法,其特征在于,应用于计算设备,所述计算设备应用于多个手势控制的应用场景,所述多个手势控制的应用场景需要识别的手势类型不完全相同,所述方法包括:
获取目标应用场景;
从多个手势识别模型中获取所述目标应用场景对应的目标手势识别模型,其中,所述多个手势识别模型中的每个手势识别模型对应于一类应用场景,所述每个手势识别模型用于识别对应的一类应用场景中需要识别的手势类型;
获取所述目标应用场景下的手势数据;
基于所述目标手势识别模型识别所述手势数据对应的目标手势类型。


2.根据权利要求1所述的方法,其特征在于,
所述目标应用场景需要识别M种手势类型;
所述多个手势识别模型中还包括第一手势识别模型,所述第一手势识别模型对应于第一应用场景,所述第一应用场景需要识别N种手势类型;
所述M种手势类型与所述N种手势类型不完全相同。


3.根据权利要求2所述的方法,其特征在于,所述N种手势类型包括第一手势和第二手势,所述第一手势和所述第二手势的相似度大于预设值,所述M种手势类型包括所述第一手势且不包括所述第二手势。


4.根据权利要求1至3任一所述的方法,其特征在于,所述多个手势识别模型为神经网络模型。


5.根据权利要求2至4任一所述的方法,其特征在于,
所述目标手势识别模型的训练样本包括样本标签为M种手势类型的手势数据;
所述第一手势识别模型的训练样本包括样本标签为N种手势类型的手势数据。


6.根据权利要求1至5任一所述的方法,其特征在于,所述获取所述目标应用场景下的手势数据,具体为:
获取所述目标应用场景下的雷达反射信息;
基于所述雷达反射信息,获取手势数据。


7.根据权利要求1至6任一所述的方法,其特征在于,所述目标手势类型为画圈手势,所述方法还包括:基于所述手势数据,确定所述画圈手势的运动特征,所述运动特征包括所述画圈手势在方位角或者俯仰角上随时间的角度变化;
获取所述角度变化中波峰和波谷的数量;
根据所述波峰或者波谷的数量,确定所述画圈手势的画圈次数。


8.根据权利要求7所述的方法,其特征在于,所述在方位角或者俯仰角上随时间的角度变化包括所述画圈手势在方位角上随时间的第一角度变化,以及所述画圈手势在俯仰角上随时间的第二角度变化;
所述方法还包括:
根据所述第一角度变化以及所述第二角度变化,确定所述画圈手势的画圈方向。


9.一种手势识别装置,其特征在于,所述手势识别装置应用于多个手势控制的应用场景,所述多个手势控制的应用场景需要识别的手势类型不完全相同,所述装置包括:
获取模块,用于获取目标应用场景;
所...

【专利技术属性】
技术研发人员:夏朝阳丁根明徐丰
申请(专利权)人:华为技术有限公司复旦大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1