手势识别方法及装置、存储介质、处理器制造方法及图纸

技术编号:21454668 阅读:23 留言:0更新日期:2019-06-26 05:00
本发明专利技术公开了一种手势识别方法及装置、存储介质、处理器。其中,该方法包括:通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,训练样本包括:多张包含不同手势信息的图片;将目标图片输入第一网络模型,输出第一识别结果,其中,第一识别结果用于指示以下信息至少之一:手势在目标图片中的位置,手势在目标图片中内容。本发明专利技术解决了相关技术中无法准确、实时、有效的进行手势识别的技术问题。

【技术实现步骤摘要】
手势识别方法及装置、存储介质、处理器
本专利技术涉及手势识别领域,具体而言,涉及一种手势识别方法及装置、存储介质、处理器。
技术介绍
手势识别是视频和图像识别中的一个难点,而手部动作十分灵活,产生的形状繁多,不同手势之间难以区分,容易造成错误检测,目前的传统机器学习算法中网络设计较为庞大,计算量大,因此难以达到实时的效果。目前的手势识别技术主要有:1)基于机器学习的方法:基于机器学习的方法常见的有使用级联分类器的方法和支持向量机的方法。其中,使用级联分类器的方法通过对Haar等特征采用多个级联的弱分类器来进行判别,达到一定阈值即可对特定手势得到“是”/“否”的结论。其特征通常采用常见的Haar、LBP等,如果想采用其他特征,则需要人为精心设计,且效果难以令人满意。而使用支持向量机的方法则通过对Hog等特征采用支持向量机进行分类,从而判别是否为检测目标,但其准确性也难以达到直播场景的要求。2)基于深度学习的方法:通过多层神经网络进行特征提取,得到特征图,对多个候选框的特征图进行分类,判断是否为想要检测的手势的类型。但目前已有的一些检测算法计算量大,计算耗时久,无法达到移动设备上实时检测的要求。基于机器学习的方法准确率较差,容易出现错误的检测结果,且其使用的Haar、LBP、Hog等特征种类有限,也难以设计其他的特征种类来取得好的效果。已有的基于深度学习的方法目前存在计算量较大,难以达到视频直播中实时检测的要求。针对相关技术中无法准确、实时、有效的进行手势识别的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种手势识别方法及装置、存储介质、处理器,以至少解决相关技术中无法准确、实时、有效的进行手势识别的技术问题。根据本专利技术实施例的一个方面,提供了一种手势识别方法,包括:通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,所述训练样本包括:多张包含不同手势信息的图片;将目标图片输入第一网络模型,输出第一识别结果,其中,所述第一识别结果用于指示以下信息至少之一:手势在所述目标图片中的位置,手势在所述目标图片中内容。进一步地,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数包括:将所述训练样本输入至第二网络模型,输出第二识别结果;当所述训练样本与所述第二识别结果之间的相似度大于第一阈值时,根据所述第二网络模型所使用的参数调整所述第一网络模型,得到所述计算层的权重参数。进一步地,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数之前,获得所述待使用训练样本包括:获取初始训练样本;对所述初始训练样本进行预处理,得到所述待使用训练样本,其中,所述预处理包括以下至少之一:随机曝光处理,随机模糊处理。进一步地,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数还包括;对所述待使用训练样本中包含不同手势信息的图片进行网格划分;通过对划分后的所述图片进行训练,确定第一网络模型中计算层的权重参数。进一步地,将目标图片输入第一网络模型,输出第一识别结果之后,所述方法包括;当所述识别结果与样本库中的样本相似度小于第二阈值时,通过调整所述第一网络模型中的权重系数获得识别精度高的第一网络模型。进一步地,根据预设规则设置所述第一网络模型,其中,所述第一网络模型包括:计算层;所述计算层至少包括以下之一:卷积单元、批归一化单元、加权单元、线性整流单元、最大池化单元、通道重排单元。根据本专利技术实施例的另一方面,还提供了一种手势识别装置,包括:确定单元,用于通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,所述训练样本包括:多张包含不同手势信息的图片;输出单元,用于将目标图片输入第一网络模型,输出第一识别结果,其中,所述第一识别结果用于指示以下信息至少之一:手势在所述目标图片中的位置,手势在所述目标图片中内容。进一步地,所述确定单元包括:输出模块,用于将所述训练样本输入至第二网络模型,输出第二识别结果;第一得到模块,用于当所述训练样本与所述第二识别结果之间的相似度大于预定阈值时,根据所述第二网络模型所使用的参数调整所述第一网络模型,得到所述计算层的权重参数。进一步地,所述装置包括:获得单元,用于获得所述训练样本,其中所述获得单元包括:获取模块,用于通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数之前,获取初始训练样本;第二得到模块,用于对所述初始训练样本进行预处理,得到所述待使用训练样本,其中,所述预处理包括以下至少之一:随机曝光处理,随机模糊处理。根据本专利技术实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述任一项所述的手势识别方法。根据本专利技术实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任一项所述的手势识别方法。在本专利技术实施例中,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,训练样本包括:多张包含不同手势信息的图片;将目标图片输入第一网络模型,输出第一识别结果,其中,第一识别结果用于指示以下信息至少之一:手势在目标图片中的位置,手势在目标图片中内容,进而解决了相关技术中无法准确、实时、有效的进行手势识别的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的手势识别方法的流程图;图2是根据本专利技术优选实施例的网络模型中计算层的结构示意图;以及图3是根据本专利技术实施例的手势识别装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。首先,在对本专利技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:特征图:图像的每个通道可以称作一张特征图。例如普通彩色图片通常为RGB三个通道,可以称为三张特征图,这里图像是广义的,可以有多个通道。计算层的参数分两种:一种是描述性参数,例如该计算层的类型(如卷积层、池化层、批归一化层,etc.),权重参数的尺寸等。另一种是权重参数,其数量及使用方法由描述性参数确定,但权重参数的值是通过不断迭代训练得到的。描述性参数是根据一些理论知识结合经验制定的,不会通过训练迭代调整。本文档来自技高网
...

【技术保护点】
1.一种手势识别方法,其特征在于,包括:通过对待使用的训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,所述训练样本包括:多张包含不同手势信息的图片;将待识别的目标图片输入所述第一网络模型,输出第一识别结果,其中,所述第一识别结果用于指示以下信息至少之一:手势在所述目标图片中的位置,手势在所述目标图片中内容。

【技术特征摘要】
1.一种手势识别方法,其特征在于,包括:通过对待使用的训练样本进行训练,确定第一网络模型中计算层的权重参数,其中,所述训练样本包括:多张包含不同手势信息的图片;将待识别的目标图片输入所述第一网络模型,输出第一识别结果,其中,所述第一识别结果用于指示以下信息至少之一:手势在所述目标图片中的位置,手势在所述目标图片中内容。2.根据权利要求1所述的方法,其特征在于,通过对待使用训练样本进行训练,确定所述第一网络模型中计算层的权重参数包括:将所述训练样本输入至第二网络模型,输出第二识别结果;当所述训练样本与所述第二识别结果之间的相似度大于第一阈值时,根据所述第二网络模型所使用的参数调整所述第一网络模型,得到所述计算层的权重参数。3.根据权利要求2所述的方法,其特征在于,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数之前,获得所述待使用训练样本包括:获取初始训练样本;对所述初始训练样本进行预处理,得到所述待使用训练样本,其中,所述预处理包括以下至少之一:随机曝光处理,随机模糊处理。4.根据权利要求1所述的方法,其特征在于,通过对待使用训练样本进行训练,确定第一网络模型中计算层的权重参数还包括;对所述待使用训练样本中包含不同手势信息的图片进行网格划分;通过对划分后的所述图片进行训练,确定第一网络模型中计算层的权重参数。5.根据权利要求1所述的方法,其特征在于,将目标图片输入第一网络模型,输出第一识别结果之后,所述方法包括;当所述识别结果与样本库中的样本相似度小于第二阈值时,通过调整所述第一网络模型中的权重系数更新所述第一网络模型。6.根据权利要求1所述的方法,其特征在于,根...

【专利技术属性】
技术研发人员:孙智陀健
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1