手势识别模型的生成方法、装置、存储介质及电子设备制造方法及图纸

技术编号:28302953 阅读:10 留言:0更新日期:2021-04-30 16:33
本申请公开了一种手势识别模型的生成方法、装置、存储介质及电子设备,该方法包括:获取多段待训练超声波信号;生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;根据所述多张待训练语谱图,构建语谱图数据库;对所述语谱图数据库进行训练,得到手势识别模型。本申请可以提高手势识别的准确性。

【技术实现步骤摘要】
【国外来华专利技术】手势识别模型的生成方法、装置、存储介质及电子设备
本申请属于终端
,尤其涉及一种手势识别模型的生成方法、装置、存储介质及电子设备。
技术介绍
随着终端技术的快速发展,终端上的功能越来越丰富。例如,通过手势识别实现人机交互。手势识别一般是指对脸部和手的运动进行识别。用户可以使用简单的手势来控制或与终端交互,让终端理解用户的行为。相关技术中,可以利用超声波信号来实现手势识别。在进行超声波手势识别时需要使用到手势识别模型。然而,相关技术中,用于进行超声波手势识别的手势识别模型的识别精确度较低。
技术实现思路
本申请实施例提供一种手势识别模型的生成方法、装置、存储介质及电子设备,可以得到精确度更高的手势识别模型,从而可以提高手势识别的准确性。第一方面,本申请实施例提供一种手势识别模型的生成方法,包括:获取多段待训练超声波信号;生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;根据所述多张待训练语谱图,构建语谱图数据库;对所述语谱图数据库进行训练,得到手势识别模型。第二方面,本申请实施例提供一种手势识别模型的生成装置,包括:获取模块,用于获取多段待训练超声波信号;生成模块,用于生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;构建模块,用于根据所述多张待训练语谱图,构建语谱图数据库;训练模块,用于对所述语谱图数据库进行训练,得到手势识别模型。第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机上执行时,使得所述计算机执行本实施例提供的手势识别模型的生成方法。第四方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行:获取多段待训练超声波信号;生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;根据所述多张待训练语谱图,构建语谱图数据库;对所述语谱图数据库进行训练,得到手势识别模型。本申请实施例中,由于语谱图的特征点相较于超声波信号来说更多、更显著,因此,相对于直接将超声波信号作为样本数据进行训练,生成的手势识别模型来说,本实施例中,通过将超声波信号转化为语谱图,然后将该语谱图作为样本数据进行训练,生成的手势识别模型的精确度更高,从而提高了手势识别的准确性。附图说明下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。图1是本申请实施例提供的手势识别模型的生成方法的第一种流程示意图。图2是本申请实施例提供的手势识别模型的生成方法的第二种流程示意图。图3是本申请实施例提供的手势识别模型的生成方法的第三种流程示意图。图4是本申请实施例提供的手势识别模型的生成装置的结构示意图。图5是本申请实施例提供的电子设备的第一种结构示意图。图6是本申请实施例提供的电子设备的第二种结构示意图。具体实施方式请参照图示,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。请参阅图1,图1是本申请实施例提供的手势识别模型的生成方法的第一种流程示意图。该手势识别模型的生成方法的流程可以包括:在101中,获取多段待训练超声波信号。其中,待训练超声波信号为音频信号中的一种,振动频率大于20000Hz以上,超出了人耳听觉的一般上限(20000Hz),不会产生噪声,引起用户的不适体验。比如,电子设备可以发射超声波信号。从而在用户的脸部或者手部在电子设备的预设范围内活动时,电子设备获取经用户的脸部或者手部反射的超声波信号。其中,电子设备发射的超声波信号可以为连续扫频信号。该超声波信号可以表示为:其中,T表示时长,f1表示起始频率,f2表示终止频率,A1表示幅值,fs表示采样频率,优先而不局限的,该fs=96kHz。其中,待训练超声波信号可以是用户的脸部靠近或者远离电子设备的过程中,电子设备发射的超声波信号经用户的脸部反射的超声波信号。或者待训练超声波信号可以是用户的手在电子设备的预设范围内向左挥动一次、向右挥动一次、向上挥动一次、向下挥动一次、左右挥动、或者前后挥动等过程中,电子设备发射的超声波信号经用户的手反射的超声波信号。在本实施例中,以A用户为例,电子设备发射超声波信号。在电子设备发射超声波信号时,可以让A用户将电子设备靠近脸部。电子获取经用户的脸部反射的超声波信号,得到A用户对应的待训练超声波信号。同样的,电子设备可以依照上述方式获取B用户、C用户、D用户和E用户等多个用户分别对应的待训练超声波信号,得到多段待训练超声波信号。其中,预设范围可以由电子设备自动确定,也可以由用户设置。该预设范围可以设置为距离电子设备3厘米的区域。该预设范围还可以设置为距离电子设备5厘米的区域,等等,此处不做具体限制。可以理解,以上仅仅是对待训练超声波信号的几种示例,并不用于限制本申请。在102中,生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图。在本实施例中,当电子设备获取多段待训练超声波信号之后,电子设备可以生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图。在103中,根据多张待训练语谱图构建语谱图数据库。可以理解,采集的样本数据越多,训练之后获得的模型的精确度越高。在本实施例中,流程101至流程103为手势识别模型的样本数据采集过程,即语谱图数据库中的语谱图的采集过程。为了得到相对来说精确度较高的手势识别模型,电子设备可以获取较多张语谱图进行训练。比如,可以采用以下方式构建语谱图数据库:方式1、针对某一个场景来构建语谱图数据库。以A用户为例,比如用户A在电子设备靠近脸部这个场景下,电子设备发射超声波信号。在电子设备发射超声波信号时,可以让A用户将电子设备靠近脸部。电子获取经用户的脸部反射的超声波信号,得到A用户的待训练超声波信号。同样的,电子设备可以依照上述方式获取B用户的待训练超声波信号、C用户的待训练超声波信号、D用户的待训练超声波信号和E用户的待训练超声波信号,等等。例如,假设电子设备一共获取到500个用户的待训练超声波信号。然后,电子设备生成每个用户的待训练超声波信号对应的待训练语谱图,得到500个用户的待训练语谱图。电子设备可以将500个用户的待训练语谱图汇总成语谱图数据库。方式2、针对多个场景构建语谱图数据库。以A用户为例,比如用户A在电子设备靠近脸部这个场景下,电子设备发射超声波信号。在电子设备发射超声波信号时,可以让A用户将电子设备靠近脸部。电子获取经用户的脸部反射的超声波信号,得到A用户在该场景下的待训练超声波信号。同本文档来自技高网...

【技术保护点】
一种手势识别模型的生成方法,其中,包括:/n获取多段待训练超声波信号;/n生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;/n根据所述多张待训练语谱图,构建语谱图数据库;/n对所述语谱图数据库进行训练,得到手势识别模型。/n

【技术特征摘要】
【国外来华专利技术】一种手势识别模型的生成方法,其中,包括:
获取多段待训练超声波信号;
生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;
根据所述多张待训练语谱图,构建语谱图数据库;
对所述语谱图数据库进行训练,得到手势识别模型。


根据权利要求1所述的手势识别模型的生成方法,其中,所述生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图,包括:
对所述每段待训练超声波信号进行分帧加窗处理,得到每段待训练超声波信号对应的多帧加窗信号;
对每帧加窗信号进行傅里叶变换,得到多帧频域信号;
计算每帧频域信号的能量密度,得到每段待训练超声波信号对应的所有帧的能量密度;
根据每段待训练超声波信号对应的所有帧的能量密度,生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图。


根据权利要求1所述的手势识别模型的生成方法,其中,在所述对所述语谱图数据库进行训练,得到手势识别模型之后,还包括:
获取手势识别模型的各个模型输出结果;
接收操作关联指令,所述操作关联指令携带操作信息,所述操作信息包括多个操作;
根据所述操作关联指令,将所述各个模型输出结果分别与多个操作中的其中一个操作进行关联,得到预设关联库。


根据权利要求3所述的手势识别模型的生成方法,其中,在所述根据所述操作关联指令,将所述各个模型输出结果分别与多个操作中的其中一个操作进行关联,得到预设关联库之后,还包括:
获取待识别超声波信号;
生成所述待识别超声波信号对应的待识别语谱图;
将所述待识别语谱图输入所述手势识别模型,得到待识别语谱图对应的输出结果;
根据所述待识别语谱图对应的输出结果以及预设关联库,执行相应的操作。


根据权利要求4所述的手势识别模型的生成方法,其中,所述根据所述待识别语谱图对应的输出结果以及预设关联库,执行相应的操作,包括:
检测预设关联库中是否存在与待识别语谱图对应的输出结果匹配的模型输出结果;
若预设关联库中存在与待识别语谱图对应的输出结果匹配的模型输出结果,则获取与模型输出结果关联的操作;
执行所述操作。


根据权利要求4所述的手势识别模型的生成方法,其中,所述获取待识别超声波信号,包括:
检测电子设备是否处于通信状态,所述通信状态包括通话状态和来电状态;
若电子设备处于通信状态,则获取待识别超声波信号。


根据权利要求4所述的手势识别模型的生成方法,其中,所述获取待识别超声波信号,包括:
检测电子设备中的闹钟应用的提醒事件是否被触发;
若电子设备中的闹钟应用的提醒事件被触发,则获取待识别超声波信号。


根据权利要求1所述的手势识别模型的生成方法,其中,所述获取多个待训练超声波信号,包括:
获取多个待训练超声波信号,所述待训练超声波信号是用户的脸部靠近或者远离电子设备的过程中,电子设备发射的超声波信号经用户的脸部反射的超声波信号;
或者,所述待训练超声波信号是用户的手在电子设备的预设范围内向左挥动一次、向右挥动一次、向上挥动一次或者向下挥动一次的过程中,电子设备发射的超声波信号经用户的手反射的超声波信号。


一种手势识别模型的生成装置,其中,包括:
获取模块,用于获取多段待训练超声波信号;
生成模块,用于生成每段待训练超声波信号对应的待训练语谱图,得到多张待训练语谱图;
构建模块,用于根据所述多张待训练语谱图,构建语谱图数据库;
训练模块,用于对所述语谱图数据库进行训练,得到手势识别模型。


根据权利要求9所述的手势识别模型的生成装置,其中,所述生成模块,用于:
对所述每段待训练超声波信号进行分帧加窗处理,得到每段待训练超声波信号对应的多帧加窗信...

【专利技术属性】
技术研发人员:陈岩
申请(专利权)人:深圳市欢太科技有限公司OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1