【技术实现步骤摘要】
手势识别方法、装置、电子设备及存储介质
[0001]本专利技术涉及图像识别
,尤其涉及一种手势识别方法
、
装置
、
电子设备及存储介质
。
技术介绍
[0002]通过手势识别的方法可以对图像中的目标对象进行手势识别得到手势识别结果,进而能将手势识别结果应用于手势解锁或手势控制等多种手势应用场景中
。
[0003]现有的基于深度学习网络模型的手势识别方法,主要是通过依次执行两个阶段的步骤,得到手势识别结果
。
其中,第一个步骤为目标检测步骤,是根据输入的图像序列,检测出各图像中目标对象的人体检测框信息,并结合空间位置信息对每个目标对象在时序上进行关联,得到目标对象对应的“时空区域”;第二个步骤为手势识别步骤,是根据第一个步骤中得到的每个目标对象的“时空区域”,对各目标对象逐一进行手势识别,以得到每个目标对象的手势识别结果
。
[0004]上述手势识别方法中使用的网络模型,是分别对应于目标检测步骤的检测模型以及对应于手势识别步骤的识别模型
。
两个模型是通过独立训练得到的独立模型,在每次手势识别应用时,均需经过“先检测,再识别”两个阶段
。
当待识别的图像序列中包含多个目标对象时,需先检测出各图像中各目标对象的“时空区域”,再将每个目标对象的“时空区域”分别输入识别模型中依次识别出各目标对象的手势
。
这种经历两个阶段才能完成识别的实现方式,极大地增加了全流程的耗时,识别的效率较 ...
【技术保护点】
【技术特征摘要】
1.
一种手势识别方法,其特征在于,包括:将至少一帧图像输入手势识别模型的编码模块中,得到所述编码模块输出的各图像对应的编码特征;各所述图像包括至少一个对象;针对各图像对应的编码特征,将所述编码特征和至少一个查询特征输入所述手势识别模型中与所述图像对应的解码模块中,得到所述解码模块输出的解码特征;所述至少一个查询特征与所述解码模块对应;所述对象和所述查询特征一一对应,所述解码特征包括通过所述查询特征从所述编码特征中查询的对应对象的手势特征;将所述解码特征输入所述手势识别模型中与所述图像对应的识别模块中,基于所述手势特征确定所述图像中各对象的手势类别,并通过所述识别模块输出所述手势类别;基于各图像中各对象的手势类别,确定各所述对象的手势
。2.
根据权利要求1所述的手势识别方法,其特征在于,所述图像的数量为至少两帧,所述手势识别模型中包括至少两个解码模块;所述方法还包括:将前一帧图像对应的解码模块输出的解码特征和至少一个初始查询特征进行拼接,得到当前帧图像对应的解码模块的至少一个查询特征
。3.
根据权利要求1所述的手势识别方法,其特征在于,所述图像的数量为至少两帧,所述解码特征还包括通过所述查询特征从所述编码特征中查询的对应对象的位置特征;所述方法还包括:将所述解码特征输入所述手势识别模型中与所述图像对应的位置检测模块中,基于所述位置特征确定所述图像中各对象的位置信息,并通过所述位置检测模块输出所述位置信息;基于至少两帧图像中各对象的位置信息,确定各所述对象的轨迹
。4.
根据权利要求1所述的手势识别方法,其特征在于,所述解码特征还包括通过所述查询特征从所述编码特征中查询的对应对象所在位置的类别特征;所述方法还包括:将所述解码特征输入所述手势识别模型中与所述图像对应的类别识别模块中,基于所述类别特征确定所述图像中各对象所在位置的类别,并通过所述类别识别模块输出所述类别,所述类别包括前景或背景
。5.
根据权利要求4所述的手势识别方法,其特征在于,所述基于各图像中各对象的手势类别,确定各所述对象的手势,包括:基于各图像中各对象所在位置的类别,从各所述图像中筛选前景对象;基于各所述图像中各前景对象的手势类别,确定各所述前景对象的手势
。6.
根据权利要求1‑5任一项所述的手势识别方法,其特征在于,所述手势识别模型为基于如下方式训练得到的:获取样本图像序列,所述样本图像序列中包括基于时序采集的至少一帧样本图像;将至少一帧样本图像...
【专利技术属性】
技术研发人员:林垠,陈叶瀚森,沈锦瑞,殷保才,胡金水,殷兵,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。