动作识别方法、模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:34338623 阅读:82 留言:0更新日期:2022-07-31 03:28
本公开提供了一种动作识别方法,涉及人工智能技术领域,尤其涉及深度学习技术领域和音频数据处理技术领域。具体实现方案为:根据目标对象的动作,确定目标对象的当前输入信息;根据当前输入信息,确定与目标对象对应的处理参数,其中,处理参数包括缩放参数;以及根据处理参数和当前输入信息的特征信息,从与目标对象对应的多个动作类别中,识别与当前输入信息相匹配的动作类别。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。电子设备和存储介质。电子设备和存储介质。

【技术实现步骤摘要】
动作识别方法、模型训练方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习
和音频数据处理
更具体地,本公开提供了一种动作识别方法、深度学习模型的训练方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,深度学习模型广泛地应用于动作识别场景中。例如,根据采集到的与动作相关的图像数据或音频数据,利用深度学习模型进行动作识别。

技术实现思路

[0003]本公开提供了一种动作识别方法、深度学习模型的训练方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种动作识别方法,该方法包括:根据目标对象的动作,确定目标对象的当前输入信息;根据当前输入信息,确定与目标对象对应的处理参数,处理参数包括缩放参数和平移参数;以及根据处理参数和当前输入信息的特征信息,从与目标对象对应的多个动作类别中,识别与当前输入信息相匹配的动作类别。
[0005]根据本公开的另一方面,提供了一种深度学习模型的训练方法,该方法包括:将目标对象的多个预定输入信息本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种动作识别方法,包括:根据目标对象的动作,确定所述目标对象的当前输入信息;根据所述当前输入信息,确定与所述目标对象对应的处理参数,其中,所述处理参数包括缩放参数;以及根据所述处理参数和所述当前输入信息的特征信息,从与所述目标对象对应的多个动作类别中,识别与所述当前输入信息相匹配的动作类别。2.根据权利要求1所述的方法,其中,所述确定与所述目标对象对应的处理参数包括:确定来自所述目标对象的多个预定输入信息的参数编码特征信息,其中,所述多个预定输入信息表征了N个动作类别,N为大于1的整数;以及提取所述参数编码特征信息的多层感知特征,得到所述处理参数。3.根据权利要求2所述的方法,其中,所述处理参数还包括平移参数,所述多个动作类别包括N个动作类别;所述根据所述处理参数和所述当前输入信息的特征信息,从与所述目标对象对应的多个动作类别中,识别与所述当前输入信息相匹配的动作类别包括:利用所述缩放参数对所述当前输入信息的特征信息进行缩放,得到缩放特征信息;根据所述缩放特征信息和所述平移参数,得到条件特征信息;以及根据所述条件特征信息,从所述N个动作类别中,识别与所述当前输入信息相匹配的动作类别。4.根据权利要求1所述的方法,其中,所述根据目标对象的动作,确定所述目标对象的当前输入信息包括:采集由所述目标对象的手势产生的声波信号;以及确定所述声波信号的频域声波信号,作为所述当前输入信息。5.根据权利要求1所述的方法,还包括:根据与所述当前输入信息相匹配的动作类别,执行以下操作中的至少之一:展示与所述动作类别对应的图标;和实现与所述动作类别对应的预设功能。6.一种深度学习模型的训练方法,包括:将目标对象的多个预定输入信息输入深度学习模型,得到M组处理参数,其中,M为大于或等于1的整数,每组处理参数包括至少一个缩放参数;根据所述目标对象的样本输入信息的特征信息和所述M组处理参数,确定所述样本输入信息的分类结果,其中,所述目标对象的样本输入信息是根据所述目标对象的动作确定的;以及根据所述分类结果与样本输入信息的类别标签之间的差异,对所述深度学习模型进行训练。7.根据权利要求6所述的方法,其中,所述深度学习模型包括集合编码模块和M组参数生成模块;所述将目标对象的多个预定输入信息输入深度学习模型,得到M组处理参数包括:将所述多个预定输入信息输入集合编码模块,得到针对所述目标对象的参数编码特征信息;以及利用所述M组参数生成模块,分别提取所述参数编码特征信息的多层感知特征,得到所
述M组处理参数,其中,所述每组处理参数还包括至少一个平移参数。8.根据权利要求7所述的方法,其中,所述目标对象的样本输入信息的特征信息包括M级特征信息;所述根据所述目标对象的样本输入信息的特征信息和所述M组处理参数,确定所述样本输入信息的分类结果包括:根据所述目标对象的第m

1级条件特征信息,确定第m级特征信息,其中,m为大于1且小于或等于M的整数;利用第m组处理参数中的缩放参数,对所述第m级特征信息进行缩放,得到第m级缩放特征信息;以及根据所述第m级缩放特征信息和第m组处理参数中的平移参数,得到第m级条件特征信息。9.根据权利要求8所述的方法,其中,所述目标对象的样本输入信息的第1级特征信息是通过对所述样本输入信息进行卷积得到的。10.根据权利要求6所述的方法,其中,所述多个预定输入信息表征了N个动作类别,N为大于1的整数;所述样本输入信息的标签指示了样本输入信息被分类为N个动作类别中的目标动作类别,所述样本输入信息的分类结果指示了样本输入信息被分类为所述目标动作类别的概率。11.根据权利要求6所述的方法,其中,所述根据所述分类结果与样本输入信息的类别标签之间的差异,对所述深度学习模型进行训练包括:调整所述深度学习模型的参数,以使所述M组处理参数之间的欧氏距离与所述差异之和最小。12.一种动作识别装置,包括:第一确定模块,用于根据目标对象的动作,确定所述目标对象的当前输入信息;第二确定模块,用于根据所述当前输入信息,确定与所述目标对象对应的处理参数,其中,所述处理参数包括缩放参数;以及识别模块,用于根据所述处理参数和所述当前输入信息的特征信息,从与所述目标对象对应的多个...

【专利技术属性】
技术研发人员:王雅晴窦德景
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1