【技术实现步骤摘要】
动作识别方法、装置、电子设备及计算机可读存储介质
[0001]本申请涉及计算机
,具体而言,涉及一种动作识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]当前对动作识别技术的需求增长非常迅速,并扩展到许多领域,比如,视觉监视、人机交互、视频索引/检索、视频摘要和视频理解等。目前一般采用的动作识别方式如下:先采集动作识别训练集;然后根据采集的动作识别训练集训练得到基于骨架的动作识别网络;利用基于骨架的动作识别网络进行动作识别。然而,采集的动作识别训练集不可能覆盖到一个动作的每个视角,因此,基于骨架的动作识别网络对没有见过的视角下的动作无法做出正确的识别,即当实际应用场景数据的采集角度与训练集动作的采集视角不匹配时,基于骨架的动作识别网络获得的动作识别结果可能不准确。由此可知,当前的动作识别存在识别率低的问题。
技术实现思路
[0003]本申请实施例提供一种动作识别方法、装置、电子设备及计算机可读存储介质,其能够解决由于视角问题带来的识别率低的问题。
[0004]本申请的实施例可
【技术保护点】
【技术特征摘要】
1.一种动作识别方法,其特征在于,应用于电子设备,所述方法包括:获取待识别视频中目标对象的3D骨架序列,其中,所述目标对象为动作识别针对的对象,所述3D骨架序列中包括至少一个3D骨架,在所述3D骨架序列中包括多个3D骨架时,所述多个3D骨架按照各3D骨架在所述待识别视频中对应的时间的先后顺序排列;根据所述3D骨架序列,获得动作识别网络可识别角度对应的2D骨架序列,其中,2D骨架序列中包括至少一个2D骨架;通过所述动作识别网络,根据所述2D骨架序列进行动作识别,获得动作识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述3D骨架序列,获得动作识别网络可识别角度对应的2D骨架序列,包括:将所述3D骨架序列输入视角自适应网络,获得所述动作识别网络可识别角度对应的2D骨架序列;其中,所述视角自适应网络及所述动作识别网络由样本3D骨架序列及所述样本3D骨架序列对应的第一样本动作识别结果训练得到。3.根据权利要求2所述的方法,其特征在于,所述将所述3D骨架序列输入视角自适应网络,获得所述动作识别网络可识别角度对应的2D骨架序列,包括:通过所述视角自适应网络,确定所述3D骨架序列中各3D骨架所对应的2D投影参数;根据所述各3D骨架所对应的2D投影参数,对各2D投影参数所对应的3D骨架进行投影,获得所述动作识别网络可识别角度对应的2D骨架。4.根据权利要求2或3所述的方法,其特征在于,所述视角自适应网络及所述动作识别网络通过以下方式训练得到:获得多个第一训练样本,其中,所述第一训练样本中包括样本3D骨架序列及第一样本动作识别结果;将所述样本3D骨架序列输入至第一初始视角自适应网络中,并将通过所述第一初始视角自适应网络得到的2D骨架序列输入到第一初始动作识别网络中,得到第一初始动作识别结果;根据得到的第一初始动作识别结果及样本动作识别结果得到第一损失值,并根据该第一损失值通过反向传播的方式对所述第一初始视角自适应网络和/或第一初始动作识别网络中的参数进行调整;判断是否满足第一训练停止条件;若满足,则停止训练,并将当前的第一初始视角自适应网络及第一初始动作识别网络作为训练好的视角自适应网络及所述动作识别网络;若不满足,则返回将所述样本3D骨架序列输入至第一初始视角自适应网络中,并将通过所述第一初始视角自适应网络得到的2D骨架序列输入到第一初始动作识别网络中,得到第一初始动作识别结果的步骤。5.根据权利要求1所述的方法,其特征在于,所述获取待识别视频中目标对象的3D骨架序列,包括:通过3D姿态估计网络,对所述待识别视频中的每帧图像帧进行分析,获得所述每帧图像帧中所述目标对象的3D骨架。6.根据权利要求5所述的方法,其特征...
【专利技术属性】
技术研发人员:鲁静,贺银,
申请(专利权)人:深圳绿米联创科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。