【技术实现步骤摘要】
用于识别动作的方法、装置、设备以及存储介质
本申请涉及计算机
,具体涉及计算机视觉、深度学习、增强现实
,尤其涉及用于识别动作的方法、装置、设备以及存储介质。
技术介绍
动作识别是指基于视觉技术方案对视频中多帧画面中的人物,以及该段视频的时间和空间序列信息进行分析,从而判断人物正在进行的动作。理解视频中人的动作和行为,是计算机视觉和智能视频分析领域的一个挑战性问题,也是视频内容理解的关键,极具广泛的应用前景。
技术实现思路
提供了一种用于识别动作的方法、装置、设备以及存储介质。根据第一方面,提供了一种用于识别动作的方法,包括:获取目标视频;对目标视频中的多个视频帧进行人体检测,确定多张人体图像;确定多张人体图像中人体对象对应的关键点;确定多个视频帧的空间特征信息;根据关键点以及空间特征信息,确定人体对象的动作。根据第二方面,提供了一种用于识别动作的装置,包括:视频获取单元,被配置成获取目标视频;人体检测单元,被配置成对目标视频中的多个视频帧进行人体检测,确定多张人体图像;关键点确定单元,被配置成确定多张人体图像中人体对象的关键点;空间特征提取单元,被配置成确定多个视频帧的空间特征信息;动作识别单元,被配置成根据关键点以及空间特征信息,确定人体对象的动作。根据第三方面,提供了一种用于识别动作的电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,上述指令被至少一个处理器执行,以使至少一个处理器能够 ...
【技术保护点】
1.一种用于识别动作的方法,包括:/n获取目标视频;/n对所述目标视频中的多个视频帧进行人体检测,确定多张人体图像;/n确定所述多张人体图像中人体对象对应的关键点;/n确定所述多个视频帧的空间特征信息;/n根据所述关键点以及所述空间特征信息,确定所述人体对象的动作。/n
【技术特征摘要】
1.一种用于识别动作的方法,包括:
获取目标视频;
对所述目标视频中的多个视频帧进行人体检测,确定多张人体图像;
确定所述多张人体图像中人体对象对应的关键点;
确定所述多个视频帧的空间特征信息;
根据所述关键点以及所述空间特征信息,确定所述人体对象的动作。
2.根据权利要求1所述的方法,其中,所述确定所述多张人体图像中人体对象对应的关键点,包括:
根据所述多张人体图像以及预先训练的特征提取模型,确定人体对象对应的关键点。
3.根据权利要求2所述的方法,其中,所述根据所述多张人体图像以及预先训练的特征提取模型,确定人体对象对应的关键点,包括:
根据所述多张人体图像以及预先训练的特征提取模型,确定第一特征图和第二特征图;
根据所述第一特征图,确定人体对象的关键点的立体热力图;
根据所述第二特征图以及所述立体热力图,确定关键点的偏移向量;
根据所述立体热力图以及所述偏移向量,确定关键点的坐标信息。
4.根据权利要求3所述的方法,其中,所述根据所述第一特征图,确定人体对象的关键点的立体热力图,包括:
增大所述第一特征图的分辨率,得到第三特征图;
提取所述第三特征图的特征,得到所述立体热力图。
5.根据权利要求3所述的方法,其中,所述根据所述第二特征图以及所述立体热力图,确定关键点的偏移向量,包括:
将所述第二特征图以及所述立体热力图进行融合,得到第一融合特征图;
提取所述第一融合特征图的特征,得到所述关键点的偏移向量。
6.根据权利要求1所述的方法,其中,所述确定所述多个视频帧的空间特征信息,包括:
根据所述多个视频帧以及预先训练的空间信息提取模型,确定所述空间特征信息。
7.根据权利要求6所述的方法,其中,所述根据所述多个视频帧以及预先训练的空间信息提取模型,确定所述空间特征信息,包括:
提取多个视频帧的上下文特征信息,得到上下文特征图;
放大所述上下文特征图的感受野,提取放大感受野后的上下文特征图的特征,得到所述空间特征信息。
8.根据权利要求1所述的方法,其中,所述根据所述关键点以及所述空间特征信息,确定所述人体对象的动作,包括:
对于每张人体图像,确定该人体图像中所述关键点对应的目标特征图;
对每个视频帧的空间特征信息进行调整,得到预设尺寸的空间特征图;
融合各目标特征图以及各空间特征图,得到第二融合特征图;
根据所述第二融合特征图,确定人体对象的动作。
9.根据权利要求8所述的方法,其中,所述融合各目标特征图以及各空间特征图,得到第二融合特征图,包括:
在各目标特征图中确定出候选目标特征图;
利用对应的空间特征图替换所述候选目标特征图,得到特征图序列;
提取所述特征图序列的特征,得到所述第二融合特征图。
10.一种用于识别动作的装置,包括:
视频获取单元,被配置成获取目标视频;
人体检测单元,被配置成对所述目标视频中的多个视频帧进行人体检测,确定多张人体图像;
关键点确定单元,被配置成确定所述多张人体图像中人体...
【专利技术属性】
技术研发人员:孟庆月,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。