用于识别动作的方法、装置、设备以及存储介质制造方法及图纸

技术编号：28421865 阅读：18 留言：0更新日期：2021-05-11 18:29

本申请公开了用于识别动作的方法、装置、设备以及存储介质，涉及计算机视觉、深度学习、增强现实技术领域。具体实现方案为：获取目标视频；对目标视频中的多个视频帧进行人体检测，确定多张人体图像；确定多张人体图像中人体对象对应的关键点；确定多个视频帧的空间特征信息；根据关键点以及空间特征信息，确定人体对象的动作。本实现方式可以提高动作识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
用于识别动作的方法、装置、设备以及存储介质
本申请涉及计算机
，具体涉及计算机视觉、深度学习、增强现实
，尤其涉及用于识别动作的方法、装置、设备以及存储介质。
技术介绍
动作识别是指基于视觉技术方案对视频中多帧画面中的人物，以及该段视频的时间和空间序列信息进行分析，从而判断人物正在进行的动作。理解视频中人的动作和行为，是计算机视觉和智能视频分析领域的一个挑战性问题，也是视频内容理解的关键，极具广泛的应用前景。
技术实现思路
提供了一种用于识别动作的方法、装置、设备以及存储介质。根据第一方面，提供了一种用于识别动作的方法，包括：获取目标视频；对目标视频中的多个视频帧进行人体检测，确定多张人体图像；确定多张人体图像中人体对象对应的关键点；确定多个视频帧的空间特征信息；根据关键点以及空间特征信息，确定人体对象的动作。根据第二方面，提供了一种用于识别动作的装置，包括：视频获取单元，被配置成获取目标视频；人体检测单元，被配置成对目标视频中的多个视频帧进行人体检测，确定多张人体图像；关键点确定单元，被配置成确定多张人体图像中人体对象的关键点；空间特征提取单元，被配置成确定多个视频帧的空间特征信息；动作识别单元，被配置成根据关键点以及空间特征信息，确定人体对象的动作。根据第三方面，提供了一种用于识别动作的电子设备，包括：至少一个处理器；以及与上述至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，上述指令被至少一个处理器执行，以使至少一个处理器能够...

【技术保护点】
1.一种用于识别动作的方法，包括：/n获取目标视频；/n对所述目标视频中的多个视频帧进行人体检测，确定多张人体图像；/n确定所述多张人体图像中人体对象对应的关键点；/n确定所述多个视频帧的空间特征信息；/n根据所述关键点以及所述空间特征信息，确定所述人体对象的动作。/n

【技术特征摘要】
1.一种用于识别动作的方法，包括：
获取目标视频；
对所述目标视频中的多个视频帧进行人体检测，确定多张人体图像；
确定所述多张人体图像中人体对象对应的关键点；
确定所述多个视频帧的空间特征信息；
根据所述关键点以及所述空间特征信息，确定所述人体对象的动作。

2.根据权利要求1所述的方法，其中，所述确定所述多张人体图像中人体对象对应的关键点，包括：
根据所述多张人体图像以及预先训练的特征提取模型，确定人体对象对应的关键点。

3.根据权利要求2所述的方法，其中，所述根据所述多张人体图像以及预先训练的特征提取模型，确定人体对象对应的关键点，包括：
根据所述多张人体图像以及预先训练的特征提取模型，确定第一特征图和第二特征图；
根据所述第一特征图，确定人体对象的关键点的立体热力图；
根据所述第二特征图以及所述立体热力图，确定关键点的偏移向量；
根据所述立体热力图以及所述偏移向量，确定关键点的坐标信息。

4.根据权利要求3所述的方法，其中，所述根据所述第一特征图，确定人体对象的关键点的立体热力图，包括：
增大所述第一特征图的分辨率，得到第三特征图；
提取所述第三特征图的特征，得到所述立体热力图。

5.根据权利要求3所述的方法，其中，所述根据所述第二特征图以及所述立体热力图，确定关键点的偏移向量，包括：
将所述第二特征图以及所述立体热力图进行融合，得到第一融合特征图；
提取所述第一融合特征图的特征，得到所述关键点的偏移向量。

6.根据权利要求1所述的方法，其中，所述确定所述多个视频帧的空间特征信息，包括：
根据所述多个视频帧以及预先训练的空间信息提取模型，确定所述空间特征信息。

7.根据权利要求6所述的方法，其中，所述根据所述多个视频帧以及预先训练的空间信息提取模型，确定所述空间特征信息，包括：
提取多个视频帧的上下文特征信息，得到上下文特征图；
放大所述上下文特征图的感受野，提取放大感受野后的上下文特征图的特征，得到所述空间特征信息。

8.根据权利要求1所述的方法，其中，所述根据所述关键点以及所述空间特征信息，确定所述人体对象的动作，包括：
对于每张人体图像，确定该人体图像中所述关键点对应的目标特征图；
对每个视频帧的空间特征信息进行调整，得到预设尺寸的空间特征图；
融合各目标特征图以及各空间特征图，得到第二融合特征图；
根据所述第二融合特征图，确定人体对象的动作。

9.根据权利要求8所述的方法，其中，所述融合各目标特征图以及各空间特征图，得到第二融合特征图，包括：
在各目标特征图中确定出候选目标特征图；
利用对应的空间特征图替换所述候选目标特征图，得到特征图序列；
提取所述特征图序列的特征，得到所述第二融合特征图。

10.一种用于识别动作的装置，包括：
视频获取单元，被配置成获取目标视频；
人体检测单元，被配置成对所述目标视频中的多个视频帧进行人体检测，确定多张人体图像；
关键点确定单元，被配置成确定所述多张人体图像中人体...

【专利技术属性】
技术研发人员：孟庆月，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人