一种动作识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：29255788 阅读：17 留言：0更新日期：2021-07-13 17:27

本公开实施例公开了一种动作识别方法、装置、设备及计算机可读存储介质。该方法包括：对待识别的视频序列中的每帧图像的特征图进行空间编码，得到每帧图像的动作主体特征向量；对每帧图像的动作主体特征向量进行时序关联，得到每帧图像的动作主体时序特征向量；依据动作主体时序特征向量，对每帧图像的特征图进行特征增强，得到每帧图像的动作增强特征图；对视频序列包含的图像中的每帧图像的动作增强特征图进行动作识别，得到视频序列的动作识别结果。通过本公开，能够提高动作识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种动作识别方法、装置、设备及计算机可读存储介质
本公开涉及人工智能领域中的计算机视觉技术，尤其涉及一种动作识别方法、装置、设备及计算机可读存储介质。
技术介绍
动作识别是指利用计算机视觉技术对视频画面中的人物的动作进行识别与理解的过程，其可以广泛应用于虚拟现实交互、视频语义理解等应用中。动作识别可以借助于深度学习技术来实现，例如，通过卷积神经网络结合时序关联感知的方式，来实现动作识别。然而相关技术中，在动作识别，特别是时序关联感知时会引入大量的背景信息，使得时序关联感知的准确度较低，最终使得动作识别的准确度较低。
技术实现思路
本公开实施例提供一种动作识别方法、装置、设备及计算机可读存储介质，能够提高动作识别的准确度。本公开实施例的技术方案是这样实现的：本公开实施例提供一种动作识别方法，包括：对待识别的视频序列中的每帧图像的特征图进行空间编码，得到所述每帧图像的动作主体特征向量；对所述每帧图像的所述动作主体特征向量进行时序关联，得到所述每帧图像的动作主体时序特征向量；依据所述动作主体时序特征向量，对所述每帧图像的所述特征图进行特征增强，得到所述每帧图像的动作增强特征图；对所述视频序列包含的图像中的每帧图像的动作增强特征图进行动作识别，得到所述视频序列的动作识别结果。本公开实施例提供一种动作识别装置，包括：动作编码模块，用于对待识别的视频序列中的每帧图像的特征图进行空间编码，得到所述每帧图像的动作主体特征向量；时序关联模块，用...

【技术保护点】
1.一种动作识别方法，其特征在于，包括：/n对待识别的视频序列中的每帧图像的特征图进行空间编码，得到所述每帧图像的动作主体特征向量；/n对所述每帧图像的所述动作主体特征向量进行时序关联，得到所述每帧图像的动作主体时序特征向量；/n依据所述动作主体时序特征向量，对所述每帧图像的所述特征图进行特征增强，得到所述每帧图像的动作增强特征图；/n对所述视频序列包含的图像中的每帧图像的动作增强特征图进行动作识别，得到所述视频序列的动作识别结果。/n

【技术特征摘要】
1.一种动作识别方法，其特征在于，包括：
对待识别的视频序列中的每帧图像的特征图进行空间编码，得到所述每帧图像的动作主体特征向量；
对所述每帧图像的所述动作主体特征向量进行时序关联，得到所述每帧图像的动作主体时序特征向量；
依据所述动作主体时序特征向量，对所述每帧图像的所述特征图进行特征增强，得到所述每帧图像的动作增强特征图；
对所述视频序列包含的图像中的每帧图像的动作增强特征图进行动作识别，得到所述视频序列的动作识别结果。

2.根据权利要求1所述的方法，其特征在于，所述对待识别的视频序列中的每帧图像的特征图进行空间编码，得到所述每帧图像的动作主体特征向量，包括：
在所述待识别的视频序列中的所述每帧图像的特征图上定位动作区域，得到所述每帧图像的动作区域位置图谱；
依据所述动作区域位置图谱，对所述每帧图像的所述特征图进行动作区域的融合，得到所述每帧图像的动作主体特征向量。

3.根据权利要求2所述的方法，其特征在于，所述在所述待识别的视频序列中的所述每帧图像的特征图上定位动作区域，得到所述每帧图像的动作区域位置图谱，包括：
对所述待识别的视频序列中的每帧图像的特征图进行通道编码，得到所述每帧图像的通道压缩后的压缩特征图；
对所述每帧图像的压缩特征图与相邻帧图像的压缩特征图差值，进行特征编码，得到所述每帧图像的所述动作区域位置图谱。

4.根据权利要求3所述的方法，其特征在于，所述对所述每帧图像的压缩特征图与相邻帧图像的压缩特征图差值，进行特征编码，得到所述每帧图像的所述动作区域位置图谱，包括：
对所述每帧图像的相邻帧图像对应的压缩特征图，与所述每帧图像对应的压缩特征图的差值，进行卷积处理，得到运动信息特征图；
对所述每帧图像对应的压缩特征图进行卷积处理，得到外观信息特征图；
将所述运动信息特征图和所述外观信息特征图进行融合，得到所述动作区域位置图谱。

5.根据权利要求4所述的方法，其特征在于，在所述对所述每帧图像对应的压缩特征图进行卷积处理，得到外观信息特征图之后，所述方法还包括：
将所述运动信息特征图和所述外观信息特征图进行融合，得到空间特征图；
对所述空间特征图进行通道编码，得到所述动作区域位置图谱。

6.根据权利要求2所述的方法，其特征在于，所述依据所述动作区域位置图谱，对所述每帧图像的所述特征图进行动作区域的融合，得到所述每帧图像的动作主体特征向量，包括：
对所述动作区域位置图谱进行归一化处理；
将归一化处理后的动作区域位置图谱与所述特征图融合，得到所述每帧图像的所述动作主体特征向量。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述对所述每帧图像的所述动作主体特征向量进行时序关联，得到所述每帧图像的动作主体时序特征向量，包括：
获取所述每帧图像的动作主体特征向量与相邻帧图像的动作主体特征向量之间的相关度，其中，所述相邻帧图像包括：所述视频序列中的所有帧图像或所述视频序列中与所述每帧图像相邻的预设数量帧的图像；
基于所述相关度对所述相邻帧图像的动作主体特征向量进行加权；
对加权后的所述相邻帧图像的主动作主体特征向量进行通道变换，得到所述每帧图像的所述动作主体时序特征向量。
...

【专利技术属性】
技术研发人员：王岱崟，杨昆霖，侯军，伊帅，
申请(专利权)人：浙江商汤科技开发有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人