人体动作识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：41144240 阅读：11 留言：0更新日期：2024-04-30 18:13

本申请涉及一种人体动作识别方法、装置、计算机设备和存储介质，所述方法通过提取视频序列帧进行数据处理及分类。首先基于空间卷积注意力网络获取不同方向的局部空间特征，采用自注意力机制实现空间特征的增强；然后采用ConvGRU来提取视频的时间信息和空间信息，利用ConvGRU的卷积操作同时获取时间和空间信息；最后，使用多尺度网络和全局上下文建模模块对空间和时间信息和空间信息进行全局上下文建模，给不同特征以不同的权重，提高动作识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及动作识别，特别是涉及一种人体动作识别方法、装置、计算机设备和存储介质。

技术介绍

1、随着互联网技术的发展，视频逐渐成为人机交互、视频监控、视频检索等领域信息的重要载体，具有身份重要的应用价值，基于视频的人体动作识别已经成为了计算机视觉领域一个重要的研究方向。然而由于视频动作的一般具有视角多变和动作差异性大等特点，使其成为一个具有挑战性的问题。

2、目前，视频动作识别方法主要可以分为两类：基于传统的手工特征提取方法和基于深度学习的方法。传统的手工特征提取方法是通过人工设计算法捕获视频中的关键特征，但是这种方法复杂度较高，计算效率低下。相比之下，深度学习方法无论是在捕捉视频的外观特征方面，还是视频的动态信息方面都更加有效。

3、与静态图像不同，人体动作视频中的复杂动作通常是与时间相关的，它不仅包含每一帧内的空间信息，还包含一段时间内的时序信息，因此相对于图像分类来说多了一个需要处理的时序维度。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种人体动...

【技术保护点】

1.一种人体动作识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述空间卷积注意力网络包括空间卷积自注意力模块和时序卷积模块；

3.根据权利要求1所述的方法，其特征在于，对所述时间信息和空间信息进行多尺度特征提取，采用全局上下文建模模块对提取的特征进行建模，得到人体动作识别结果，包括：

4.一种人体动作识别装置，其特征在于，所述装置包括：

5.根据权利要求4所述的装置，其特征在于，所述空间卷积注意力网络包括空间卷积自注意力模块和时序卷积模块；时空特征提取模块，还用于采用所述空间卷积自注意力模块中对所述视频序列...

【技术特征摘要】

1.一种人体动作识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述空间卷积注意力网络包括空间卷积自注意力模块和时序卷积模块；

4.一种人体动作识别装置，其特征在于，所述装置包括：

5.根据权利要求4所述的装置，其特征在于，所述空间卷积注意力网络包括空间卷积自注意力模块和时序卷积模块；时空特征提取模块，还用于采用所述空间卷积自注意力模块中对所述视频序列帧中的每一帧单独进行空间卷积注意力增强，得到空间注意力特征；其中不同帧的空间卷积自注意力模块采用参数...

【专利技术属性】
技术研发人员：秦龙，尹路珈，艾川，曾俊杰，黄鹤松，尹全军，彭勇，李蔚清，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人