时空动作检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38195024 阅读：20 留言：0更新日期：2023-07-20 21:15

本申请实施例涉及计算机视觉与深度学习领域，公开了一种时空动作检测方法、装置、电子设备及存储介质，方法包括：对连续视频帧中的各人物进行定位，得到每一视频帧中的各人物的位置信息，并对每一视频帧中的各人物的位置信息进行缓存；根据缓存的预设长度序列的视频帧中的人物位置信息，识别每一视频帧的人物动作，得到连续视频帧中每一视频帧的各人物的人物动作，实现了对长视频中的不同人物、不同动作进行准确定位与识别。作进行准确定位与识别。作进行准确定位与识别。

全部详细技术资料下载

【技术实现步骤摘要】
时空动作检测方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机视觉与深度学习领域，尤其涉及一种时空动作检测方法、装置、电子设备及存储介质。

技术介绍

[0002]时空动作检测，是指对给定的未修剪视频，对其中的不同人物进行位置定位，并对定位到的人物进行动作分析，输出不同人物的动作类型。与动作识别相比，时空动作检测需要对每个人物进行动作建模，而动作识别是对整个视频进行动作建模，通常情况下，在分析视频中存在多个人物，不同人物的动作行为也不一致，对整个视频进行动作建模显然不合适。
[0003]时空动作检测包含空间域人物定位及时序动作分析两个子任务。现有的时空动作检测方法可以分为两阶段和单阶段的。然而，无论是两阶段还是单阶段，当前动作识别绝大部分是以时序片段作为整体进行动作建模，对该片段输出一个动作类别，存在采样策略选取不合适、采样长度选取过长、无法准确定位动作帧以及时序特征表述差，从而导致不能对长视频中的不同人物，不同动作进行准确定位与识别的问题。

技术实现思路

[0004]本专利技术的目的在于解决上述问题，提供一种时空动作检测方法、装置、电子设备及存储介质，解决了采样策略选取不合适、采样长度选取过长、无法准确定位动作帧以及时序特征表述差的问题，实现了对长视频中的不同人物，不同动作进行准确定位与识别的目的。
[0005]为解决上述问题，本申请的实施例提供了一种时空动作检测方法，方法包括：对连续视频帧中的各人物进行定位，得到每一视频帧中的各人物的位置信息，并对每一视频帧中的各人物的...

【技术保护点】

【技术特征摘要】
1.一种时空动作检测方法，其特征在于，包括：对连续视频帧中的各人物进行定位，得到每一视频帧中的各人物的位置信息，并对所述每一视频帧中的各人物的位置信息进行缓存；根据缓存的预设长度序列的视频帧中的人物位置信息，识别每一视频帧的人物动作，得到所述连续视频帧中每一视频帧的各人物的人物动作。2.根据权利要求1所述的时空动作检测方法，其特征在于，所述对连续视频帧中的各人物进行定位，得到每一视频帧中的各人物的位置信息，包括：通过预先训练好的目标跟踪网络模型，对连续视频帧中的各人物进行定位；其中，所述目标跟踪网络模型用于对每一视频帧中的各人物的位置信息进行检测；所述对所述每一视频帧中的各人物的位置信息进行缓存，包括：将所述目标跟踪网络模型输出的各所述人物的位置信息存储在缓冲矩阵中，所述缓冲矩阵的每一个元素S
ij
表示j个人物在第i帧中的位置信息，所述j表示所述元素所在的行，所述i表示所述元素所在的列；所述根据缓存的预设长度序列的视频帧中的人物位置信息，识别每一视频帧的人物动作，得到所述连续视频帧中每一视频帧的各人物的人物动作，包括：将所述缓冲矩阵中存储的各所述人物的位置信息输入预先训练好的动作识别模型，根据所述动作识别模型的输出结果，得到所述连续视频帧中每一视频帧的各人物的人物动作；其中，所述动作识别模型用于根据预设长度序列的视频帧中的人物位置信息，识别每一视频帧的人物动作。3.根据权利要求2所述的时空动作检测方法，其特征在于，所述将所述缓冲矩阵中存储的各所述人物的位置信息输入预先训练好的动作识别模型，包括：对所述缓冲矩阵中每一行的长度进行检测，确定长度大于或等于所述预设长度序列的第一目标行；将所述第一目标行的前L个行数据输入所述预先训练好的动作识别模型，所述L为所述预设长度序列。4.根据权利要求3所述的时空动作检测方法，其特征在于，在所述对所述缓冲矩阵中每一行的长度进行检测后，还包括：获取所述缓冲矩阵中长度小于所述预设长度序列的第二目标行；将所述第二目标行对应的人物的上一次检测到的人物动作，作为当前视频帧的人物动作。5.根据权利要求2所述的时空动作检测方法，其特征在于，所述将所述目标跟踪网络模型输出的各所述人物的位置信息存储在缓冲矩阵中，包括：在所述目标跟踪网络模型输出的当前视频帧中的人物不存在于所述缓冲矩阵的情况下，在所述缓冲矩阵中增加与所述人物对应的行，并将所述人物在当前视频帧中的位置信息更新在所述缓冲矩阵中；在所述目标跟踪网络模型输出的当前视频帧中的人物存在于所述缓冲矩阵的情况下，将所述人物在当前视频帧中的位置信息更新在所述缓冲矩阵中；在所述缓冲矩阵中的行所对应的人物未包括在所述目标跟踪网络模型输出的在当前
视频帧中检测到的人物的情况下，删除所述未包括的人物所对应的行数据。6.根据权利要求2至4中任一项所述的时空动作检测方法，其特征在于，所述将所述缓冲矩阵中存储的各所述人物的位置信息输入预先训练好的动作识别模型，包括：将连续的L个视频帧中的目标人物的位置信息输入所述预先训练好的动作识别模型，得到所述目标人...

【专利技术属性】
技术研发人员：葛成伟，童俊文，关涛，李健，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人