动作识别方法、装置、电子设备制造方法及图纸

技术编号：39319668 阅读：10 留言：0更新日期：2023-11-12 16:01

本申请公开了一种动作识别方法，属于计算机视觉技术领域，有助于提升动作识别效率。所述方法包括：对视频图像序列进行稀疏采样以及特征提取，获取视频图像序列中动作的第一特征向量，其中，第一特征向量携带视频图像序列中动作的分类信息；获取表征该视频图像序列中动作相关性的第二特征向量；获取该视频图像序列经稀疏采样后得到的图像帧序列的第三特征向量，其中，第三特征向量用于表征该视频图像序列匹配的动作描述文本；融合上述三个步骤提取的特征向量进行动作识别。本方法通过对视频图像序列进行下采样，之后基于从多个方面提取的特征进行融合识别，减少了对视频进行动作识别时处理的视频图像帧的数量，提升了动作识别效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
动作识别方法、装置、电子设备

[0001]本申请涉及计算机视觉
，特别是涉及动作识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]由于视频在安全监视、人类行为分析和许多其他领域的广泛应用，理解视频中的对象行为(如人类行为)已成为计算机视觉的突出研究课题。现有技术中多数的动作识别算法通常首先提取描述视频的局部高维视觉特征，然后，将提取密集的特征融合到一个固定大小的视频级描述符中，最后，使用SVM在视觉词袋上进行训练，用来预测最终的结果。现有技术中，提取的描述视频的局部高维视觉特征通常采用密集采样的方式进行特征提取，会导致识别效率低下。
[0003]可见，现有技术中的动作识别方法还需要改进。

技术实现思路

[0004]本申请实施例提供一种动作识别方法，有助于提升动作识别效率。
[0005]第一方面，本申请实施例提供了一种动作识别方法，包括：
[0006]通过对视频图像序列进行稀疏采样以及特征提取，获取所述视频图像序列中动作的第一特征向量，其中，所述第一特征向量携带所述视频图像序列中动作的分类信息；
[0007]获取表征所述视频图像序列中动作相关性的第二特征向量；
[0008]获取所述视频图像序列经稀疏采样后得到的图像帧序列的第三特征向量，其中，所述第三特征向量用于表征所述视频图像序列匹配的动作描述文本；
[0009]融合所述第一特征向量，所述第二特征向量，以及，所述第三特征向量，对所述视频图像序列中的动作进行动作识别。
[0...

【技术保护点】

【技术特征摘要】
1.一种动作识别方法，其特征在于，包括：通过对视频图像序列进行稀疏采样以及特征提取，获取所述视频图像序列中动作的第一特征向量，其中，所述第一特征向量携带所述视频图像序列中动作的分类信息；获取表征所述视频图像序列中动作相关性的第二特征向量；获取所述视频图像序列经稀疏采样后得到的图像帧序列的第三特征向量，其中，所述第三特征向量用于表征所述视频图像序列匹配的动作描述文本；融合所述第一特征向量，所述第二特征向量，以及，所述第三特征向量，对所述视频图像序列中的动作进行动作识别。2.根据权利要求1所述的方法，其特征在于，所述通过对视频图像序列进行稀疏采样以及特征提取，获取所述视频图像序列中动作的第一特征向量的步骤，包括：对视频图像序列进行间隔等长时间段的分段处理，确定所述视频图像序列的若干视频片段；对每个所述视频片段进行随机下采样，获取每个所述视频片段的采样片段；对每个所述采样片段分别进行分类映射，获取每个所述采样片段分别对应的动作分类结果；获取各所述采样片段分别对应的所述动作分类结果的共识；根据所述共识，预测所述视频图像序列中的动作类别，得到第一特征向量。3.根据权利要求1所述的方法，其特征在于，所述获取表征所述视频图像序列中动作相关性的第二特征向量的步骤，包括：获取描述所述视频图像序列中动作的至少一组动作提议；以所述动作提议实例化图的节点，并根据所述动作提议之间的相关性构造连接所述节点的边，获得描述所述视频图像序列的动作提议图；通过预先训练的图卷积网络对所述动作提议图进行特征提取和映射，获取携带所述视频图像序列中的提议框信息的第二特征向量。4.根据权利要求3所述的方法，其特征在于，所述根据所述动作提议之间的相关性构造连接所述节点的边，包括：根据所述动作提议之间的时间相关性，构造连接相应节点的边；以及，根据所述动作提议之间的距离相关性，构造连接相应节点的边。5.根据权利要求1所述的方法，其特征在于，所述获取所述视频图像序列经稀疏采样后得到的图像帧序列的第三特征向量的步骤，包括：获取所述视频图像序列经稀疏采样后得到的图像帧序列；通过预先训练的视觉
‑
语言模型的Transformer编码模块将所述图像帧序列中各图像帧的时间信息叠加至相应图像帧的视觉信息上，得到所述图像帧序列的第三特征向量。6.根据权利要求5所述的方法，其特征在于，所述视觉
‑
语言模型是基于若干图像文本对训练得到的，其中，所述图像文本对...

【专利技术属性】
技术研发人员：庞宏伟，
申请(专利权)人：汉王科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人