基于显著片段采样的长视频动作识别方法技术

技术编号：27264157 阅读：54 留言：0更新日期：2021-02-06 11:27

基于显著片段采样的长视频动作识别方法，涉及计算机视觉技术。1)准备长视频动作识别数据集；2)设计用于显著片段采样的采样器和用于动作识别的分类器，通过采样器对视频运动特征显著的部分进行采样，分类器仅考虑采样器采样的片段，通过提取视频显著片段的时空特征进行动作分类；3)在大规模图像数据集上，对采样器的主干网络ShuffleNet V2和分类器网络膨胀3D卷积网络进行预训练，得到预训练模型；4)将预训练模型在长视频动作识别数据集上利用反向传播算法对整个模型进行端到端训练，并保存训练好的模型；5)利用训练好的模型进行视频显著部分的采样和动作分类。能有效去除冗余信息，减少模型计算量。减少模型计算量。减少模型计算量。

全部详细技术资料下载

【技术实现步骤摘要】
基于显著片段采样的长视频动作识别方法

[0001]本专利技术涉及计算机视觉技术，具体是涉及一种基于显著片段采样的长视频动作识别方法。

技术介绍

[0002]视频的理解与识别是计算机视觉的基础任务之一。近年来，随着计算机算力的爆发和计算机视觉技术的不断发展，视频识别技术迅速兴起并得到了广泛关注。而识别视频中的动作则是其中一个充满挑战而又具有较高实际应用价值的任务。动作识别任务的主要目标是判断一段视频中人的行为的类别。早期的动作识别主要基于兴趣点的检测和表示，例如梯度直方图，时空兴趣点检测以及光流直方图等。近年来，深度神经网络在图像分类和目标检测等计算机视觉任务上取得了几乎超越人类的效果。因此，一些基于深度学习的方法被应用于视频动作识别任务中。Simonyan等人(Simonyan K,Zisserman A.Two-stream convolutional networks for action recognition in videos[C]//Advances in neural information processing systems.2014:568-576.)提出了基于双流的动作识别方法。该方法首次将视频分成空间和时间两个部分，分别使用RGB图像和光流图像送入两支神经网络并融合最终分类结果。Tran等人(Tran D,Bourdev L,Fergus R,et al.Learning spatiotemporal features with 3d convolutional networks[C]//Pr

【技术保护点】

【技术特征摘要】
1.基于显著片段采样的长视频动作识别方法，其特征在于包括以下步骤：1)准备长视频动作识别数据集；2)设计用于显著片段采样的采样器和用于动作识别的分类器，通过采样器对视频运动特征显著的部分进行采样，分类器仅考虑采样器采样的片段，通过提取视频显著片段的时空特征进行动作分类；3)在大规模图像数据集上，对采样器的主干网络ShuffleNet V2和分类器网络膨胀3D卷积网络进行预训练，得到预训练模型；4)将预训练模型在长视频动作识别数据集上利用反向传播算法对整个模型进行端到端训练，并保存训练好的模型；5)利用训练好的模型进行视频显著部分的采样和动作分类。2.如权利要求1所述基于显著片段采样的长视频动作识别方法，其特征在于在步骤1)中，所述准备长视频动作识别数据集，假设训练集动作视频为{(x
i
,y
i
),i＝1,
…
,n}，其中，n为训练集的样本数；x
i
为第i个训练样本对应的视频，y
i
表示第i个训练样本对应的标签。3.如权利要求1所述基于显...

【专利技术属性】
技术研发人员：王其聪，黄靖，
申请(专利权)人：厦门大学深圳研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人