一种基于多时长信息的动作视频识别方法技术

技术编号：21433102 阅读：30 留言：0更新日期：2019-06-22 12:11

一种基于多时长信息的动作视频识别方法，包括以下步骤：1)将动作视频转换成序列帧图像，以等间隔方式进行采样；2)构建多时长信息特征融合层；3)扩展二维卷积神经网络DenseNet121至三维卷积神经网络DenseNet121‑3D，同时将多时长信息特征融合层嵌入到该网络当中；4)将步骤1采样得到的序列图像作为输入数据，对网络进行训练，而后就可以将待识别的动作视频输入到网络当中进行识别分类。本发明专利技术通过采用多时长三维卷积神经网络对不同时长特性的动作进行特征学习，使得网络具有更好的鲁棒性，得到较好的分类结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多时长信息的动作视频识别方法
本专利技术涉及深度学习、计算机视觉领域，特别是涉及一种基于多时长信息的动作视频识别方法。
技术介绍
在计算机视觉领域中，对于人体动作的识别一直是一个十分活跃的课题，其在运动视频分析、视频检索、智能摄像监控等实际生活场景有着广泛的应用前景。然而，人体动作具有高度复杂性，且视频数据具有不同的尺度大小以及光照强弱等特点，采用传统特征工程建模的方法识别效果不佳，也不具有普遍应用性。近年来，随着视频数据的爆发式增长，以深度学习为代表的机器学习方法逐渐被应用到该领域当中，得益于大规模数据以及高效的计算能力，研究人员提出多种深度神经网络模型对动作视频进行识别，取得了较好的效果。DuTran提出了15层的三维卷积神经网络，将视频提取帧图像后，以堆叠图像的方式输入到网络中进行训练，经过8层卷积层和5层池化层的特征提取后输入到两个全连接层得到识别分类结果(Tran,Du,etal.Learningspatiotemporalfeatureswith3dconvolutionalnetworks[C]//InternationalConferenceonComputerVision.IEEE,2015:4489-4497，即基于三维卷积神经网络的时空特征学习)；KarenSimonyan提出一个双通道三维卷积神经网络，该网络接受两种类型的输入数据，分别是从视频中提取的RGB图像以及从视频中获取的多帧光流图像，对应的经过图像空间域卷积和光流图像时域卷积得到特征，将特征融合后输入到全连接层进行分类(Simonyan,Karen,etal.Two...

【技术保护点】
1.一种基于多时长信息的动作视频识别方法，其特征在于，所述方法包括以下步骤：S1：将动作视频转换成序列帧图像，以等间隔方式进行采样；S2：构建多时长信息特征融合层；S3：扩展二维卷积神经网络DenseNet121至三维卷积神经网络DenseNet121‑3D，同时将多时长信息特征融合层嵌入到该网络当中；S4：将步骤1采样得到的序列图像作为输入数据，对网络进行训练，而后就可以将待识别的动作视频输入到网络当中进行识别分类。

【技术特征摘要】
1.一种基于多时长信息的动作视频识别方法，其特征在于，所述方法包括以下步骤：S1：将动作视频转换成序列帧图像，以等间隔方式进行采样；S2：构建多时长信息特征融合层；S3：扩展二维卷积神经网络DenseNet121至三维卷积神经网络DenseNet121-3D，同时将多时长信息特征融合层嵌入到该网络当中；S4：将步骤1采样得到的序列图像作为输入数据，对网络进行训练，而后就可以将待识别的动作视频输入到网络当中进行识别分类。2.如权利要求1所述的一种基于多时长信息的动作视频识别方法，其特征在于：所述步骤S1中，由于动作视频数据时间长度不同，则原视频所包含的帧图像数量不一致，每一段视频时间长度为Ti，i∈{1，2，...，N}，其中N为训练集中视频数量，计算所有训练集动作视频的平均时间长度：对于原时间长度大于等于平均值的视频，即以剪切的方式取至时间后续部分舍弃；对于原时间长度小于平均值的视频，即以重复的方式在视频末尾补充原视频开始部分，补充时长为将处理后的视频转化成帧图像，每段视频共有张序列图像，其中f为视频的FPS值，以等间隔的方式选取M张图像作为神经网络的输入数据。3.如权利要求1或2所述的一种基于多时长信息的动作视频识别方法，其特征在于：所述步骤S2中，多时长信息特征融合层由3个并行的卷积操作，1个级联操作，1个平均池化操作所组成，其中，3个卷积操作具有不同的卷积核大小，每个卷积操作互相独立，它们的时间维度均不同，即时间维度d∈{T1，T2，...，TD}，以此来捕捉不同时长的动态特征，假定多时长信息特征融合层的输入为xl，将会被该层的不同卷积核进行卷积计算，输出多个中间特征图{S1，S2，...，SK}，其中且均不相同，这些中间特征图被级联成一个特征张量[S1，S2，...，SK]后输入到...

【专利技术属性】
技术研发人员：宣琦，李甫宪，翔云，徐东伟，刘毅，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人