一种基于时空注意力的视频分类方法技术

技术编号：16529327 阅读：25 留言：0更新日期：2017-11-09 21:11

本发明专利技术涉及一种基于时空注意力的视频分类方法，包括以下步骤：对训练视频和待预测视频提取帧和光流，将若干光流堆叠为多通道的图像；搭建时空注意力模型，包括空域注意力网络、时域注意力网络和连接网络；联合训练时空注意力模型中的三个组成部分，使空域、时域注意力的效果同时提升，得到能够准确建模空域、时域显著性并适用于视频分类的时空注意力模型；利用学习得到的时空注意力模型对待预测视频的帧和光流提取空域、时域显著性并进行预测，融合帧和光流的预测得分得到待预测视频的最终语义类别。本发明专利技术能够同时建模空域、时域注意力，并通过联合训练充分利用二者的协作性能，学习得到更准确的空域、时域显著性，从而提高了视频分类的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时空注意力的视频分类方法
本专利技术涉及视频分类
，具体涉及一种基于时空注意力的视频分类方法。
技术介绍
随着社交媒体、自媒体的广泛普及和迅速发展，互联网上的视频数量呈现急剧增长的态势。调查研究表明，2016年每分钟上传到YouTube网站的视频时长超过300小时。美国CISCO公司2016年的视频流量统计和预测报告进一步指出，2020年全球视频流量将占据互联网流量的82％，届时一个用户需要花费五百万年的时间才能看完互联网上一个月内所传输的视频。视频等媒体数据已经成为大数据的主体，如何对视频内容进行准确分析和识别，对于满足用户的信息获取需求意义重大。视频分类是对视频内容进行分析理解以识别其语义类别的技术，在互联网视频监测、人机交互等方面具有广阔的应用前景，长期以来受到学术界和工业界的广泛关注。传统视频分类方法一般采用手工特征表示视频内容，比如首先利用尺度不变特征变换(scale-invariantfeaturetransform，SIFT)描述子、光流直方图(histogramoforientedopticalflow，HOF)表示视频的静态信息和运动信息，再使用词袋(bagofwords，BoW)模型进行特征编码，最终用支持向量机(supportvectormachine，SVM)等分类器预测视频类别。为了优化特征表示，一些方法采用费雪向量(Fishervector)和局部特征聚合描述符(vectoroflocallyaggregateddescriptors，VLAD)等更高效的特征编码方式。此类方法的典型代表是Wang等人2013年发表...
一种基于时空注意力的视频分类方法

【技术保护点】
一种基于时空注意力的视频分类方法，包括以下步骤：(1)对训练视频和待预测视频提取帧和光流，将连续若干光流的水平分量和垂直分量交替堆叠为多通道的图像；(2)用深度网络构建时空注意力模型，并对其连接网络和空域注意力网络、时域注意力网络三个组成部分进行联合训练，用步骤(1)得到的训练视频的帧和光流分别学习能够用于视频分类的时空注意力模型；(3)利用步骤(2)中训练得到的时空注意力模型对待预测视频的帧和光流计算语义类别的预测得分，融合帧和光流的预测得分，得到待预测视频最终的语义类别。

【技术特征摘要】
1.一种基于时空注意力的视频分类方法，包括以下步骤：(1)对训练视频和待预测视频提取帧和光流，将连续若干光流的水平分量和垂直分量交替堆叠为多通道的图像；(2)用深度网络构建时空注意力模型，并对其连接网络和空域注意力网络、时域注意力网络三个组成部分进行联合训练，用步骤(1)得到的训练视频的帧和光流分别学习能够用于视频分类的时空注意力模型；(3)利用步骤(2)中训练得到的时空注意力模型对待预测视频的帧和光流计算语义类别的预测得分，融合帧和光流的预测得分，得到待预测视频最终的语义类别。2.如权利要求1所述的方法，其特征在于，步骤(1)将连续L个光流的水平和垂直分量交替堆叠，得到具有2L个通道的图像。3.如权利要求1所述的方法，其特征在于，所述连接网络由卷积神经网络构成，包含若干卷积层、池化层和全连接层；所述连接网络的最后一个池化层为加权池化层，用于将连接网络和空域注意力网络连接起来。4.如权利要求3所述的方法，其特征在于，所述空域注意力网络由卷积神经网络构成，包含若干卷积层，池化层和一个用于分类的全连接层；所述空域注意力网络的卷积层部分和所述连接网络共享卷积权值，最后一个池化层为全局平均池化层；所述空域注意力网络学习视频中的空域显著性，并通过加权池化层将空域显著性传递给连接网络，以指导连接网络的学习。5.如权利要求4所述的方法，其特征在于，所述空域显著性以及归一化的空域显著性由下列公式计算得到：其中mc(...

【专利技术属性】
技术研发人员：彭宇新，张俊超，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人