基于非局部神经网络的视频分类方法、装置及设备制造方法及图纸

技术编号：20177770 阅读：26 留言：0更新日期：2019-01-23 00:40

本发明专利技术提出了一种基于非局部神经网络的视频分类方法、装置及设备，其中，方法包括：获取待分类视频，并从待分类视频中提取N帧图像帧，其中，N为正整数；分别提取N帧图像帧中的图像特征，并将N帧图像帧中的图像特征输入到非局部神经网络中进行处理，以生成N帧图像帧的关联性特征和N帧图像的图像识别结果；根据N帧图像帧的关联性特征和图像识别结果确定待分类视频的类别。由此，通过非局部神经网络获取N帧图像帧的关联性特征和图像识别结果，进而根据关联性特征和图像识别结果确定视频的类别，能够有效的捕捉视频中多帧之间的关系，提高了视频分类的准确性，并且降低参数规模的冗余，提高了处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于非局部神经网络的视频分类方法、装置及设备
本专利技术涉及视频处理
，尤其涉及一种基于非局部神经网络的视频分类方法、装置及设备。
技术介绍
随着深度学习的发展，越来越多的深度学习方法被应用到视频分类中，并且取得了很大的进展。由于一个视频会包含多帧，帧与帧之间有着很强的关系，如何捕捉多帧之间的关系是视频分类里一个研究热点。相关技术中，通常采用递归型卷积神经网络捕捉多帧之间的关系，进而实现视频分类。然而，由于递归型卷积神经网络结构包含大量的参数，导致参数规模冗余，在进行视频分类时效率非常低下。并且，传统的神经网络捕捉多帧之间关系的准确性还有进一步提升的空间。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的第一个目的在于提出一种基于非局部神经网络的视频分类方法，通过非局部神经网络获取N帧图像帧的关联性特征和图像识别结果，进而根据关联性特征和图像识别结果确定视频的类别，能够有效的捕捉视频中多帧之间的关系，提高了视频分类的准确性，并且降低了参数规模的冗余，提高了处理效率。本专利技术的第二个目的在于提出一种基于非局部神经网络的视频分类装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的，本专利技术第一方面实施例提出了一种基于非局部神经网络的视频分类方法，包括：获取待分类视频，并从所述待分类视频中提取N帧图像帧，其中，N为正整数；分别提取所述N帧图像帧中的图像特征，并将所述N帧图像帧中的图像特征输入到非局部神经网络中进行处理，以生成所述N帧图像帧的...

【技术保护点】
1.一种基于非局部神经网络的视频分类方法，其特征在于，包括：获取待分类视频，并从所述待分类视频中提取N帧图像帧，其中，N为正整数；分别提取所述N帧图像帧中的图像特征，并将所述N帧图像帧中的图像特征输入到非局部神经网络中进行处理，以生成所述N帧图像帧的关联性特征和所述N帧图像的图像识别结果；以及根据所述N帧图像帧的关联性特征和所述图像识别结果确定所述待分类视频的类别。

【技术特征摘要】
1.一种基于非局部神经网络的视频分类方法，其特征在于，包括：获取待分类视频，并从所述待分类视频中提取N帧图像帧，其中，N为正整数；分别提取所述N帧图像帧中的图像特征，并将所述N帧图像帧中的图像特征输入到非局部神经网络中进行处理，以生成所述N帧图像帧的关联性特征和所述N帧图像的图像识别结果；以及根据所述N帧图像帧的关联性特征和所述图像识别结果确定所述待分类视频的类别。2.如权利要求1所述的基于非局部神经网络的视频分类方法，其特征在于，所述提取所述N帧图像帧的图像特征，包括：提取所述N帧图像帧的图像特征，以生成图像特征矩阵；将所述图像特征矩阵向量化，其中，向量化后的图像特征矩阵作为所述非局部神经网络的输入。3.如权利要求2所述的基于非局部神经网络的视频分类方法，其特征在于，所述将所述N帧图像帧中的图像特征输入到非局部神经网络中进行处理以生成所述N帧图像帧的关联性特征，包括：根据输入的向量化后的图像特征矩阵生成相应的特征空间；计算所述特征空间中第一特征点和第二特征点的第一相似度，其中，所述第一特征点和所述第二特征点为所述特征空间中的任意特征点；根据所述第一相似度确定所述N帧图像帧中第一像素区域和第二像素区域的第二相似度，其中，所述第一像素区域和所述第二像素区域分别与所述第一特征点和所述第二特征点对应；以及根据所述第二相似度确定所述N帧图像帧的关联性特征。4.如权利要求3所述的基于非局部神经网络的视频分类方法，其特征在于，将所述N帧图像帧中的图像特征输入到非局部神经网络中进行处理，以生成所述N帧图像的图像识别结果，包括：通过所述非局部神经网络的卷积层对所述特征空间进行变换，以获取第一特征空间、第二特征空间以及第三特征空间；根据所述第一特征空间、所述第二特征空间和所述第三特征空间分别生成第一向量、第二向量和第三向量；对所述第一向量、所述第二向量和所述第三向量中的任意两个进行Hadamard矩阵操作，生成第四向量；根据所述第四向量生成所述图像识别结果。5.如权利要求4所述的基于非局部神经网络的视频分类方法，其特征在于，所述根据所述第四向量生成所述图像识别结果，包括：通过傅里叶变换对所述第四向量和第五向量进行卷积运算，生成第六向量，其中，所述第五向量为所述第一向量、所述第二向量和所述第三向量中的另一个向量；对所述第六向量进行反傅里叶变换以生成所述图像识别结果。6.如权利要求4所述的基于非局部神经网络的视频分类方法，其特征在于，所述根据所述N帧图像帧的关联性特征和所述图像识别结果确定所述待分类视频的类别，包括：根据所述关联性特征从所述N帧图像帧中选取M帧图像帧，其中，M为小于或等于N的正整数；根据所述图像识别结果获取所述M帧图像帧的内容；根据所述M帧图像帧的内容确定所述待分类视频的类别。7.一种基于非局部神经网络的视频分类装置，其特征在于，包括：获取模块，用于获取待分类...

【专利技术属性】
技术研发人员：岳凯宇，孙明，周峰，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人