一种基于卷积神经网络的特定视频检测方法技术

技术编号：15090392 阅读：471 留言：0更新日期：2017-04-07 19:04

本发明专利技术提供了一种基于卷积神经网络的特定视频检测方法，包括以下步骤：利用现有标注的正负样本数据，对预先使用大规模数据集训练得到的卷积神经网络进行精细调整，得到适用于特定视频检测的卷积神经网络模型；利用该网络模型直接对视频关键帧进行特征提取并进行预测，根据预测结果判断是否为特定视频。本发明专利技术充分利用了卷积神经网络能够在大规模视频数据中自动学习视频特征的优势，考虑了特征学习与分类学习两个任务的相互作用关系，大大提高了特定视频检测的准确率。

A specific video detection method based on convolution neural network

The present invention provides a specific video convolution detection based on neural network, which comprises the following steps: using the existing sample data annotation of positive and negative, in advance to make fine adjustments in the convolutional neural network trained using large-scale data, get the convolutional neural network model is applied to specific video detection; direct feature extraction of video key frames and predicted by the network model, according to the forecast results to determine whether a particular video. The invention makes full use of the convolutional neural network can automatically learn video features in large-scale video data advantage, considering interaction between feature learning and classification learning two tasks, greatly improves the accuracy of specific video detection.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频识别与检索
，具体涉及一种基于卷积神经网络的特定视频检测方法。
技术介绍
近年来，随着互联网技术与多媒体技术的迅速发展，网络上出现了海量的视频内容，而各种敏感内容的出现已经严重危害国家安全和人民群众的正常生活，因此如何利用计算机来进行有效地监管，迅速准确地检测特定视频，成为了一个急待解决的关键问题。传统的特定视频检测的方法一般是基于各种视觉特征，如词袋(BagofWords，BoW)特征。然而人工设计的这种特征没有充分利用大数据的优势，对于视频信息的表示具有一定的局限性。而深度神经网络，尤其是卷积神经网络(ConvolutionalNeuralNetwork，CNN)作为一种有效的分类模型已经在计算机视觉的多个领域取得了很大成功。因此，基于卷积神经网络的特定视频检测方法受到了了研究者的广泛关注，其充分利用大数据的优势，在海量视频数据中自动学习视频的视觉语义特征，极大地提高了特定视频检测的准确率。典型的特定视频检测方法主要包括三个阶段：第一阶段，对于视频关键帧提取特征，特征提取的方式有两种：一种是密集型的特征提取，一种是针对兴趣点进行特征提取。第二阶段，将这些提取的特征聚合在一起，形成一个固定大小的特征向量用于表示视频的每一帧。一种普遍使用的方法是利用学习得到的词典对特征进行量化，并得到表示视频关键帧的直方图向量，即BoW特征。第三阶段，基于BoW特征训练得到一个能够进行特定视频检测的分类器...

【技术保护点】
一种基于卷积神经网络的特定视频检测方法，包括以下步骤：(1)利用标注的正样本和负样本对预先使用大规模数据集训练得到的卷积神经网络模型进行精细调整，从而得到适用于特定视频检测的卷积神经网络模型；(2)利用步骤(1)中训练得到的卷积神经网络模型对待识别的视频关键帧直接计算出特征并进行预测，进而根据预测得分判断是否为特定视频。

【技术特征摘要】
1.一种基于卷积神经网络的特定视频检测方法，包括以下步骤：
(1)利用标注的正样本和负样本对预先使用大规模数据集训练得到的卷积神经网络模型
进行精细调整，从而得到适用于特定视频检测的卷积神经网络模型；
(2)利用步骤(1)中训练得到的卷积神经网络模型对待识别的视频关键帧直接计算出特
征并进行预测，进而根据预测得分判断是否为特定视频。
2.如权利要求1所述的方法，其特征在于，所述步骤(1)中卷积神经网络模型的训练过程
包括两步，第一步是预训练卷积神经网络模型，第二步是精细调整卷积神经网络模型。
3.如权利要求2所述的方法，其特征在于，所述预训练卷积神经网络模型，利用大规模数据
集训练得到卷积神经网络模型，在训练过程中仅使用图像级别的标注信息，该过程本质上
是卷积神经网络模型参数不断调整向训练数据拟合的过程。
4.如权利要求3所述的方法，其特征在于，所述预训练卷积神经网络模型，在训练过程中利
用前向传播算法和反向传播算法对模型中的参数进行学习优化。
5.如权利要求2所述的方法，其特征在于，所述精细调整卷积神经网络模型的方法是：首先，
选取用于训练的正样本，正样本选用标注好的特定视频的关键帧，负样本的来源是互联网
上非特定视频的关键帧；然后采用反向传播算法在选...

【专利技术属性】
技术研发人员：彭宇新，何相腾，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人