The invention discloses a video identification method and device. Among them, the method includes: extracting the measured image in the video; image input to set the depth of convolution neural network model trained by the sample, the output values, which specifies the sample set for pretreatment of multiple types of image samples after sample set; determine the output with the first preset threshold the size of the output value; greater than a first predetermined threshold, determining the input video into a plurality of types in the specified type of video.
【技术实现步骤摘要】
视频识别方法及装置
本专利技术涉及信息安全领域,具体而言,涉及一种视频识别方法及装置。
技术介绍
随着互联网技术的迅速发展,信息内容呈现了爆炸式的增长。在这些海量的数据中,很可能混杂着非法视频,比如非法暴恐视频,以下以非法暴恐视频为例进行说明,为了避免公众不受此类非法暴恐视频的鼓惑与毒害,必须要识别出那些视频,然后予以删除。相关技术中的暴恐视频识别的方法主要包括以下几种方式:第一种方式是肉眼检查;第二种方式是将视频截帧为图片,然后通过图像搜索的方式在暴恐图片样本库中找相似;第三种方式是收集暴恐视频建立样本库,计算样本库中各视频的视频指纹,与待检查视频的指纹比对。但是,对第一种方式而言,即肉眼检查的方式,其并不可靠且低效:人很难记住繁多的暴恐组织标志与人物,而且人的检查质量容易波动,疲劳后尤其容易漏过。一个训练有素的审核员每天大约检查1000段视频,效率较低。对第二种方式而言,即将视频截帧为图片,然后通过图像搜索的方式在暴恐图片样本库中找相似,其效果强烈依赖于样本库,如果样本库更新不及时或者未能收集到类似图片,则无法正确检出暴恐图片。对第三种方式而言,即视频指纹找相 ...
【技术保护点】
一种视频识别方法,其特征在于,包括:提取待测视频中的图像;将所述图像输入至经指定样本集训练后的深度卷积神经网络模型,得到输出值,其中,所述指定样本集为对多个类型的图片样本进行预处理后得到的样本集;判断所述输出值与第一预设阈值的大小;在所述输出值大于所述第一预设阈值的情况下,确定所述待测视频为所述多个类型中的指定类型的视频。
【技术特征摘要】
1.一种视频识别方法,其特征在于,包括:提取待测视频中的图像;将所述图像输入至经指定样本集训练后的深度卷积神经网络模型,得到输出值,其中,所述指定样本集为对多个类型的图片样本进行预处理后得到的样本集;判断所述输出值与第一预设阈值的大小;在所述输出值大于所述第一预设阈值的情况下,确定所述待测视频为所述多个类型中的指定类型的视频。2.根据权利要求1所述的方法,其特征在于,对多个类型的图片样本进行预处理包括:将多个类型的图片样本进行过滤;将过滤后剩余的所有图片样本归一化到同一分辨率;计算所述归一化后的所有图片样本中每一个图像样本的像素的均值;将归一化后的所述所有图片样本中的每一个图片样本的像素值与所述均值作差值运算,得到所述指定样本集中的样本。3.根据权利要求2所述的方法,其特征在于,将多个所述类型的图片样本进行过滤包括:丢弃所述多个类型的图片样本中满足以下条件的所述图片样本:所述图片样本的长度与宽度之比或宽度与长度之比大于第二预定阈值。4.根据权利要求1至3中任一项所述的方法,其特征在于,对多个类型的图片样本进行预处理还包括以下至少之一:对所述指定类型的图片样本中的每一个所述图片样本进行旋转处理,得到经旋转处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行平移处理,得到经平移处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行镜像处理,得到经镜像处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行模糊处理,得到经模糊处理后的图片样本;其中,所述指定样本集包括所述多个类型的图片样本,以及以下至少之一:所述经旋转处理后得到的图片样本,所述经平移处理后的图片样本,所述经镜像处理后的图片样本和所述经模糊处理后的图片样本。5.根据权利要求1所述的方法,其特征在于,所述深度卷积神经网络模型包括:8个卷积层和3个全连接层;其中,所述8个卷积层之后为所述3个全连接层,所述8个卷积层中的第一个卷积层用于接收输入所述深度卷积神经网络模型的图像,所述3个全连接层中的最后一个全连接层用于输出所述输出值。6.根据权利要求5所述的方法,其特征在于,所述8个卷积层中的每个卷积层包括以下至少之一操作:卷积操作、最大池化操作、平均池化操作。7.根据权利要求5所述的方法,其特征在于,所述8个卷积层中的第一个卷积层、第二个卷积层、第四个卷积层和第七个卷积层包括最大池化操作;所述8个卷积层中的第八个卷积层包括平均池化操作;所述8个卷积层中的第三个卷积层、第五个卷积层和第六个卷积层不包括最大池化操作。8.根据权利要求7所述的方法,其特征在于,所述第一个卷积层的卷积步长为2,所述第一个卷积层至所述第八个卷积层的卷积步长为1,所述第一个卷积层、所述第二个卷积层、所述第四个卷积层和所述第七个卷积层的池化补偿为2,所述第八个卷积层的池化步长为7。9.一种视频识别...
【专利技术属性】
技术研发人员:张荣,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。