一种视频有害内容识别方法技术

技术编号:15437399 阅读:73 留言:0更新日期:2017-05-26 03:29
本发明专利技术公开了一种视频有害内容识别方法,该方法的步骤如下:S1、对视频信息进行视频近似拷贝检测;S2、通过有害视频文本识别技术对有害视频文本进行识别;S3、如果待测视频或图像经过以上两步均未发现有害信息时,则对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。通过深度学习、SIFT特征提取算法以及OCR光学字符识别技术相结合的方式,可以快速地识别出视频及图像中的待检测内容,达到了视频或图像信息多维度有害内容识别的目的。

A method of video harmful content recognition

The invention discloses a video content recognition method is harmful, the method comprises the following steps: S1, the video information of video copy detection, through the S2 approximation; harmful video text recognition technology to identify harmful video text; S3, if the measured video or image through two steps were not found harmful information. The harmful contents of video intelligent analysis, and the use of deep learning target detection algorithm recognition again. Through deep learning, SIFT feature extraction algorithm and OCR optical character recognition technology, can quickly recognize the video and image by detecting the content of the video or image information, achieve the multi dimension harmful content identification purposes.

【技术实现步骤摘要】
一种视频有害内容识别方法
本专利技术涉及网络信息识别
,尤其涉及一种视频有害内容识别方法。
技术介绍
随着深度学习算法、计算机视觉技术以及移动通信技术的不断深入发展,可以通过互联网、移动通信网、广电有线网等渠道以及电脑、手机、机顶盒等终端向用户提供多媒体信息和娱乐节目。近年来大型视频分享网站的发展,为人们共享视频提供了更宽广的平台,同时视频的数据量呈现指数增长的趋势。庞大的数据量以及视频信息本身的无序性也使得视频的辨别、检索和管理变得越来越复杂,单纯依靠人工对视频信息进行分类、筛选和审核,不仅耗时耗力,而且容易出错。现在互联网产生的大量图片数据为卷积神经网络模型提供了训练素材,同时,GPU计算能力的增强为卷积神经网络结合大数据的训练提供了基础运算能力,计算机视觉技术也在深度学习算法不断深入研究的基础上得到进一步发展,包括人脸识别、物体检测、物体跟踪等。所以,如何有效快速地识别出大规模视频内容中的有害内容,成为目前网络信息安全领域亟待解决的重要问题。在现有技术的中国专利申请号200610079023.1中公开了一种视频码流过滤方法和过滤节点,提供的过滤方法只需要部分解码视频码流中的部分数据,进一步基于场景分割技术进行识别。可以基于现有有害内容的自动识别技术,可以高效的实现自动识别过滤并和人工识别机制配合使用,还可以同时采用现有的基于URL的过滤技术。该专利技术的过滤节点主要包括:视频码流延迟模块、开关模块、I帧检测/解码模块、符合特定分类定性分级标准的内容识别模块和判决模块,该专利技术技术方案减少了需要解码的数据数量,降低了处理复杂度。但是,该专利技术在检测过滤视频中的有害内容或者有害信息时,识别技术太过单一并不能准确有效的识别出视频中的有害内容。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种视频有害内容识别方法,通过SIFT(尺度不变特征变换)特征算法、OCR光学字符识别技术和深度学习相结合的方式达到视频及图像信息多维度有害内容识别的目的。本专利技术的目的是通过以下技术方案来实现的:一种视频有害内容识别方法,该方法的步骤如下:S1、对视频信息进行视频近似拷贝检测;S2、对有害视频文本进行识别;S3、如果S1与S2发现/或未发现有害信息时,对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。所述S1的具体步骤如下:S11、对未知的待测视频或图像进行有害内容识别,提取待测视频的视频指纹;S12、将视频指纹与视频指纹库中的视频指纹信息以遍历的方式进行匹配,逐一检测待测视频中是否存在不良及受控媒资中的视频片段。所述的方法还包括一个建立所述的视频指纹的步骤,包括以下子步骤:A1、将不良及受控媒资按照顺序提取每个关键帧的特征点;A2、对特征点进行过滤和精确定位后,剔除不稳定的特征点;A3、提取特征点处的特征描述符,并为特征点分配方向值形成特征向量;A4、将所有特征点的特征向量集合成视频指纹后入库形成视频指纹库。所述S2的具体步骤如下:S21、利用分词、文本聚类的方式提取素材库中每个文本信息的有害关键词并形成对应文符集;S22、将待测视频图像帧中的文本信息依次与文符集进行匹配,如果匹配相似度在预设权值范围内,则认为文本信息中包含有害内容。所述的方法还包括建立一个所述的素材库的步骤,包括以下子步骤:B1、利用COR技术提取视频图像帧中的文本信息;B2、根据视频图像帧中的文本信息建立带有有害关键词的相关文本信息的素材库。所述S3包括以下步骤:S31、将待测视频或图像作为有害内容输入智能分析模型,如果待测视频或图像中含有有害内容信息,标注出有害内容位于图片中的坐标和类型。所述的方法还包括建立一个所述的智能分析模型的步骤,包括以下子步骤:C1、利用深度学习目标检测算法对有害视频或图像进行训练;C2、建立有害内容识别智能分析模型。所述C1的具体步骤如下:C11、根据有害视频或图像生成有害视频或图像训练集,并生成图片库,包括利用Fast-RCNN深度学习目标检测算法将图片库中的图片打上标签;C12、通过Fast-RCNN深度学习目标检测算法修改有害内容模型配置文件;C13、在生成有害内容训练集及完成有害内容识别智能分析模型配置文件后,启动Fast-RCNN网络训练,主要是加载网络训练文件、训练机器GPU编号、模型配置文件、初始化的权重文件、训练数据库名称。所述的标签包括图片名称、图片路径和图片类别;所述的模型配置文件修改的内容包括检测类别个数、学习速率和步长。优选S1与S2未发现有害信息时,对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。本专利技术的有益效果是:一种视频有害内容识别方法,通过深度学习、SIFT特征提取算法以及OCR光学字符识别技术相结合的方式,可以快速地识别出视频及图像中的待检测内容,达到了视频或图像信息多维度有害内容识别的目的。附图说明图1为方法的流程图。具体实施方式下面结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。如图1所示,一种视频有害内容识别方法,该方法的步骤如下:S1、对视频信息进行视频近似拷贝检测;S2、对有害视频文本进行识别;S3、如果S1与S2发现/或未发现有害信息时,对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。所述S1的具体步骤如下:S11、对未知的待测视频或图像进行有害内容识别,提取待测视频的视频指纹;S12、将视频指纹与视频指纹库中的视频指纹信息以遍历的方式进行匹配,逐一检测待测视频中是否存在不良及受控媒资中的视频片段。所述的方法还包括一个建立所述的视频指纹的步骤,包括以下子步骤:A1、将不良及受控媒资按照顺序提取每个关键帧的特征点;A2、对特征点进行过滤和精确定位后,剔除不稳定的特征点;A3、提取特征点处的特征描述符,并为特征点分配方向值形成特征向量;A4、将所有特征点的特征向量集合成视频指纹后入库形成视频指纹库。所述S2的具体步骤如下:S21、利用分词、文本聚类的方式提取素材库中每个文本信息的有害关键词并形成对应文符集;S22、将待测视频图像帧中的文本信息依次与文符集进行匹配,如果匹配相似度在预设权值范围内,则认为文本信息中包含有害内容(涉暴、涉恐和反动等)。所述的方法还包括建立一个所述的素材库的步骤,包括以下子步骤:B1、利用COR技术提取视频图像帧中的文本信息;B2、根据视频图像帧中的文本信息建立带有有害关键词的相关文本信息的素材库。所述S3包括以下步骤:S31、将待测视频或图像作为有害内容输入智能分析模型,如果待测视频或图像中含有有害内容信息,标注出有害内容位于图片中的坐标和类型。所述的方法还包括建立一个所述的智能分析模型的步骤,包括以下子步骤:C1、利用深度学习目标检测算法对有害视频或图像进行训练;C2、建立有害内容识别智能分析模型。所述C1的具体步骤如下:C11、根据有害视频或图像生成有害视频或图像训练集,并生成图片库(约为5000张),包括利用Fast-RCNN深度学习目标检测算法将图片库中的图片打上标签;C12、通过Fast-RCNN深度学习目标检测算法修改有害内容模型配置文件;C13、在生成有害内容训练集及完成有害内容识别智能分析模型配置文件后,启动Fast-RCNN网络训练,主要本文档来自技高网
...
一种视频有害内容识别方法

【技术保护点】
一种视频有害内容识别方法,其特征在于:该方法的步骤如下:S1、对视频信息进行视频近似拷贝检测;S2、对有害视频文本进行识别;S3、如果S1与S2发现/或未发现有害信息时,对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。

【技术特征摘要】
1.一种视频有害内容识别方法,其特征在于:该方法的步骤如下:S1、对视频信息进行视频近似拷贝检测;S2、对有害视频文本进行识别;S3、如果S1与S2发现/或未发现有害信息时,对视频的有害内容进行智能分析,并利用深度学习目标检测算法再次识别。2.根据权利要求1所述的一种视频有害内容识别方法,其特征在于:所述S1的具体步骤如下:S11、对未知的待测视频或图像进行有害内容识别,提取待测视频的视频指纹;S12、将视频指纹与视频指纹库中的视频指纹信息以遍历的方式进行匹配,逐一检测待测视频中是否存在不良及受控媒资中的视频片段。3.根据权利要求2所述的一种视频有害内容识别方法,其特征在于:所述的方法还包括一个建立所述的视频指纹的步骤,包括以下子步骤:A1、将不良及受控媒资按照顺序提取每个关键帧的特征点;A2、对特征点进行过滤和精确定位后,剔除不稳定的特征点;A3、提取特征点处的特征描述符,并为特征点分配方向值形成特征向量;A4、将所有特征点的特征向量集合成视频指纹后入库形成视频指纹库。4.根据权利要求1所述的一种视频有害内容识别方法,其特征在于:所述S2的具体步骤如下:S21、利用分词、文本聚类的方式提取素材库中每个文本信息的有害关键词并形成对应文符集;S22、将待测视频图像帧中的文本信息依次与文符集进行匹配,如果匹配相似度在预设权值范围内,则认为文本信息中包含有害内容。5.根据权利要求4所述的一种视频有害内容识别方法,其特征在于:所述的方法还包括建立一个所述的素材库的步骤,包括以下子步骤:B1、利用COR技术提取视频图像帧中的文...

【专利技术属性】
技术研发人员:曾兵沈宜贾宇郭先会董文杰
申请(专利权)人:成都三零凯天通信实业有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1