基于深度卷积神经网络的互联网直播色情图像检测方法技术

技术编号:18204777 阅读:217 留言:0更新日期:2018-06-13 06:33
本发明专利技术公开了一种基于深度卷积神经网络的互联网直播色情图像检测方法。并通过利用深度学习技术、基于卷积神经网络训练模型迭代的样本图像数据增强和预处理方法、基于深度学习卷积神经网络的模型配置与训练方法、基于多裁剪和多模型的图像联合测试方法、互联网直播视频监管的在线图像动态截取等多种优化方法,大幅提高色情直播图像内容的检测准确率,从而实现算法模型色情内容自动检测为主、人工实时审查为辅的监管模式转变,提高直播平台的监管效率、降低运营人力成本、减少巡查人员的工作强度、满足直播内容高速增长的需求。

【技术实现步骤摘要】
基于深度卷积神经网络的互联网直播色情图像检测方法
本专利技术属于互联网直播检测领域,具体涉及一种基于深度卷积神经网络的互联网直播色情图像检测方法。
技术介绍
随着移动互联网的快速发展,视频直播也快速进入了人们的生活,在发展的过程中,不时出现的涉黄直播事件,严重阻碍了视频直播的发展环境,并给社会带来了恶劣影响。因此,提高视频直播的监管审查力度越来越迫切。但是,由于视频直播的内容巨大,单纯依靠人力的审查已远远无法满足实际需要,进一步提高色情直播内容的检测技术水平至关重要。目前,关于色情图像检测的算法主要有以下两大类:(1)基于人体皮肤颜色与纹理特征的色情内容检测算法1、算法基本原理:本算法通常是先利用皮肤的像素值进行检测,然后根据皮肤纹理、形状进行分类,最后根据皮肤面积等特征进行决策;2、算法优缺点:优点:算法直观,易于理解和实现;缺点:对于皮肤区域暴露较多但不是色情图像的场景(如游泳、沙滩日光浴等)以及色情图像中肤色区域占比较少的情况,模型误判率较高。(2)基于词袋模型的色情内容检测算法1、算法基本原理:1)收集大量的训练样本图像,提取图像的sift等特征,并进行特征聚类,归一化构建码本;2)对训练集中的图片构造bagofwords,将图片中的sift等特征归到不同的码字中,从而计算出训练样本频数特征,再根据图片的类别标签,利用SVM训练分类器;3)对于未知图像,计算bagofwords,并使用训练好的分类器进行类别分类。2、算法优缺点:优点:检测精度有了较大提高;缺点:算法中的码字选择与码本大小较难确定,并严重影响算法检测精度,此外,图像背景信息的大量冗余也影响分类器的判断。近年来,随着深度学习技术在图像领域的快速发展,越来越多的图像分类、目标检测、目标识别等问题开始使用深度学习技术,其识别检测精度相较于传统图像处理算法得到了显著提升。目前,已经有很多研究学者开始尝试从不同方面将深度学习技术应用于色情图像的分类识别中,并取得了较好的识别结果,针对互联网直播领域的色情内容检测方面的研究还较少,提出一整套视频直播色情内容检测系统并应用于实际场景中则更少。针对移动互联网直播中出现的色情内容,目前,多数直播平台采用的方法是以大量监管巡查人员进行视频墙直播内容审查为主,色情直播图像在线算法自动检测为辅进行不间断直播内容审查,其中色情直播图像算法在线自动检测,多采用传统的基于人体皮肤颜色与纹理特征的色情内容检测算法和基于词袋模型的色情内容检测算法。其主要缺点和问题如下:(1)传统色情图像内容的检测算法精度在实际应用中不是很高,容易造成色情直播内容检测疏漏;(2)随着直播内容的高速增长,现有的监管巡查任务急剧增加,进一步加大了直播平台的运营成本以及巡管人员的工作强度;(3)以巡查人员进行直播审查为主的监管方式,需要巡管人员24小时不间断在线审查,长时间的视频墙审查容易造成巡管人员的视觉疲劳,进而增大色情内容检查疏漏的风险。为了解决以上问题,本专利提出了一套完整的基于深度卷积神经网络的互联网直播色情图像检测系统,该系统能够大幅提高视频直播中色情图像内容的检测准确率,从而实现算法模型色情内容自动检测为主、人工实时审查为辅的监管模式转变,提高直播平台的监管效率、降低运营人力成本、减少巡查人员的工作强度、适应直播内容的高速增长。
技术实现思路
本专利技术正是利用深度学习技术,提出了一项基于卷积神经网络的互联网直播色情图像内容检测方法,并在图像预处理、模型训练、模型测试、实际应用等四个方面进行了优化设计,进一步提高了模型的准确率和实际应用的效率。本专利技术的技术方案如下:一种基于深度卷积神经网络的互联网直播色情图像检测方法,其包括如下步骤:1)视频直播样本图像预处理;对正样本和负样本进行图像大小处理,利用卷积神经网络进行模型训练,得到初始训练模型;对正样本图像进行设定步长的滑块裁剪处理,从而得到大量裁剪完成的特定尺寸备用样本图像;利用初始训练模型针对备用样本图像进行色情类别检测,由于初始训练模型存在一定的错误识别率,需对错误识别的样本再次筛选,得到大量待训练正样本图像,投入到下一次的模型训练,并对正样本继续进行设定步长的滑块裁剪处理、色情类别检测,对错误识别的样本再次筛选,直至得到所需数量的正样本;2)基于深度学习的卷积神经网络模型训练;利用负样本和步骤1)得到的正样本对步骤1)训练后的卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。本专利技术还公开了另一种基于深度卷积神经网络的互联网直播色情图像检测方法,其包括如下步骤:1)视频直播样本图像预处理;以负样本数据作为训练负样本;对正样本数据进行数据增强,并将增强后的正样本数据作为训练正样本;对训练负样本和训练正样本进行图像大小处理、图像标签加注、数据类型转化、图像均值计算;2)基于深度学习的卷积神经网络模型训练;利用步骤1)预处理后的训练样本集卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。所述的正样本数据增强方法如下:1)图像镜像:对正样本图像进行左右、上下镜像处理;2)图像旋转:对正样本图像旋转不同的角度处理;3)图像像素改变:对正样本图像不同通道的像素值进行适当改变处理;4)图像添加噪声:对正样本图像添加不同类型、不同程度的噪声处理;5)图像高斯模糊:对正样本图像进行不同程度的高斯模糊处理。所述的图像大小处理为随机裁剪或直接归一化两种方法中的任一一种或两种。对于第一种方法,优点是处理后样本图像不变形,但是由于色情图像样本的特殊性,随机裁剪后,可能不包含色情部位内容,需要重新筛选,产生大量工作量;第二种方法,优点是包含了色情的全部内容,不需要再次筛选,但可能存在部分的图像变形,本方法将综合采用这两种方法进行处理。所述的图像标签加注为:色情图像内容类别用“0”表示,非色情图像内容类别用“1”表示。因此,图像样本的标签分别用0和1表示,并连同样本图像路径保存到标签文档中,用于后续的图像类别转换。在利用深度学习框架进行模型训练时,需要将图片(如:jpg格式)转换为深度学习框架支持的数据格式(如:caffe框架支持的LMDB格式),用于卷积神经网络的模型训练。数据格式转换完成后,利用深度学习框架计算样本图像的均值,输出均值文件,用于后续模型训练中的去均值处理。图像减去均值后,再进行训练和测试,会提高模型训练的速度和检测精度。优选的,所述的利用测试样本集对模型进行正确识别率检测的方法具体为:1本文档来自技高网
...
基于深度卷积神经网络的互联网直播色情图像检测方法

【技术保护点】
一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:包括如下步骤:1)视频直播样本图像预处理;以负样本数据作为训练负样本;对正样本数据进行数据增强,并将增强后的正样本数据作为训练正样本;对训练负样本和训练正样本进行图像大小处理、图像标签加注、数据类型转化、图像均值计算;2)基于深度学习的卷积神经网络模型训练;利用步骤1)预处理后的训练样本集卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪多网络模型的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。

【技术特征摘要】
1.一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:包括如下步骤:1)视频直播样本图像预处理;以负样本数据作为训练负样本;对正样本数据进行数据增强,并将增强后的正样本数据作为训练正样本;对训练负样本和训练正样本进行图像大小处理、图像标签加注、数据类型转化、图像均值计算;2)基于深度学习的卷积神经网络模型训练;利用步骤1)预处理后的训练样本集卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪多网络模型的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。2.一种基于深度卷积神经网络的互联网直播色情图像检测方法,其包括如下步骤:1)视频直播样本图像预处理;对负样本和少量正样本进行图像大小处理,利用卷积神经网络进行模型训练,得到初始训练模型;对正样本图像进行设定步长的滑块裁剪处理,从而得到大量裁剪完成的特定尺寸备用样本图像;利用初始训练模型针对备用样本图像进行色情类别检测,由于初始训练模型存在一定的错误识别率,需对错误识别的样本再次筛选,得到大量待训练正样本图像,投入到下一次的模型训练,并对正样本继续进行设定步长的滑块裁剪处理、色情类别检测,对错误识别的样本再次筛选,直至得到所需数量的正样本;2)基于深度学习的卷积神经网络模型训练;利用负样本和步骤1)得到的正样本对步骤1)训练后的卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。3.根据权利要求1或2所述的一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:所述的利用测试样本集对模型进行正确识别率检测的方法具体为:1)针对每一张测试样本图像,进行特定大小的图像裁剪,得到20张裁剪后的图像,若不同模型的输入图像大小要求不同,则分别裁剪出不同大小...

【专利技术属性】
技术研发人员:周建政明建华邓豪
申请(专利权)人:天格科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1