【技术实现步骤摘要】
基于深度卷积神经网络的互联网直播色情图像检测方法
本专利技术属于互联网直播检测领域,具体涉及一种基于深度卷积神经网络的互联网直播色情图像检测方法。
技术介绍
随着移动互联网的快速发展,视频直播也快速进入了人们的生活,在发展的过程中,不时出现的涉黄直播事件,严重阻碍了视频直播的发展环境,并给社会带来了恶劣影响。因此,提高视频直播的监管审查力度越来越迫切。但是,由于视频直播的内容巨大,单纯依靠人力的审查已远远无法满足实际需要,进一步提高色情直播内容的检测技术水平至关重要。目前,关于色情图像检测的算法主要有以下两大类:(1)基于人体皮肤颜色与纹理特征的色情内容检测算法1、算法基本原理:本算法通常是先利用皮肤的像素值进行检测,然后根据皮肤纹理、形状进行分类,最后根据皮肤面积等特征进行决策;2、算法优缺点:优点:算法直观,易于理解和实现;缺点:对于皮肤区域暴露较多但不是色情图像的场景(如游泳、沙滩日光浴等)以及色情图像中肤色区域占比较少的情况,模型误判率较高。(2)基于词袋模型的色情内容检测算法1、算法基本原理:1)收集大量的训练样本图像,提取图像的sift等特征,并进行特征聚类,归一化构建码本;2)对训练集中的图片构造bagofwords,将图片中的sift等特征归到不同的码字中,从而计算出训练样本频数特征,再根据图片的类别标签,利用SVM训练分类器;3)对于未知图像,计算bagofwords,并使用训练好的分类器进行类别分类。2、算法优缺点:优点:检测精度有了较大提高;缺点:算法中的码字选择与码本大小较难确定,并严重影响算法检测精度,此外,图像背景信息的大量冗余 ...
【技术保护点】
一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:包括如下步骤:1)视频直播样本图像预处理;以负样本数据作为训练负样本;对正样本数据进行数据增强,并将增强后的正样本数据作为训练正样本;对训练负样本和训练正样本进行图像大小处理、图像标签加注、数据类型转化、图像均值计算;2)基于深度学习的卷积神经网络模型训练;利用步骤1)预处理后的训练样本集卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪多网络模型的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。
【技术特征摘要】
1.一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:包括如下步骤:1)视频直播样本图像预处理;以负样本数据作为训练负样本;对正样本数据进行数据增强,并将增强后的正样本数据作为训练正样本;对训练负样本和训练正样本进行图像大小处理、图像标签加注、数据类型转化、图像均值计算;2)基于深度学习的卷积神经网络模型训练;利用步骤1)预处理后的训练样本集卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪多网络模型的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。2.一种基于深度卷积神经网络的互联网直播色情图像检测方法,其包括如下步骤:1)视频直播样本图像预处理;对负样本和少量正样本进行图像大小处理,利用卷积神经网络进行模型训练,得到初始训练模型;对正样本图像进行设定步长的滑块裁剪处理,从而得到大量裁剪完成的特定尺寸备用样本图像;利用初始训练模型针对备用样本图像进行色情类别检测,由于初始训练模型存在一定的错误识别率,需对错误识别的样本再次筛选,得到大量待训练正样本图像,投入到下一次的模型训练,并对正样本继续进行设定步长的滑块裁剪处理、色情类别检测,对错误识别的样本再次筛选,直至得到所需数量的正样本;2)基于深度学习的卷积神经网络模型训练;利用负样本和步骤1)得到的正样本对步骤1)训练后的卷积神经网络模型进行多种网络模型训练,直至训练模型收敛;3)基于多模型多裁剪的图像识别测试;利用测试样本集对模型进行正确识别率检测,若模型的正确识别低于实际场景的识别率门限要求,则继续进行模型优化训练,直至达到要求识别率;4)视频直播场景的内容检测与应用;完成深度卷积神经网络模型的训练和测试后,将模型应用到实际的视频直播场景中,对待检测直播视频进行在线图像动态截取,并通过多网络模型进行色情类别检测。3.根据权利要求1或2所述的一种基于深度卷积神经网络的互联网直播色情图像检测方法,其特征在于:所述的利用测试样本集对模型进行正确识别率检测的方法具体为:1)针对每一张测试样本图像,进行特定大小的图像裁剪,得到20张裁剪后的图像,若不同模型的输入图像大小要求不同,则分别裁剪出不同大小...
【专利技术属性】
技术研发人员:周建政,明建华,邓豪,
申请(专利权)人:天格科技杭州有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。