一种基于深度学习的低俗图片识别方法技术

技术编号:20118794 阅读:34 留言:0更新日期:2019-01-16 12:14
本发明专利技术公开一种基于深度学习的低俗图片识别方法,该方法对上下半身检测网络进行训练,对上下半身低俗分类网络进行训练,训练采用困难样本挖掘,使得网络训练过程中对困难样本侧重训练,提高检测精度;对图片进行低俗级联检测,检测过程中上下半身检测得分阈值采用动态调整,检测获得的上下半身区域缩放后输入至上下半身低俗分类网络,进行低俗识别。本发明专利技术在图片低俗识别中具有极佳的精度,在正负样本比例悬殊的情况下,仍能保持极低的误报率,具备良好实用性。

A method of vulgar image recognition based on in-depth learning

The invention discloses a vulgar image recognition method based on in-depth learning, which trains the upper and lower half body detection network, the upper and lower half body vulgar classification network, and adopts difficult sample mining to train the difficult sample in the process of network training, so as to improve the detection accuracy; carries on vulgar cascade detection to the picture, and detects the upper and lower half body in the process of detection. The scoring threshold is adjusted dynamically, and the detected upper and lower hemispheres are scaled and input into the upper and lower hemispheres vulgar classification network for vulgar recognition. The method has excellent accuracy in vulgar image recognition, and can maintain a very low false alarm rate even when the proportion of positive and negative samples is very different, so it has good practicability.

【技术实现步骤摘要】
一种基于深度学习的低俗图片识别方法
本专利技术属于计算机视觉
,具体涉及一种能够进行低俗图片识别的方法。
技术介绍
随着网络信息时代的到来,互联网迅速发展,信息数据的存储和传播越来越便捷迅速,大量的信息数据在网络中产生和传播。在商业广告、网络社交和游戏娱乐等各个领域,图片作为信息传播的重要载体而大量使用,每天海量的图片会在网络上生成并传播,渗透到网民的生活之中。为了博取眼球吸引用户和增加用户流量,不法分子和网站常常生成和传播大量的低俗色情图片,这对网络环境造成了极大危害。尤其,在青少年占据网络用户主体的当下,大量低俗色情图片的传播对青少年的健康成长更是造成了巨大伤害。对于网络图片的发布,各个网站以及国家网络监管部门都会进行一些审查,但主要依靠人工检查。人工识别的方式代价昂贵,效率低下。对于像微博等大量图片的产生聚集地,完全依靠人工识别是不切实际的,因而实现图片的低俗识别,净化网络环境,具有重大意义和应用价值。低俗识别技术伴随着计算机视觉研究一直不断发展进步,目前而言,低俗识别的方法可以归为三类。第一类是基于皮肤检测的低俗识别方法。对于色情图像而言,最为直观的便是身体大面积裸露。因而,最初对于色情图像的检测,就是提取皮肤特征,通过先检测出图像中的人体皮肤,再进一步进行色情判别。第二类是基于特征表达的低俗识别的方法。单纯依靠皮肤检测进行色情识别存在着很大局限性,因而通过提取更多的图像特征,并进行特征再次表达,如采用编码统计以及词袋模型等操作,获得更加有效的特征进入分类器学习。第三类是基于深度学习的低俗识别方法。深度学习近年来迅速发展,在计算机视觉研究中获得巨大成功。在低俗识别中,深度学习的方法也开始引入。目前深度学习在低俗识别中的应用,主要是直接将图片输入卷积网络进行识别,实际应用中效果不甚理想。如何更好地利用深度学习,设计一种低俗图片识别方法极具挑战。
技术实现思路
鉴于此,本专利技术提出一种基于深度学习的低俗图片识别方法。该方法将低俗图片的识别通过上下半身检测和对应低俗识别两个阶段来实现,第一阶段采用检测网络框架,第二阶段采用识别网络。两者相结合的级联网络降低了识别难度,解决了现有深度学习低俗识别方法中,无法学习获得有效特征,实际应用中识别误报高的问题。该方法有效地提高了识别精度,准确地完成了低俗识别任务。为解决上述技术问题,本专利技术采用如下技术方案:一种基于深度学习的低俗图片识别方法,步骤包括:获取人体图片数据,标注出人脸、上半身、下半身,训练上下半身检测网络;将人体图片数据输入至训练好的上下半身检测网络中,得到上下半身区域数据,标注出人脸、上半身、下半身后形成训练集,训练上下半身低俗分类网络;由训练好的上下半身检测网络、上下半身低俗分类网络构成级联低俗识别网络框架;将待识别的图片输入至该级联低俗识别网络框架中,通过上下半身检测网络得到上下半身数据,通过上下半身低俗分类网络得到低俗识别得分,别出低俗图片。进一步地,上下半身检测网络采用物体检测框架,其包括faster-rcnn、RFCN检测框架。进一步地,上下半身低俗分类网络采用用于识别低俗图片和正常图片的二分类网络,其包括GoogleNet。进一步地,上下半身检测网络对获取到的上下半身检测区域进行打分,若分数大于一检测得分阈值,则该区域确定为检测区域,从而得到上下半身区域数据。进一步地,该检测得分阈值为根据如下公式得到的一个动态调整的值:thresh=max(max(score),thresh_base);其中thresh_base为基本得分阈值,score为检测区域的得分。进一步地,thresh_base取0.8。进一步地,所述低俗识别得分的公式为:Score=max(Scoreupper,Scorelower);其中,Scoreupper,Scorelower分别为上下半身区域的低俗识别得分;该得分由上下半身检测网络的softmax输出层获得,范围为0~1,其中,若图片未检测到上半身或下半身区域,取0。进一步地,根据低俗识别得分,采用如下低俗分类决策函数f(x)识别出低俗图片:其中,t为基本得分阈值;f(x)输出值为0或者1,0表示识别为正常图片,1表示识别为低俗图片。进一步地,上下半身数据输入至上下半身低俗分类网络前,先对上下半身区域进行尺寸调整,以对应上下半身低俗分类网络的低俗识别。进一步地,训练上下半身检测网络、上下半身低俗分类网络时,采用困难样本挖掘的方法,步骤包括:训练数据准备:基于上述网络测试,挖掘容易误判的样本,将其加入训练数据,以对网络进行多次训练;训练过程使用:在训练过程中,根据计算出的损失大小来选择样本,包括:对于上下半身检测网络,生成的区域中选择计算损失最大的批量样本进行训练学习;对于上下半身低俗分类网络,训练时忽略损失小样本,只将剩余样本用于训练时更新权重。一种基于深度学习的低俗图片识别系统,包括存储器和处理器,该存储器存储计算机程序,该程序被配置为由该处理器执行,该程序包括用于执行上述方法中各步骤的指令。本专利技术方法与现有的技术相比,优点在于:(1)先进行上下半身检测,在对应进行低俗识别的方法,有效解决了由于低俗姿态多样,背景复杂,造成难以学习的困难。该方案的处理将低俗归结为两部分,即上半身裸露和下半身裸露,使得深度学习更好地学习到有效特征,提高识别效果。(2)采用困难样本挖掘的方法训练,可以使得训练权重更新侧重于困难样本,忽略无效样本,提高算法识别精度。(3)测试过程中,对于上下检测部分的得分阈值采用动态调整,可以减少进入识别网络的识别区域,提高算法整体速度,同时也可以提高检测精度。附图说明图1是实施例的一种基于深度学习的低俗图片识别方法流程图。图2是通过本专利技术方法识别低俗图片的流程图。具体实施方式为使本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图作详细说明如下。本实施例的提供的专利技术方法的流程如图1所示,主要步骤如下:(1)从相关图片网站爬取人体图片数据,并按照检测所需数据标注出人脸、上半身、下半身,选取采用合适检测网络框架,对上下半身检测网络进行训练,图1中将训练好的检测网络表示为检测模型,以示与未训练好的检测网络进行区别。训练时采用困难样本挖掘方法,多次训练调高精度。该步骤中,检测网络的目的是检测出图片中人体的上下半身,用于后续低俗判别。检测网络的检测类别为三类:人脸、上半身、下半身。其中,人脸这一类别在后续低俗识别中并不使用,但加入后可以有效提高上下半身检测的准确率。检测网路框架可采用当下主流物体检测框架(faster-rcnn等),本专利技术实验采用RFCN检测框架。(2)将包含人体的图片数据通过检测网络,获取人体上下半身数据,经过标注处理,标注出人脸、上半身、下半身后形成训练集。选取分类网络,分别训练针对上半身和下半身的低俗分类网络,图1中将训练好的分类网络表示为分类模型,以示与未训练好的分类网络进行区别。训练时同样也采用困难样本挖掘方法,多次训练调高精度。该步骤中,分类网络为二分类网络,即低俗与正常。通过步骤(1)中的训练后的上下半身检测网络对图片数据进行检测,可获得大量人体上下半身数据,进行标注,在数据处理增强后,将其作为低俗分类网络的训练数据。本专利技术中采用的分类网络为GoogleNe本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的低俗图片识别方法,步骤包括:获取人体图片数据,标注出人脸、上半身、下半身,训练上下半身检测网络;将人体图片数据输入至训练好的上下半身检测网络中,得到上下半身区域数据,标注出人脸、上半身、下半身后形成训练集,训练上下半身低俗分类网络;由训练好的上下半身检测网络、上下半身低俗分类网络构成级联低俗识别网络框架;将待识别的图片输入至该级联低俗识别网络框架中,通过上下半身检测网络得到上下半身数据,通过上下半身低俗分类网络得到低俗识别得分,别出低俗图片。

【技术特征摘要】
1.一种基于深度学习的低俗图片识别方法,步骤包括:获取人体图片数据,标注出人脸、上半身、下半身,训练上下半身检测网络;将人体图片数据输入至训练好的上下半身检测网络中,得到上下半身区域数据,标注出人脸、上半身、下半身后形成训练集,训练上下半身低俗分类网络;由训练好的上下半身检测网络、上下半身低俗分类网络构成级联低俗识别网络框架;将待识别的图片输入至该级联低俗识别网络框架中,通过上下半身检测网络得到上下半身数据,通过上下半身低俗分类网络得到低俗识别得分,别出低俗图片。2.如权利要求1所述的方法,其特征在于,所述上下半身检测网络采用物体检测框架,包括faster-rcnn、RFCN检测框架;所述上下半身低俗分类网络采用用于识别低俗图片和正常图片的二分类网络,包括GoogleNet。3.如权利要求1所述的方法,其特征在于,所述上下半身检测网络对获取到的上下半身检测区域进行打分,若分数大于一检测得分阈值,则该区域确定为检测区域,从而得到所述上下半身区域数据。4.如权利要求3所述的方法,其特征在于,所述检测得分阈值为根据如下公式得到的一个动态调整的值:thresh=max(max(score),thresh_base);其中thresh_base为基本得分阈值,score为检测区域的得分。5.如权利要求4所述的方法,其特征在于,thresh_base取0.8。6.如权利要求1或3所述的方法,其特征在于,上下半身数据输入至...

【专利技术属性】
技术研发人员:操晓春赵炜李京知
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1