一种基于深度学习的混合卡通的图像检测方法技术

技术编号:29793239 阅读:14 留言:0更新日期:2021-08-24 18:13
本发明专利技术公开一种基于深度学习的混合卡通的图像检测方法,首先准备图片样本,准备多种类型的图像,定义五个分类标签卡分别对应不同数值;样本按比例分隔为训练集与测试集,然后对图片缩放到AxB大小,并转为AxBx3的矩阵;将对应的标签分别转为one‑hot编码形式,通过特征提取层将矩阵转为多维的向量然后接256隐藏层的全连接层以及Dropout层;接上5个输出神经元的全连接层,使用softmax作为激活函数并采用交叉熵为目标损失函数,经由adam优化器进行损失优化后得到最优模型;将待检测的图像输入到训练出检测不良图像的模型中输出多个分类的概率分布,然后转换为实际的标签值。本发明专利技术不依赖任何用户行为数据,可以检测任何来源的图像。

【技术实现步骤摘要】
一种基于深度学习的混合卡通的图像检测方法
本专利技术涉及人工智能,尤其涉及一种基于深度学习的混合卡通的图像检测方法。
技术介绍
传统的不良图片的检测方法有以下几种:1.皮肤区域检测法:该方法主要是采取对像素的颜色通道根据皮肤颜色区间进行划定,然后进行统计。对统计后的值进行阈值判定,大于阈值的认为是不良图像。这种方法简单粗暴,但是误判率很高。很容易将黑白的不良图片误判为正常,而像证件照这种脸部在图像占比较高的图片误判为不良。2.指纹检测比对法:该方法是在已有不良图片库的基础上,通过与库里的不良图片的指纹码做比较,来检测出不良图片。比较常用的指纹码像MD5这种方式检测效率很高,所以被百度网盘使用。用户上传图片文件的时候会与被其他用户举报过的图片的MD5值进行比对,比对的MD5值一致的就会被判定为不良。不良的误判率很低几乎为零,但是漏判率很高,图片文件被篡改一个字节,都会绕过不良的判断,所以更不能应对分辨率不同的情况。所以出现了一种改良后的算法,具体是通过将图片经过缩放到一个相同的像素大小比如16x16,然后通过卷积的方式算出一个16x16的特征矩阵,然后通过与不良图像库里的图片比对特征差,差值越小则相似度越高。但是这种方式还是需要海量的不良图片特征库作为基础,对于与库里的图片完全不同的图像无能为力。3.数据挖掘法:该方法是通过上传用户积累的历史行为进行数据挖掘,少数不良图片上传者与大部分正常用户在行为上往往会有很大的不同。利用这点对用户的行为进行聚类分析,从而分析得到用户的行为分类。然后根据用户的行为来鉴别其上传的图片是否是不良。这种方案需要从海量用户历史行为的数据中进行分析,对数据需要多维度进行分析,从大局上来看是属于比较可行的方案,但是如果对于给定的单张图片进行检测就无能为力。4.基于特征与机器学习的检测法:该方法需要人工对不良图像进行特征分析并得到特征规则。然后对于输入的图片通过特征规则提取特征信息。然后交与传统的机器学习分类器,比如SVM进行分类。最后根据分类结果鉴别出是否是不良图片。这种方式虽然比起第一种的皮肤区域检测法来说准确率会有较大的提升,也弥补了MD5检测法对于图片检测容错的无能为力,也解决了数据挖掘方式对于海量用户历史行为的依赖。但是由于不是端到端的学习模式,所以这种方法也有比较明显的缺点。第一,需要耗费大量的人工时间进行特征提取。第二,由于特征提取的好坏很大程度影响了不良图像检测的准确率,所以对于特征提取的人员需要更加专业的技术知识。所以不同于文字鉴黄,图像鉴黄目前仍大量依赖人工不良检测师,一方面存在审核标准的主观误差,另一方面也不利于人工不良检测师这一职业人员的长期心理健康。
技术实现思路
本专利技术的目的在于提供一种基于深度学习的混合卡通的图像检测方法。本专利技术采用的技术方案是:一种基于深度学习的混合卡通的图像检测方法,具体包括以下步骤:S1,训练模型:将大量标记好标签的图片样本喂给深度神经网络模型训练出检测不良图像的模型,具体步骤如下:S1-1,首先准备图片样本,准备多种类型的图像,S1-2,定义五个分类标签卡通正常(drawings)、卡通不良(hentai)、正常(neutral)不良(porn)和性感(sexy)分别对应值0、1、2、3和4;S1-3,样本按比例分隔为训练集与测试集,然后对图片缩放到AxB大小,并转为AxBx3的矩阵;S1-4,将对应的标签分别转为one-hot编码形式,即向量的值是标签值所对应的下标位的值为1,其余为0;S1-5,通过inception-v3的特征提取层将矩阵转为多维(18432维)的向量然后接上256个隐藏层的全连接层;S1-6,训练的过程加入Dropout层以在训练过程中随机抛弃一部分的神经元,使其暂时不参与训练,从而降低过拟合;S1-7,接上5个输出神经元的全连接层,同时使用softmax作为激活函数采用交叉熵为目标损失函数,经由adam优化器进行损失优化后得到最优模型;S2,预测图像:用训练好的模型来做分类预测的任务了,将待检测的图像输入到训练出检测不良图像的模型中输出多个分类的概率分布,然后转换为实际的标签值。进一步地,作为一种较优实施方式,S1-1中每一种类型图像各10000张。进一步地,作为一种较优实施方式,S1-3中的样本按照7:3切分训练集与测试集。进一步地,作为一种较优实施方式,S1-3中的图片缩放到150x150大小,并转为150x150x3的矩阵。进一步地,作为一种较优实施方式,S1-5中全连接层前的特征提取神经网络结构为:将多层的卷积层接入包含一个以上神经元的全连接层,再接入与卷积层相同层数的反卷积层。本专利技术采用以上技术方案,将大量标记好标签的图片样本喂给深度神经网络模型,利用梯度下降法来减小预测值与目标值的误差,从而训练出能够自动检测不良图像的模型。不会受到图片皮肤的颜色以及皮肤颜色像素在图片像素占比的多少的影响。对比传统的不良图像检测能够很大程度提高不良图像检测的准确率,能够检测出不同皮肤颜色、分辨率、图像风格以及从未在互联网出现过的不良图片,同时节省大量人工分析特征的成本。本专利技术适用于所有需要进行低俗图片检测的需求场景,以及通过替换训练样本,可以进行其它类型的图像分类检测。附图说明以下结合附图和具体实施方式对本专利技术做进一步详细说明;图1为本专利技术实施例2采用多分类处理方法的流程示意图。图2为本专利技术一种基于深度学习的混合卡通的图像检测方法的图片样本处理流程示意图;图3为本专利技术一种基于深度学习的混合卡通的图像检测方法的图片映射到二维空间示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。如图1至图3之一所示,本专利技术公开了一种基于深度学习的混合卡通的图像检测方法,将大量标记好标签的图片样本喂给深度神经网络模型,利用梯度下降法来减小预测值与目标值的误差,从而训练出能够自动检测不良图像的模型。如图2所示,首先准备图片样本。图片样本由正常图片(里面包含现实的图像与卡通的图像),性感图片,与不良图片(包含有现实不良图像与卡通不良图像)组成共50000张,每一种类型图像各差不多10000张。样本按照7:3切分训练集与测试集。然后对图片进行缩放到150x150大小,并转为150x150x3的矩阵(图片为RGB三通道)。搭建特征提取的神经网络层。对于图像特征的提取,可以选择使用的迁移模型有inception,resnet,vgg16等,本专利技术之前使用过vgg16和inception-v3,感觉inception-v3的效果比vgg16好一些。对于不良图像检测任务有两种理解思路:第一种针对常规不含卡通的真人图像的情形:如图2所示,采用的特征提取神经网络结构将多层的卷积层接入包含一个以上神经元的全连接层本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的混合卡通的图像检测方法,其特征在于:其包括以下步骤:/nS1,训练模型:将大量标记好标签的图片样本喂给深度神经网络模型训练出检测不良图像的模型,具体步骤如下:/nS1-1,首先准备图片样本,准备多种类型的图像,/nS1-2,定义五个分类标签卡通正常、卡通不良、正常、不良和性感分别对应值0、1、2、3和4;/nS1-3,样本按比例分隔为训练集与测试集,然后对图片缩放到AxB大小,并转为AxBx3的矩阵;/nS1-4,将对应的标签分别转为one-hot编码形式,即向量的值是标签值所对应的下标位的值为1,其余为0;/nS1-5,通过inception-v3的特征提取层将矩阵转为多维的向量然后接上256个隐藏层的全连接层;/nS1-6,训练的过程加入Dropout 层以在训练过程中随机抛弃一部分的神经元,使其暂时不参与训练,从而降低过拟合;/nS1-7,接上5个输出神经元的全连接层,同时使用softmax作为激活函数采用交叉熵为目标损失函数,经由adam优化器进行损失优化后得到最优模型;/nS2,预测图像:用训练好的模型来做分类预测的任务了,将待检测的图像输入到训练出检测不良图像的模型中输出多个分类的概率分布,然后转换为实际的标签值。/n...

【技术特征摘要】
1.一种基于深度学习的混合卡通的图像检测方法,其特征在于:其包括以下步骤:
S1,训练模型:将大量标记好标签的图片样本喂给深度神经网络模型训练出检测不良图像的模型,具体步骤如下:
S1-1,首先准备图片样本,准备多种类型的图像,
S1-2,定义五个分类标签卡通正常、卡通不良、正常、不良和性感分别对应值0、1、2、3和4;
S1-3,样本按比例分隔为训练集与测试集,然后对图片缩放到AxB大小,并转为AxBx3的矩阵;
S1-4,将对应的标签分别转为one-hot编码形式,即向量的值是标签值所对应的下标位的值为1,其余为0;
S1-5,通过inception-v3的特征提取层将矩阵转为多维的向量然后接上256个隐藏层的全连接层;
S1-6,训练的过程加入Dropout层以在训练过程中随机抛弃一部分的神经元,使其暂时不参与训练,从而降低过拟合;
S1-7,接上5个输出神经元的全连接层,同时使用softmax作为激活函数采用交叉熵为目标损失...

【专利技术属性】
技术研发人员:郑炎陈耿生郑行涛
申请(专利权)人:中电福富信息科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1