The embodiment of the present invention discloses a method and device for analyzing sensitive images, which relates to the field of image recognition technology, can improve the automation level of recognition and detection of advertisement pictures and reduce the cost of manual auditing. The invention includes: clustering the sample images in the training sample set, training corresponding recognition models by convolution neural network according to the clustered sample images, and then identifying sensitive pictures from the image database to be detected by using the training recognition model. The invention is suitable for identifying sensitive pictures on the online platform.
【技术实现步骤摘要】
一种对敏感图像进行分析的方法及装置
本专利技术涉及图像识别
,尤其涉及一种对敏感图像进行分析的方法及装置。
技术介绍
随着互联网技术的发展和各类在线交易平台、在线营销平台等网络平台的建设,各大运营商和大小商铺每时每刻都会在网络平台上投放海量的互联网广告。为了规范互联网广告的发布行为,保护消费者合法权益,在2015年颁布的新广告法中,明确规定了互联网广告活动也必须遵守广告法各项规定。在当前的实际应用中,各网络平台监控互联网广告活动的手段,主要是通过检测敏感图像来判别并预警可能违法的广告。现有的敏感图像识别方法大多特指色情图像,相应的检测手段和分析方法主要发展自依据《治安管理处罚法》和《刑法》对淫秽色情信息的监控识别领域,检测方式主要以检测敏感器官为主。比如:手工设计具有固定的颜色、形状和纹理的图像特征,并根据人工设定的图像特征匹配得到疑似的敏感图像。但现有方式的识别精度较低,经常会将正常情况下的禽肉制品、内衣、运动用品、计生用品等类别商品的广告、宣传图像误报成敏感图像,以往主要通过被举报方申诉或者监控人员人工处理的方式来解决误报问题,这已经难以满足目前对网络平台上投放的海量互联网广告进行实时监控的需求,尤其是不能适应电商平台对于海量商品宣传图像过滤监控的要求,因此需要发展出自动化程度较高的检测手段,以便控制人工成本。
技术实现思路
本专利技术的实施例提供一种对敏感图像进行分析的方法,能够提升对于广告图片识别检测的自动化水平,降低人工审核成本。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术的实施例提供的方法,包括:在所提取训练样本集 ...
【技术保护点】
1.一种对敏感图像进行分析的方法,其特征在于,包括:在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。
【技术特征摘要】
1.一种对敏感图像进行分析的方法,其特征在于,包括:在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。2.根据权利要求1所述的方法,其特征在于,所述按照各样本对应的敏感类型对所述训练样本集合中的样本图像进行聚类,包括:通过预设的神经网络模型,从所述训练样本集合中提取各样本图像的敏感特征,其中,所述预设的神经网络模型通过imagenet训练;通过预设的聚类算法,将敏感特征的相似程度满足测试规则的样本图像聚类至同一个样本子集合。3.根据权利要求2所述的方法,其特征在于,还包括:在一个样本子集合中:按照与聚类中心的距离,将所述子集合中的样本图像由近至远排序,并选取排序在前指定位数的样本图像作为正样本;利用所得到的正样本训练模型分类器;通过经过训练的所述模型分类器,对所述样本子集合中的样本图像进行分类计算,并将计算得到的分值低于预设门限的样本图像剔除。4.根据权利要求2所述的方法,其特征在于,还包括:利用所提取的预训练数据集,训练指定层数的深度残差网络,所述指定层数≥50;通过训练得到的深度残差网络,校正所述样本子集合。5.根据权利要求1所述的方法,其特征在于,还包括:在对所述待检测的图片库中对应各类的敏感图片进行识别,且得到识别结果后,从所述识别结果中提取难例样本;根据所述难例样本更新对应各类的识别模型的参数。6.根据权利要求5所述的方法,其特征在于,所述从所述识别结果中提取难例样本,包括:获取敏感图片中各属性的得分值,其中,所述敏感图片中各属性的得分值通过所述识别模型计算得到;按照得分值由大至小的顺序,对所获取的敏感图片的各属性排序;获取排序在前指定位数的属性的得分值的相加值,当所述相加值大于预设的置信度阈值时,判定作为所述难例样本。7.根据权利要求1所述的方法,其特征在于,还包括:按照预...
【专利技术属性】
技术研发人员:杨现,常江龙,
申请(专利权)人:苏宁云商集团股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。