一种对敏感图像进行分析的方法及装置制造方法及图纸

技术编号:19321328 阅读:17 留言:0更新日期:2018-11-03 11:22
本发明专利技术实施例公开了一种对敏感图像进行分析的方法及装置,涉及图像识别技术领域,能够提升对于广告图片识别检测的自动化水平,降低人工审核成本。本发明专利技术包括:通过对所述训练样本集合中的样本图像进行聚类,再根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型,之后利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。本发明专利技术适用于对于在线平台上的敏感图片识别。

A method and device for analyzing sensitive images

The embodiment of the present invention discloses a method and device for analyzing sensitive images, which relates to the field of image recognition technology, can improve the automation level of recognition and detection of advertisement pictures and reduce the cost of manual auditing. The invention includes: clustering the sample images in the training sample set, training corresponding recognition models by convolution neural network according to the clustered sample images, and then identifying sensitive pictures from the image database to be detected by using the training recognition model. The invention is suitable for identifying sensitive pictures on the online platform.

【技术实现步骤摘要】
一种对敏感图像进行分析的方法及装置
本专利技术涉及图像识别
,尤其涉及一种对敏感图像进行分析的方法及装置。
技术介绍
随着互联网技术的发展和各类在线交易平台、在线营销平台等网络平台的建设,各大运营商和大小商铺每时每刻都会在网络平台上投放海量的互联网广告。为了规范互联网广告的发布行为,保护消费者合法权益,在2015年颁布的新广告法中,明确规定了互联网广告活动也必须遵守广告法各项规定。在当前的实际应用中,各网络平台监控互联网广告活动的手段,主要是通过检测敏感图像来判别并预警可能违法的广告。现有的敏感图像识别方法大多特指色情图像,相应的检测手段和分析方法主要发展自依据《治安管理处罚法》和《刑法》对淫秽色情信息的监控识别领域,检测方式主要以检测敏感器官为主。比如:手工设计具有固定的颜色、形状和纹理的图像特征,并根据人工设定的图像特征匹配得到疑似的敏感图像。但现有方式的识别精度较低,经常会将正常情况下的禽肉制品、内衣、运动用品、计生用品等类别商品的广告、宣传图像误报成敏感图像,以往主要通过被举报方申诉或者监控人员人工处理的方式来解决误报问题,这已经难以满足目前对网络平台上投放的海量互联网广告进行实时监控的需求,尤其是不能适应电商平台对于海量商品宣传图像过滤监控的要求,因此需要发展出自动化程度较高的检测手段,以便控制人工成本。
技术实现思路
本专利技术的实施例提供一种对敏感图像进行分析的方法,能够提升对于广告图片识别检测的自动化水平,降低人工审核成本。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术的实施例提供的方法,包括:在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。结合第一方面,在第一方面的第一种可能的实现方式中,所述按照各样本对应的敏感类型对所述训练样本集合中的样本图像进行聚类,包括:通过预设的神经网络模型,从所述训练样本集合中提取各样本图像的敏感特征,其中,所述预设的神经网络模型通过imagenet训练;通过预设的聚类算法,将敏感特征的相似程度满足测试规则的样本图像聚类至同一个样本子集合。结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,还包括:在一个样本子集合中:按照与聚类中心的距离,将所述子集合中的样本图像由近至远排序,并选取排序在前指定位数的样本图像作为正样本;利用所得到的正样本训练模型分类器;通过经过训练的所述模型分类器,对所述样本子集合中的样本图像进行分类计算,并将计算得到的分值低于预设门限的样本图像剔除。结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,还包括:利用所提取的预训练数据集,训练指定层数的深度残差网络,所述指定层数≥50;通过训练得到的深度残差网络,校正所述样本子集合。结合第一方面,在第一方面的第四种可能的实现方式中,还包括:在对所述待检测的图片库中对应各类的敏感图片进行识别,且得到识别结果后,从所述识别结果中提取难例样本;根据所述难例样本更新对应各类的识别模型的参数。结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述从所述识别结果中提取难例样本,包括:获取敏感图片中各属性的得分值,其中,所述敏感图片中各属性的得分值通过所述识别模型计算得到;按照得分值由大至小的顺序,对所获取的敏感图片的各属性排序;获取排序在前指定位数的属性的得分值的相加值,当所述相加值大于预设的置信度阈值时,判定作为所述难例样本。。结合第一方面,在第一方面的第六种可能的实现方式中,还包括:按照预设的业务规则,从电商服务平台采集候选图像,利用所采集的候选图像更新所述图片库;和/或,按照预设的测试规则,从所述测试规则所指向的样本库中提取所述训练样本集合。第二方面,本专利技术的实施例提供的装置,包括:聚类模块,用于在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;训练模块,用于根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;分析模块,用于利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。结合第二方面,在第二方面的第一种可能的实现方式中,所述聚类模块,具体用于通过预设的神经网络模型,从所述训练样本集合中提取各样本图像的敏感特征;并通过预设的聚类算法,将敏感特征的相似程度满足测试规则的样本图像聚类至同一个样本子集合;其中,所述预设的神经网络模型通过imagenet训练。结合第二方面,在第二方面的第二种可能的实现方式中,还包括:过滤模块,用于在一个样本子集合中:按照与聚类中心的距离,将所述子集合中的样本图像由近至远排序,并选取排序在前指定位数的样本图像作为正样本;再利用所得到的正样本训练模型分类器;之后通过经过训练的所述模型分类器,对所述样本子集合中的样本图像进行分类计算,并将计算得到的分值低于预设门限的样本图像剔除;还包括:校正模块,用于利用所提取的预训练数据集,训练指定层数的深度残差网络,所述指定层数≥50;并通过训练得到的深度残差网络,校正所述样本子集合。结合第二方面,在第二方面的第三种可能的实现方式中,还包括:更新模块,用于在对所述待检测的图片库中对应各类的敏感图片进行识别,且得到识别结果后,获取敏感图片中各属性的得分值,其中,所述敏感图片中各属性的得分值通过所述识别模型计算得到;并按照得分值由大至小的顺序,对所获取的敏感图片的各属性排序;获取排序在前指定位数的属性的得分值的相加值,当所述相加值大于预设的置信度阈值时,判定作为所述难例样本。;并根据所述难例样本更新对应各类的识别模型的参数。本专利技术实施例提供的对敏感图像进行分析的方法及装置,通过对所述训练样本集合中的样本图像进行聚类,再根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型,之后利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片,从而识别出电商服务平台的商户所上传的图片是否属于对应各类的敏感图片。实现了对于商户上传电商服务平台的图片的自动检测、扫描,提升了对于广告图片识别检测的自动化水平,降低人工审核成本。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例提供的一种可能的系统架构示意图;图2为本专利技术实施例提供的方法流程示意图;图3、4为本专利技术实施例提供的具体实例的示意图;图5、6、7为本专利技术实施例提供的装置的结构示意图。具体实施方式为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步详细描述。下文中将详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”本文档来自技高网
...

【技术保护点】
1.一种对敏感图像进行分析的方法,其特征在于,包括:在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。

【技术特征摘要】
1.一种对敏感图像进行分析的方法,其特征在于,包括:在所提取训练样本集合中,按照各样本对应的敏感类型,对所述训练样本集合中的样本图像进行聚类;根据经过聚类的样本图像,通过卷积神经网络训练对应各类的识别模型;利用训练得到的识别模型,从待检测的图片库中识别对应各类的敏感图片。2.根据权利要求1所述的方法,其特征在于,所述按照各样本对应的敏感类型对所述训练样本集合中的样本图像进行聚类,包括:通过预设的神经网络模型,从所述训练样本集合中提取各样本图像的敏感特征,其中,所述预设的神经网络模型通过imagenet训练;通过预设的聚类算法,将敏感特征的相似程度满足测试规则的样本图像聚类至同一个样本子集合。3.根据权利要求2所述的方法,其特征在于,还包括:在一个样本子集合中:按照与聚类中心的距离,将所述子集合中的样本图像由近至远排序,并选取排序在前指定位数的样本图像作为正样本;利用所得到的正样本训练模型分类器;通过经过训练的所述模型分类器,对所述样本子集合中的样本图像进行分类计算,并将计算得到的分值低于预设门限的样本图像剔除。4.根据权利要求2所述的方法,其特征在于,还包括:利用所提取的预训练数据集,训练指定层数的深度残差网络,所述指定层数≥50;通过训练得到的深度残差网络,校正所述样本子集合。5.根据权利要求1所述的方法,其特征在于,还包括:在对所述待检测的图片库中对应各类的敏感图片进行识别,且得到识别结果后,从所述识别结果中提取难例样本;根据所述难例样本更新对应各类的识别模型的参数。6.根据权利要求5所述的方法,其特征在于,所述从所述识别结果中提取难例样本,包括:获取敏感图片中各属性的得分值,其中,所述敏感图片中各属性的得分值通过所述识别模型计算得到;按照得分值由大至小的顺序,对所获取的敏感图片的各属性排序;获取排序在前指定位数的属性的得分值的相加值,当所述相加值大于预设的置信度阈值时,判定作为所述难例样本。7.根据权利要求1所述的方法,其特征在于,还包括:按照预...

【专利技术属性】
技术研发人员:杨现常江龙
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1