分类器的训练方法及装置、识别敏感图片的方法及装置制造方法及图纸

技术编号：2924697 阅读：310 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供的敏感图片分类器的训练方法及装置，提取训练图片集的区域形状特征，测量区域形状特征在正例样本集、第一反例样本集和第二反例样本集中的分布特征；根据分布特征确定区域形状特征的可分性；将相对于第一反例样本集具有可分性的区域形状特征标注为第一特征组；将相对于第二反例样本集具有可分性的区域形状特征标注为第二特征组；通过第一特征组的特征训练获得第一分类器，通过第二特征组的特征训练获得第二分类器。本发明专利技术还提供了使用该敏感图片分类器进行敏感图片识别的方法及装置。通过本发明专利技术能够提高敏感图片识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像识别领域，尤其涉及一种分类器的训练方法及装置、识别敏感图片的方法及装置。
技术介绍
随着互联网信息量的日益丰富，不良信息也越来越多。不良信息中的色情图片等敏感图片污染社会风气，危害青少年的身心健康，识别并拦截这类敏感图片是净化互联网内容的一项关键任务。考虑到敏感图片绝大多数都是存在大面积人体皮肤棵露的，而检测人体棵露皮肤相对比直接检测出敏感图片容易，因此人体棵露皮肤检测是达到敏感图片识别的一种有效的启发式办法。通过人体棵露皮肤检测，可以检测出疑似度相当高的一类敏感图片，然后交给人工审核，可以大大降低人工审核的工作量。现有技术中存在一种基于肤色检测技术及人体区域形状特征的人体棵露皮肤检测方法。通过肤色检测技术检测出待审核图片的肤色或类似肤色区域，然后在这些区域上提取出能够区分人体皮肤区域和非人体皮肤的背景区域的区域形状特征，再经过一个事先训练好的分类器进行判别。现有的肤色检测技术主要是基于人体皮肤颜色的统计概率分布来进行的，目前使用比较广泛的肤色检测方法是Bayes决策法。该方法在一个大样本集上统计皮肤颜色和非皮肤颜色的分布，对一种给定的颜色，根据这两个分布使用Bayes公式计算出该颜色是皮肤颜色的后验概率，根据概率大小决定其是肤色区域还是非肤色区域。现有技术中常用的人体区域形状特征主要有皮肤区域与图像的面积比(皮肤区域指所有的皮肤像素组成的区域，不要求连续)，最大皮肤Blob与图像的面积比(皮肤Blob指皮肤像素组成的连通区域)，皮肤Blob个数，皮肤Blob与外接矩形(或凸包)面积比、皮肤Blob的等价椭...

【技术保护点】
一种敏感图片分类器的训练方法，其特征在于，包括步骤：　提取训练图片集的区域形状特征，所述训练图片集包括正例样本集、第一反例样本集和第二反例样本集；　测量所述区域形状特征在所述正例样本集、第一反例样本集和第二反例样本集中的分布特征；　根据所述分布特征确定所述区域形状特征的可分性；　将相对于所述正例样本集与所述第一反例样本集具有可分性的区域形状特征标注为第一特征组；将相对于所述正例样本集与所述第二反例样本集具有可分性的区域形状特征标注为第二特征组；　通过所述第一特征组训练获得第一分类器，通过所述第二特征组训练获得第二分类器。

【技术特征摘要】

【专利技术属性】
技术研发人员：付立波，王建宇，陈波，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人