本发明专利技术公开了一种在移动设备上基于图像语义分析的敏感区域检测方法,实现了在训练分类器的预处理阶段加入自顶向下的视觉注意机制来增强分类器训练的性能和效果,用训练好的分类器对图像进行分类。包括:输入训练图像;提取输入训练图像的特征;将提取的特征训练多个弱分类器,并级联形成最终需要的强分类器;输入测试图像,对测试图像进行预处理,通过视觉注意机制对图像中敏感区域可能的位置进行标定;进行敏感图像检测;输出敏感图像检测结果。在敏感图像检测前进行自顶向下注意机制的显著图提取,可以提高运算效率,缩短运算时间,显著提高检测速度;也使正检率明显提高,误检率明显降低。
【技术实现步骤摘要】
本专利技术属于图像处理领域,具体涉及。
技术介绍
中国互联网信息中心发布了《2011年中国青少年上网行为调查报告》,截至2011年12月底,中国青少年网民规模已达2.32亿,占整体网民的45.1%,占青少年总体的64.4%,超出全国网民平均水平26.1个百分点。2011年,新增青少年网民1936万,同比增长9.0%。特别值得一提的是,2007 2010年间青少年手机上网比例已从49.7%提升到80.3%。随着移动互联网的快速发展,特别是3G网络的发展及智能手机、平板电脑等移动终端的发展,未成年人使用手机上网的比例还会进一步提高。早在2009年12月之前,中国科学院相关课题小组同样随机抽样监测了 2000个手机网站,其中淫秽色情手机网站167个,占比8.3%。2010年,这一比例增至9.9%。这些手机淫秽色情网站毒害着青少年的心灵,容易引发青少年犯罪。而在传统互联网领域,已经相对成熟的“金盾工程”、“国家计算机网络应急技术处理协调中心”等机制还并未移植到无线互联网上。显然,无线互联网与互联网的信息治理还有待更多协同。手机色情信息一直难以彻底清除,从技术方面分析主要原因是:青少年手机用户用WAP上网很容易进入淫秽色情网站,这些网站通过购买号段主动推送,浏览者通常会无意闯入,而同样的网址在电脑上呈现的则是无内容或“无色”内容。手机色情网站却由于其特殊的链接方式而不容易被发现。许多存在问题的手机网站都设置了 WAP网关,用户只有通过手机上网才能浏览,而且,有一些WAP网站实行的是会员制,必须获得会员资格才能浏览和下载,更加具有隐蔽性。此外,监管部门没有专门的手机网络监控人员,偶尔需要也是通过手机上网进行监测,由于带宽和网速的限制,无法快速搜索浏览、及时发现淫秽色情网站,即使发现了,也存在IP地址定位和取证等困难。种种技术上的限制导致监管部门不能及时发现和关闭那些传播手机色情信息的网站。淫秽色情手机网站一直得不到有效封堵,是因为这些网站采用跳转IP和变换域名的办法。现在国内外在基于内容的敏感图像过滤的研究方面做了不少工作,可以解决因某些色情网站刻意跳转IP和变换域名而无法检测的问题,但是处理速度和处理的正确率仍然是这种方式的一个瓶颈。
技术实现思路
为了解决敏感图像过滤方面存在的问题,本专利技术提供了一种基于图像语义分析的敏感部位检测方法,将视觉注意机制加入到敏感图像检测中,来提高检测的性能与效率。本专利技术采取的技术方案如下:基于图像语义分析的敏感区域检测方法,包括以下步骤:步骤1,输入训练图像。将敏感图像作为正例样本,正常图像作为负例样本。对正例样本,确定敏感区域(胸部、下体部位)作为自顶向下认定标准,提取注意引导图。研究表明加入视觉模型能够明显提升检测的性能和效率。显著性能够保证图像中的前景物体扭曲度更小,有效突出目标特征,屏蔽掉干扰信息。因而在训练分类器和检测敏感图像的时候加入视觉模型,可达到提高检测率的目的。步骤2,提取输入训练图像的特征。假设输入一幅3通道彩色图像I,其宽和高分别为W、H,提取输入训练图像的特征的方法如下:①将输入图像切分成不重叠的图像块,并将每个图像块向量化。首先,把图像切分成图像块,将图像I按照从左至右、从上至下的顺序切分成不重叠的图像块Pi (i = 1,2,...,L),每个图像块是一个方块,宽和高都是k(k〈W,k < H),图像I可以切分出的图像块总数为:本文档来自技高网...
【技术保护点】
一种基于图像语义分析的敏感区域检测方法,其特征在于包括以下步骤:步骤1,输入训练图像:将敏感图像作为正例样本,正常图像作为负例样本;训练样本的采集遵循以下原则:正例样本清晰,扭曲度小,并且在数量上达到一定的量;负例样本的量要超过正例样本,并且包含不同形态的事物,包括自然景色,以及行人等图像,以尽可能地减小误判;对正例样本,确定敏感区域(胸部、下体部位)作为自顶向下认定标准,提取注意引导图;步骤2,提取输入训练图像的特征,方法如下:①将输入图像切分成不重叠的图像块,并将每个图像块向量化;首先,把宽和高分别为W、H的图像I按照从左至右、从上至下的顺序切分成不重叠的图像块pi(i=1,2,...,L),每个图像块是一个方块,宽和高都是k(k<W,k<H),图像I可以切分出的图像块总数为:L=(Wk)*(Hk)当图像的宽和高不是k的整数倍时,先对图像进行缩放,保证图像的宽和高是k的整数倍,这里假定尺寸变化后图像的宽和高仍分别用W、H表示;将每个图像块pi向量化为列向量fi,fi的长度等于彩色图像的通道数a乘k2,即ak2;②计算每个图像块与其他所有图像块的不相似度,得到显著图。对①所得到的所有向量通过主成分分析进行降维,挑选最大的d个特征值所对应的特征向量X1,X2,...,Xd构成矩阵U,矩阵U是一个d*L的矩阵,其第i列对应图像块pi降维后的向量,图像块pi和pj之间的不相似度的计算公式为:φij=Σs=1d|μsi-μsj|其中,umn表示矩阵U第m行第n列的元素每个图像块pi的视觉显著性程度的计算公式为:其中,ωij表示图像块pi和pj之间的距离,计算公式为:ωij=(xpi-xpj)2+(ypi-ypj)2式中,(xpi,ypi)、(xpj,ypj)分别代表图像块pi和pj的中心点在原图像I上的坐标;把所有图像块的视觉显著性程度取值按照原图像I上各图像块之间的位置关系组成二维形式,构成显著图SalMap,这是一个J行N列的灰度图,J=H/k,N=W/k,显著图SalMap上第i行第j列的元素对应原图像I上切分出的图像块p(i?1)N+j(i=1,...,J,j=1,...,N)的显著程度取值,具体取值为:SalMap(i,j)=Sal(i?1)N+j(i=1,...,J,j=1,...,N)③根据输入图像中每个图像块与预定义的敏感部位的相关性,建立敏感部位相关图;④将显著图与敏感部位相关图加权点乘,得到注意引导图;⑤根据注意引导图将敏感部位作为当前的显著区域;在训练的过程中,仅选取图像中击最显著的显著点进行训练;⑥对⑤确定的显著点进行敏感区域识别,判定显著点是否为敏感区域,依据注意引导图所选择的最显著的显著点被标记为敏感区域,其他区域均被标记为非敏感区域;⑦根据⑥所标记的敏感区域,提取对应于敏感区域的Harr特征;步骤3,将步骤2提取的特征,训练多个弱分类器,并级联形成最终需要的强分类器,训练方法如下:①输入N个训练实例:pt=ωtΣi=1Nωit其中,p为归一化权值,t为迭代次数,t=1,2,3,…,T;③对每个特征f,训练一个弱分类器hj;按下式计算所有特征对应的弱分类器的加权错误率:ϵt=Σi=1Npit|ht(xi)-yi|其中,εt为错误率;④选择错误率最小的分类器为最佳弱分类器ht;⑤设置新的权值向量:其中,βt=εt/1?ε)⑥循环执行②~⑤,最终输出强分类器:hf(x)=1,Σt=1T(log1/βt)ht(x)≥12Σt=1Tlog1/βt0,Σt=1T(log1/βt)ht(x)<12Σt=1Tlog1/βt步骤4,输入用户使用移动终端上网时浏览到的图像,该图像同样分为正例图像和负例图像;步骤5,对步骤4得到的测试图像进行预处理,通过视觉注意机制对图像中敏感区域可能的位置进行标定;步骤6,检测敏感图像:使用步骤3得到的分类器对步骤5处理过的图像进行分类,判断该图像是不是敏感图像:当步骤5处理过的图像块与强分类器中的敏感部位图像块差异小于域值T时,则认为该图像为敏感图像;否则,认为是正常图像;步骤7,根据步骤6的检测结果,标注图像属于敏感图像还是正常图像,并进行正检率、误报率的统计。FDA00002737729700012.jpg,FDA00002737729700014.jpg,FDA00002737729700016.jpg,FDA00002737729700021.jpg,FDA00002737729700024.jpg...
【技术特征摘要】
1.一种基于图像语义分析的敏感区域检测方法,其特征在于包括以下步骤: 步骤1,输入训练图像:将敏感图像作为正例样本,正常图像作为负例样本;训练样本的采集遵循以下原则:正例样本清晰,扭曲度小,并且在数量上达到一定的量;负例样本的量要超过正例样本,并且包含不同形态的事物,包括自然景色,以及行人等图像,以尽可能地减小误判;对正例样本,确定敏感区域(胸部、下体部位)作为自顶向下认定标准,提取注意引导图; 步骤2,提取输入训练图像的特征,方法如下: ①将输入图像切分成不重叠的图像块,并将每个图像块向量化; 首先,把宽和高分别为W、H的图像I按照从...
【专利技术属性】
技术研发人员:段立娟,谷继力,吴春鹏,杨震,苗军,李健,马伟,乔海涛,张祺,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。