基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法技术

技术编号:5350981 阅读:444 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法,主要解决现有基于低级语义特征的方法不足以描述不良图像信息的内容,从而导致误判的问题。其步骤是:(1)采用高斯混合模型寻求多峰肤色分布的规律,建立肤色模型;(2)通过Bootstrap的主动反馈方法优化肤色模型;(3)引入人眼视觉注意模型,检测图像中有限的显著特征点;(4)进一步利用肤色区域去除冗余特征点;(5)对图像保留下来的感兴趣点采用尺度不变特征转换SIFT进行描述;(6)生成不良图像和正常图像的码本库;(7)采用稀疏表示中的图像重构误差检索出不良图像。实验结果表明,本发明专利技术具有更强的鲁棒性,能更好的分辨出不良图像和正常图像。

【技术实现步骤摘要】

本专利技术属于图像理解
,特别涉及不良图像中的视觉注意力特征提取和基 于稀疏表示的判别方法,可用于基于图像内容分析与理解的不良图像判别。
技术介绍
随着互联网的飞速发展,无线通信技术将迈向4G网络时代,高质量的多媒体通信 使人们获得大量有用信息。然而,淫秽色情等不良信息的传播也更为隐蔽化和多样化。全 国扫黄打非办的调查研究结果表明手机涉黄危害的重点是未成年人。为更好的保护未成 年人的心理健康,相关部门从法律、制度层面对手机网络中泛滥的淫秽色情内容进行打击。 如何从技术上有效地遏制不良图像信息的传播是亟待解决的问题。为此,本专利技术针对不良 图像中信息模式复杂的特点,通过分析图像内容,根据图像包含的语义信息进行图像不良 程度的分级,为多媒体通信中的不良信息拦截提供有效的技术支撑。研究成果对净化社会 环境、保护青少年健康成长,维护社会伦理道德及和谐稳定等方面具有积极的作用和深远 的意义。传统的不良信息检测的方法是先找到图像中感兴趣的类肤色区域,并对该区域 进行内容分析与理解。因此不良信息检测任务包含如下几个关键步骤图像的感兴趣区域 提取,图像视觉内容表达。下面分别从这两个方面的研究现状、发展动态及其在不良图像信 息检测中的应用进行综述与分析。(1)图像的感兴趣区域提取由于彩色不良图像中包含裸露的肤色区域,因此肤色定位是不良信息检测的首要 步骤。早期的不良信息检测首先检测类肤色区域,然后根据肤色的面积、形状,肤色与非 肤色区域的比例,肤色联通区域的数目等特征来判别图像的性质,Jones J等人在“Jones J, RehgM. Statistical color models with application to skin detection. CVPR. Ft. Collins, Co, USA, 1999,1 :1274-1280. ”一文中完成上述工作。上述方法依赖于肤色提取的效果,因此研究人员提出诸多方法来建立肤色模 型。这就涉及到如何选择颜色空间来表示肤色。研究表明人类肤色集中在YC1A色彩空 间中较小的区域,且特征值比较稳定,对人种的变化较为鲁棒,即肤色在YCbC;色彩空间 具有一定的聚类特性。Chai D 等人在“Chai D,Ngan N. Locating facial region of a head-and-shoulders colorimage. ICAFGR. Nara, Japan, 1998 :124-129.,,一文中采用 简单的模型定义肤色的Cb(;取值范围。上述无参数的肤色检测方法不具鲁棒性,因此,在 YCbCr^l]中 Yang H 等人在"YangH, Ahuja N. Detecting human faces in color images. ICIP. Illinois, USA,1998,1 :127-130. ”一文中采用高斯模型,Yang H 等人在“Yang H, Ahuja N. Gaussian mixture model for human skincolor and its application in image and video databases. Storage and Retrieval for Image andVideo Databases. CO,USA, 1999,3656 :458-466. ”一文中采用混合高斯模型(Gaussian mixturemodel,GMM),通过概率 统计来提高算法的稳定性。(2)图像视觉内容的表达目前大部分不良信息检测方法依赖于肤色区域低层语义分析的结果,如果不对肤 色区域进行语义内容分析,容易导致产生误判。未来信息过滤技术的主导方向是基于内容 理解的过滤技术。因此,如何加强对图像内容的表达是不良信息判别技术提高的关键。为增加图像的内容信息,受自然语言处理中基于词袋模型BoW的文本分类方法的 启发,BoW被计算机视觉研究人员用来描述图像,即将图像视为由若干视觉单词组成的文 本,视觉单词之间无顺序关系。研究基于BoW的不良图像检测才刚刚起步,Deselaers T等 人在"Deselaers T, Pimenidis L Ney H. Bag-of-visual-words models for adult image classificationand filtering. ICPR. Florida, USA, 2008. ”一文中采用该方法表示图像, 输入SVM比较测试图像与训练类的单词直方图分布,实现图像不良程度的5级分类。基于 BoW的图像语义描述是解决不良信息检测极具潜力的发展方向之一。基于BoW的视觉单词生成通常包括三个步骤特征检测、特征描述和码本生成。规 则网格是最简单的特征检测方法,它用水平和垂直线来分割图像得到图像块,但缺乏对图 像内容的分析。兴趣点检测器如=Harris仿射区域检测器、高斯差分检测器等,检测图像中 更吸引人注意的拐点和斑点等显著块,在目标分类中更有用。常用的SIFT描述子对检测到 的特征进行描述时,一定程度上能处理强度、旋转、缩放和仿射等变换。最后,采用K均值聚 类或GMM把特征向量转换为码本。从而,图像中的特征通过聚类被映射为一个确定的码词, 而图像被表示成码词的直方图。上述已有的不良信息分类方法主要存在以下两个主要问题(1)由于不良图像包含裸露的人体敏感区域,现有方法主要对人体的肤色区域进 行简单特征分析实现不良信息识别。然而很多图像都包含类肤色场景,如果不对肤色区域 进行语义分析,难免会发生误检。(2)传统的高级语义分析方法同样存在缺陷,首先在图像的特征提取上,由于待处 理的图像场景往往是未知、变化的,而不良信息是确定的,因此在图像背景上提取的特征会 包含大量的冗余信息,这样会对后面的分类造成很大的影响;其次在使用词袋模型生成码 本的时候使用的是欧氏距离测度,不能很好的描述提取得到的特征点,同样会对后面的实 验造成影响,降低检测率。
技术实现思路
本专利技术目的在于克服上述已有不良信息检测算法的不足,提出一种基于鲁棒视觉 注意特征与稀疏表示的不良图像判别方法,以减少传统方法中得到的大量冗余信息,提高 不良图像的检测率。实现本专利技术的技术思路是通过提取图像中所关注的特征即视觉注意特征减少传 统方法中得到的大量冗余信息,并结合cosine距离测度下的词袋模型来更好的描述提取 得到的特征点,以实现不良信息图像的判别。实现过程分为训练阶段和测试阶段在训练阶 段,通过词袋模型生成只含有肤色区域特征的不良信息图像和正常图像码本库;在测试阶 段,对于待测试的图像同样提取其只包含肤色区域的特征,然后分别从用不良信息图像特 征库和正常图像特征库来稀疏表示待测图像的特征,根据稀疏表示后的误差大小来判断待 测图像的类别。具体实现步骤如下A.在色彩空间YCb(;中,去除影响肤色判别的亮度信息Y后,采用高斯混合模型寻 求多峰肤色分布的规律,得到肤色训练样本;B.对A步中得到肤色训练样本通过Bootstrap的主动反馈方法搜索扩展肤色示 例集上最能减小肤色训练样本中分布“不确定性”的示例,通过选择扩展示例集上那些不能 被正确预测的示例子集作为Bootstrap子样,然后将本文档来自技高网
...

【技术保护点】
一种基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法,包括如下过程:A.在色彩空间YC↓[b]C↓[r]中,去除影响肤色判别的亮度信息Y后,采用高斯混合模型寻求多峰肤色分布的规律,得到肤色训练样本;B.对A步中得到肤色训练样本通过Bootstrap的主动反馈方法搜索扩展肤色示例集上最能减小肤色训练样本中分布“不确定性”的示例,通过选择扩展示例集上那些不能被正确预测的示例子集作为Bootstrap子样,然后将这个示例加入训练示例集,并对示例集再训练来逼近该类示例真实分布情况的预测器,以此提升肤色训练样本的典型性和多样性,避免发生过拟合,从而优化步骤A建立的肤色模型;C.引入人眼视觉注意模型,用高斯差分算子检测训练图像中有限的角点和斑点,形成感兴趣的特征点集合:V{W↓[1](x,y,σ),W↓[2](x,y,σ)L,W↓[n](x,y,σ)},其中(x,y)表示特征点W的坐标,σ表示特征点W的尺度;D.对步骤C提取特征点后的训练图像,使用A和B步建立的肤色模型去除其非肤色部分,得到只含有肤色区域特征点的训练图像;E.将步骤D中检测到的特征点稀疏化:以特征点集合V中的每个特征点W(x,y,σ)为中心,取5x5的像素块N,计算N内肤色面积:skin=∑↓[S]W↓[S](x,y,σ)和非肤色面积:nonskin=∑↓[NS]W↓[NS](x,y,σ),其中W↓[S](x,y,σ)为N内的肤色像素,W↓[NS](x,y,σ)为N内的非肤色像素,当skin/nonskin<1判定该特征点为野点,最后从特征点集合V中删除该野点,得到特征点集合V′:V′={W(x,y,σ)|skin/nonskin>1};F.以步骤E中保留下来的每个特征点W(x,y,σ)为中心取8x8的小正方形窗口,然后将8x8的小正方形窗口合并为4x4个正方形,用梯度公式计算这4x4个正方形内每一个像素点8个正方向的梯度,使合并的4x4个正方形和每个正方形内像素点的8个正方向形成对一个特征点128维的特征向量,表示为f;G.取相似内容的训练图像M幅,每幅训练图像通过上述步骤A-F得到特征点集合V′内特征点128维的特征向量并构成特征矩阵,可得到M个这样的特征 矩阵,对M个特征矩阵中的特征向量通过K均值cosine距离聚类得到这些特征的C个聚类中心,定义每个聚类中心为一个视觉单词,C个视觉单词组成该类图像的码本集合B={b↓[1],b↓[2],L,b↓[C...

【技术特征摘要】

【专利技术属性】
技术研发人员:高新波田春娜李亮李英颜建强王秀美孙李斌袁博赵林杨曦
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1