对搜索图像的过滤方法技术

技术编号:3955341 阅读:580 留言:0更新日期:2012-04-11 18:40
一种图像处理技术领域的对搜索图像的过滤方法,包括以下步骤:对每张原始图像进行多尺度处理;得到每张原始图像在每个尺度下的颜色特征、形状特征、纹理特征和GIST特征;收集若干图像建立训练图像数据库,对每个训练图像的每个尺度下的颜色特征、形状特征、纹理特征和GIST特征分别进行模型训练处理,得到若干个训练模型;得到每张原始图像的融合特征分值;按照原始图像融合特征分值从大到小的顺序对原始图像进行重新排列,并删除融合特征分值小于阈值T的原始图像。本发明专利技术提高了对网页图像搜索结果过滤的性能,能有效去除质量较差、含有噪声、分辨率较低的图像,计算复杂度低、通用性强。

【技术实现步骤摘要】

本专利技术涉及的是一种图像处理
的方法,具体是一种。
技术介绍
网页图像搜索引擎是因特网上非常有用的搜索工具,然而这些搜索引擎返回的结果往往不能满足用户的需要。当在Google或Yahoo图像搜索引擎中输入需查询的关键词时,通常只有少部分返回的结果能让用户满意,有的甚至与查询的关键词毫无关系。因为这些搜索引擎通过分析网页上图像附近的文字、图像标题以及许多其它元素来确定图像的内容,而不是直接由图片本身的视觉内容信息来得到检索的结果。其返回的结果是基于文本信息不是基于图像本身,这就降低了用户对检索结果的满意度,毕竟用户需要的结果是图像而不是文字。既然涉及的是用户对图像结果的需求,必将考虑人眼的视觉特性,使得到的搜索结果在视觉上更让用户满意。 经对现有技术文献的检索发现,Lin等人在International Conference on WebIntelligence,pp.242-248,Oct.2003(网页智能国际会议,242-248页,2003年10月)上发表的文章“Web image retrieval re-ranking with relevance model(基于相关模型的网页图像检索重排序)”中提出的方法是基于图像所在网页的文本内容来对搜索结果的内容进行重排序。该方法与Google或Yahoo图像搜索引擎原理相似之处都只是利用了相关网页的文本信息,而没有考虑图像本身的视觉内容信息,且没有考虑将质量差、分辨率低的图像滤除。 又经检索发现,Fergus等人在European Conference on Computer Vision,pp.242256,May.2004(欧洲计算机视觉会议,242-256页,2004年5月)上发表的文章“A visual categoryfilter for Google images(一种对Google图像的视觉类过滤器)”中提出的方法是对Google图像搜索引擎返回的结果进行过滤。虽然该方法考虑了图像的视觉内容信息,但针对每个查询的关键词,都需要训练相对应的一个模型,计算代价巨大,不适合网络规模的应用。此外,该方法也没有从人眼的视觉特性出发来对图像进行过滤,没有将质量差、分辨率低的图像滤除。
技术实现思路
本专利技术针对现有技术存在的上述不足,提出一种。本专利技术不仅考虑了图像的视觉内容信息,提高了对网页图像搜索结果过滤的性能,同时考虑了人眼的视觉特性,能有效去除质量较差、含有噪声、分辨率较低的图像,保留了清晰、显著的图像;此外,本专利技术计算复杂度低、通用性强,无需针对每个查询关键词都训练相应的模型。 本专利技术是通过以下技术方案实现的,本专利技术包括以下步骤 第一步,对搜索得到的每张原始图像进行多尺度处理,使每张原始图像成为若干张预处理图像。 所述的多尺度处理采用高斯金字塔方法,具体是 其中w(m,n)为高斯核函数,M和N为图像的高和宽的像素值,k≥1,I0(x,y)为原始图像中(x,y)点的像素值,Ik(x,y)为第k层金字塔图像中(x,y)点的像素值。 第二步,对每张预处理图像分别进行颜色特征提取、形状特征提取、纹理特征提取和GIST特征提取处理,得到每张预处理图像的颜色特征、形状特征、纹理特征和GIST特征。 所述的颜色特征提取,具体是将每张预处理图像划分成n1×n1的网格,得到L*a*b*空间下每个网格的三个颜色通道下的三个矩,即得到9n12维特征向量。 所述的形状特征提取,具体是利用Canny算子检测图像的边缘,再利用Sobel算子得到图像边缘的方向,在整个空间范围内以n2度为间隔进行量化,进行直方图统计,生成 维的向量,此外引入一维非边缘像素的数目,共得到 维的边缘方向直方图。 所述的纹理特征是局部二值模式(LBP)特征。 所述的GIST特征提取,具体是将每张预处理图像分为n3×n3的网格,分别将每个网格分解到亮度、颜色和方向三个特征通道上,将亮度和颜色特征通道进行n4层金字塔表示,通过中心-边缘操作生成每个特征通道上的n5个特征图;方向通道对亮度金字塔的n6层进行Gabor滤波得到方向金字塔,n7个方向子通道共有n6×n7个特征图,最后将每个网格的特征进行特征融合,得到每张预处理图像的GIST特征。 第三步,收集若干图像建立训练图像数据库,对训练图像数据库中每张训练图像分别进行多尺度处理、颜色特征提取、形状特征提取、纹理特征提取和GIST特征提取处理,进而对每个训练图像的每个尺度下的颜色特征、形状特征、纹理特征和GIST特征分别进行模型训练处理,得到若干个训练模型。 所述的建立训练图像数据库,具体是通过网络下载若干张图像,由人工从中选择S张正样本图像和S张负样本图像。 所述的正样本图像是显著图像;所述的负样本图像是非显著图像。 所述的模型训练处理是采用SVM的方法实现的。 第四步,将每张原始图像每个尺度下的颜色特征、形状特征、纹理特征和GIST特征分别输入到对应的训练模型中,得到每张原始图像的若干特征分值,并将每张原始图像的所有特征分值进行特征分值后融合,得到每张原始图像的融合特征分值。 所述的特征分值后融合是采用线性加权的方法使每张原始图像的所有特征分值融合为一个融合特征分值,其中的线性加权系数是模型训练处理中得到的训练模型的准确率。 第五步,按照原始图像融合特征分值从大到小的顺序对原始图像进行重新排列,并删除融合特征分值小于阈值T的原始图像。 所述的阈值T,具体是 其中a是原始图像中最大的融合特征分值,b是原始图像中最小的融合特征分值。 与现有技术相比,本专利技术的有益效果是不仅考虑了图像的视觉内容信息,提高了对网页图像搜索结果过滤的性能,同时考虑了人眼的视觉特性,能有效去除质量较差、含有噪声、分辨率较低的图像,保留了清晰、显著的图像;此外,本专利技术计算复杂度低、通用性强,无需针对每个查询关键词都训练相应的模型。 附图说明 图1是实施例的原始图像; 图2是实施例的过滤后的图像。 具体实施例方式 下面结合附图对本专利技术的实施例作详细说明本实施例在以本专利技术技术方案为前提下进行实施,给出了详细的实施方式和过程,但本专利技术的保护范围不限于下述的实施例。 实施例 本实施例是在Google图像搜索引擎中,输入“airplane”返回的前15幅图的结果如图1所示,对这15幅图像进行过滤的具体步骤如下 第一步,对搜索得到的每张原始图像进行多尺度处理,使每张原始图像成为若干张预处理图像。 所述的多尺度处理采用高斯金字塔方法,具体是 其中w(m,n)为高斯核函数,M和N为图像的高和宽的像素值,k≥1,I0(x,y)为原始图像中(x,y)点的像素值,Ik(x,y)为第k层金字塔图像中(x,y)点的像素值。 本实施例首先将每张原始图像统一缩放到分辨率为512×512,然后采用高斯金字塔法下采样两级,由此得到每张原始图像三个尺度大小的图像,其分辨率分别为512×512、256×256、128×128。 第二步,对每张预处理图像分别进行颜色特征提取、形状特征提取、纹理特征提取和GIST特征提取处理,得到每张预处理图像的颜色特征、形状特征、纹理特征和GIST特征。 所述的颜色特征提取,具本文档来自技高网
...

【技术保护点】
一种对搜索图像的过滤方法,其特征在于,包括以下步骤:第一步,对搜索得到的每张原始图像进行多尺度处理,使每张原始图像成为若干张预处理图像;第二步,对每张预处理图像分别进行颜色特征提取、形状特征提取、纹理特征提取和GIST特征提取处理,得到每张预处理图像的颜色特征、形状特征、纹理特征和GIST特征;第三步,收集若干图像建立训练图像数据库,对训练图像数据库中每张训练图像分别进行多尺度处理、颜色特征提取、形状特征提取、纹理特征提取和GIST特征提取处理,进而对每个训练图像的每个尺度下的颜色特征、形状特征、纹理特征和GIST特征分别进行模型训练处理,得到若干个训练模型;第四步,将每张原始图像每个尺度下的颜色特征、形状特征、纹理特征和GIST特征分别输入到对应的训练模型中,得到每张原始图像的若干特征分值,并将每张原始图像的所有特征分值进行特征分值后融合,得到每张原始图像的融合特征分值;第五步,按照原始图像融合特征分值从大到小的顺序对原始图像进行重新排列,并删除融合特征分值小于阈值T的原始图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:张瑞杨小康黄俊
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1