一种视觉显著性与短语相结合的图像检索方法技术

技术编号：10115657 阅读：239 留言：0更新日期：2014-06-04 20:02

本发明专利技术涉及一种视觉显著性与短语相结合的图像检索方法，包括：输入一幅查询图像；计算查询图像的显著图；提取查询图像的显著性区域；提取查询图像显著性区域的视觉词，构造视觉短语；获得每幅图像的图像描述子；计算查询图像与图库中每幅图像的图像相似度，根据相似度值对图库中的所有图像进行排序，并按要求返回相关图像作为查询结果。本发明专利技术在经典的“词袋”模型基础上通过引入视觉显著性对图像区域进行约束，降低了图像表达的噪声，使图像在计算机中的表达更符合人类对图像语义的理解，使本发明专利技术具有良好的检索效果。本发明专利技术通过视觉词间的区域约束来构造视觉短语，与其它构造视觉短语方法相比，具有较快的速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种视觉显著性与短语相结合的图像检索方法
本专利技术属于图像处理领域，涉及图像检索中的图像表示与匹配方法，具体涉及一种视觉显著性与短语相结合的图像检索方法。
技术介绍
随着计算机、网络以及多媒体技术的迅速发展和应用，数字图像的数量正以惊人的速度增长，如何快速高效地从海量数字图像集合中找到人们需要的图像成为一个亟待解决的问题。为此，图像检索技术应运而生并取得了很大的发展，从最早基于图像人工标注的检索，发展到现在基于图像内容的检索，图像检索的精度和效率也都有显著提高，但仍无法满足人们的需求。其问题的关键在于目前还没有一种方法能够使计算机完全像人一样的理解图像语义。如果能够进一步挖掘图像的真实含义，并在计算机中准确表达，势必会提升图像检索的效果。在有关图像检索的文献中，目前普遍使用“词袋”模型进行检索，该模型的核心思想是通过对图像局部特征的提取与描述来描述整幅图像。主要分为五步：第一，检测图像的特征点，或者图像的角点，通常统称为兴趣点；第二，描述兴趣点，通常是用一个向量来描述一个点，这个向量称为该点的描述子；第三，对所有训练样本图像的兴趣点描述子进行聚类，得到包含若干词的词典；第四，把查询图像的所有兴趣点描述子向词典进行映射，得到图像描述子；第五，把查询图库中的每幅图像的所有兴趣点描述子向词典进行映射，得到图像描述子，并与查询图像的描述子进行匹配，获得检索结果。该模型用于图像检索可以取得良好的效果，但在表示图像时只是对映射得到的视觉词进行了统计，缺乏视觉词间的空间关系。另一方面，在基于“词袋”模型的图像检索中，人们是对整幅图像提取视觉词，这样容易引入许多噪声。例...
一种视觉显著性与短语相结合的图像检索方法

【技术保护点】
一种视觉显著性与短语相结合的图像检索方法，其特征在于，引入视觉显著性对图像区域进行约束，并在显著性区域内构建视觉短语进行检索；所述方法包括以下步骤：步骤1，输入一幅宽为W、高为H的查询图像I；步骤2，计算查询图像I的显著图；步骤2.1，将图像I均匀切分成L个不重叠的图像块pi，i＝1,2,...,L，使切分后每行包含N个图像块，每列包含J个图像块，每个图像块是一个方块，将每个图像块pi向量化为列向量fi，并对所有向量通过主成分分析进行降维，降维后等到一个d×L的矩阵U，其第i列对应图像块pi降维后的向量；矩阵U构成为：U＝[X1 X2 … Xd]T步骤2.2，计算每个图像块pi的视觉显著性程度；视觉显著性程度为：Mi＝maxj{ωij},j＝1,2,...,LD＝max{W,H}ωij=(xpi-xpj)2+(ypi-ypj)2]]>其中，表示图像块pi和pj之间的不相似度，ωij表示图像块pi和pj之间的距离，umn表示矩阵U第m行第n列的元素，(xpi,ypi)、(xpj,ypj)分别代表图块pi和pj在原图像I上的中心点坐标；步骤2.3，把所有图像块的视觉显著性程度取...

【技术特征摘要】
1.一种视觉显著性与短语相结合的图像检索方法，其特征在于，引入视觉显著性对图像区域进行约束，并在显著性区域内构建视觉短语进行检索；所述方法包括以下步骤：步骤1，输入一幅宽为W、高为H的查询图像I；步骤2，计算查询图像I的显著图；步骤2.1，将图像I均匀切分成L个不重叠的图像块pi，i＝1,2,...,L，使切分后每行包含N个图像块，每列包含J个图像块，每个图像块是一个方块，将每个图像块pi向量化为列向量fi，并对所有向量通过主成分分析进行降维，降维后得到一个d×L的矩阵U，其第i列对应图像块pi降维后的向量；矩阵U构成为：U＝[X1X2…Xd]T步骤2.2，计算每个图像块pi的视觉显著性程度；视觉显著性程度为：Mi＝maxj{ωij},j＝1,2,...,LD＝max{W,H}其中，表示图像块pi和pj之间的不相似度，ωij表示图像块pi和pj之间的距离，umn表示矩阵U第m行第n列的元素，(xpi,ypi)、(xpj,ypj)分别代表图块pi和pj在原图像I上的中心点坐标；步骤2.3，把所有图像块的视觉显著性程度取值按照原图像I上各图像块之间的位置关系组织成二维形式，构成显著图SalMap，具体取值为：SalMap(i,j)＝Sal(i-1)·N+j，i＝1,..,J,j＝1,...,N步骤2.4，根据人眼中央偏置原则，对步骤2.3中得到的显著图施加中央偏置，并通过二维高斯平滑算子进行平滑得到最终的结果图，公式如下：SalMap'(i,j)＝SalMap(i,j)×AttWeiMap(i,j)其中，i＝1,..,J,j＝1,...,N，AttWeiMap为人眼平均关注程度权值图，该图与显著图SalMap的大小一致，DistMap为距离图，max{DistMap}、min{DistMap}分别表示距离图上的最大值和最小值；步骤3，提取查询图像I的显著性区域；使用视点转移模型在步骤2所得到的查...

【专利技术属性】
技术研发人员：段立娟，赵则明，马伟，张璇，苗军，乔元华，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人