联合GIST特征的多重索引图像检索方法技术

技术编号:15822792 阅读:149 留言:0更新日期:2017-07-15 04:58
本发明专利技术公开的联合GIST特征的多重索引图像检索方法:对参考图像库中图像提取局部SIFT特征,根据局部SIFT特征中的坐标信息建立GIST特征;用局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;根据二维BOF特征模型建立基于二维BOF的投票检索模型;根据SIFT特征与GIST特征结合基于BOF特征的二维倒排表索引,对SIFT特征与GIST进行汉明量化处理,将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到基于BOF的投票检索模型中,精确检索近似重复图像。本发明专利技术的多重索引图像检索方法实现在大规模数据图像中完成对近似重复图像的检索。

【技术实现步骤摘要】
联合GIST特征的多重索引图像检索方法
本专利技术属于图像分析及检索方法
,具体涉及一种联合GIST特征的多重索引图像检索方法。
技术介绍
近年来,通信多媒体技术、计算机网络、大容量存储器及数字化图像设备等技术迅速的发展与应用;其中,数字图像的应用涉及国防军事、工业制造、新闻媒体和大众娱乐等各个方面,由此产生了各式各样的图像数据库,信息量呈指数型增长。如今,每天都有大量的图像在互联网被上传和下载,网络数据库中会保存大量近似重复的图像。为了有序而严谨地运用这些大量近似重复的图像,许多新的理论及运用应运而生,如:图像分类、图像防伪、图像内容分割、图像标注及图像数据库升级维护等等。例如:一个最普遍的情况是,一个网络用户想要搜索一些与某个关键词或图片样本相关的图像,但最终搜索引擎返回了许多重复或无关的图像;另一种情况涉及图像防伪与版权,图像制作者希望版权保护他们的图像,以避免在互联网上共享;这两种情况与需求都需要近似重复图像检索技术来实现。近年来,近似重复图像检索成为研究的热点。大量的现有方法是使用如下介绍的图像检索框架(J.Sivic,A.Zisserman,“VideoGoogle本文档来自技高网...
联合GIST特征的多重索引图像检索方法

【技术保护点】
联合GIST特征的多重索引图像检索方法,其特征在于,具体按照以下步骤实施:步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征;步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型;步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化...

【技术特征摘要】
1.联合GIST特征的多重索引图像检索方法,其特征在于,具体按照以下步骤实施:步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征;步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型;步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中,在大规模的数据中精确检索近似重复图像。2.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1、对参考图像库中的图像进行图像标准化处理,将每幅图像的像素总数控制到固定个数;步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取;SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法;对每幅图像提取SIFT特征,提取的信息包括有:特征点的位置信息、尺度信息、角度信息以及局部描述信息;步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征;GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法,对每个SIFT特征点的相邻区域提取GIST特征,提取的信息为特征点相邻区域的描述信息。3.根据权利要求2所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤1.1中,将大图控制到1024*768个像素,小图控制到640*480个像素。4.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤2具体按照以下方法实施:用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练,生成两个类;进行量化生成每幅图像的BOF特征,具体方法如下:量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理;再判断在各自的量化过程中与哪个类中心最近,则放入该类中心;然后将生成一张频数表,即初步的无权BOF;最后通过tf-idf对频数表加上权重,生成最终的加权BOF特征;其中,对查询图像的特征进行量化方法,具体按照以下算法实施:在式(1)中:q:表示量化,Rd表示实数空间中的d维数据,k表示类中心的数量,xp,p=1,...,r2为参考图像库中图像的第p个特征;计算tf-idf权值方法,具体按照以下算法实施:Wu,v=tfu,v·idfu,v(4);在式(2)~式(4)中:k1表示SIFT特征类中心的数量,k2表示GIST特征类中心的数量,fu,v是每幅图像中的特征点划分到第u个SIFT类中心并且第v个GIST类中心的频数,tu,v是特征点划分到第u个SIFT类中心并且第v个GIST类中心的参考图像总数,T是总的参考图像数,tfu,v表示词频率因子,idfu,v表示逆词频率因子;对生成的BOF特征建立二维倒排索引,具体方法为:二维倒排索引通常是由量化表文件和倒排表文件两部分组成;量化表文件记录了文档集中出现的所有词汇;倒排表文件是将每个词汇在记录文件中的位置、频率和逆词频率信息都记录下来,所有词汇的这些信息就构成倒排表;对于量化表文件中的k1*k2个词汇w1,1…wm,n中的一个wu,v,在x个记录文件,d1…dx中的倒排表能表示为如下形式:

【专利技术属性】
技术研发人员:廖开阳汤梓伟郑元林赵凡曹从军蔺广逢袁晖
申请(专利权)人:西安理工大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1