基于视觉词组的图像检索方法技术

技术编号：6882398 阅读：366 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开一种计算机信息处理技术领域的基于视觉词组的图像检索方法，首先对标准图像和待检索图像分别提取显著性区域，并在显著性区域中提取特征描述子，然后对标准图像库中的特征描述子采用随机kd树进行聚类，接着将标准图像和待检索图像的特征描述子分别通过视觉词组进行表示，并根据标准图像的视觉词组创建二维倒排索引，最后将由视觉词组表示的待检索图像的特征描述子在二维倒排索引中进行相似性搜索以及空间几何关系度量，给出最终检索结果。本发明专利技术在保证检索准确率的情况下，降低了检索过程的计算量，提高了检索的实时性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是计算机信息处理
的方法，具体是一种。
技术介绍
随着具有拍照功能的手机价格更加低廉以及互联网的发展，图像的获取更加简捷方便，图像数量也呈现爆炸性的增长。图像数量的快速增长对图像数据的存储、搜索和组织提出了巨大的挑战和考验。在现实生活中，如何在大规模图像库中根据手机拍摄图像获取最有用的信息，成为人们关注和研究的焦点之一。图像检索技术是指根据查询图像内容信息或者指定查询标准，在标准图像库中进行搜索并查找出符合条件的相关图像。传统的图像检索技术大多采用基于文本的检索方法，它沿用了传统的文本检索技术，从图像名称、图像尺寸、压缩类型、作者、年代等方面描述图像，通过关键词的形式查询图像。基于文本的图像检索技术，不能对图像低层特征元素进行客观分析和描述，逐渐被基于内容的图像检索技术所取代。基于内容的图像检索技术，早期大多采用颜色、纹理、形状等全局特征进行相似性搜索，但是这些特征对于光照、遮挡以及几何形变等不具有稳健性，因此逐渐被SIFT、SURF 等局部不变性特征描述子所取代。与传统的图像全局特征相比，图像的局部不变性特征具有更好的唯一性、不变性和鲁棒性，能够适应图像背景混杂、局部遮挡、光线变化等各种情况，因此适用于在各种情况下拍摄的手机图像。将图像的局部不变性特征进行聚类量化，并在高维索引结构中进行相似性搜索，即可根据手机拍摄图像在标准图像库中查询出相关结^ ο经对现有技术的文献检索发现，Andrew Zisserman等在专利“Object Retrieval”(美国专利号为US 2005/0225678 Al，公开日期为2005年12月1...

【技术保护点】
１．一种基于视觉词组的图像检索方法，其特征在于具体为：首先对标准图像和待检索图像分别提取显著性区域，并在显著性区域中提取特征描述子；然后对标准图像库中的特征描述子采用随机ｋｄ树进行聚类；接着将标准图像和待检索图像的特征描述子分别通过视觉词组进行表示，并根据标准图像的视觉词组创建二维倒排索引；最后将由视觉词组表示的待检索图像的特征描述子在二维倒排索引中进行相似性搜索以及空间几何关系度量，给出最终检索结果。

【技术特征摘要】
1.一种基于视觉词组的图像检索方法，其特征在于具体为首先对标准图像和待检索图像分别提取显著性区域，并在显著性区域中提取特征描述子；然后对标准图像库中的特征描述子采用随机kd树进行聚类；接着将标准图像和待检索图像的特征描述子分别通过视觉词组进行表示，并根据标准图像的视觉词组创建二维倒排索引；最后将由视觉词组表示的待检索图像的特征描述子在二维倒排索引中进行相似性搜索以及空间几何关系度量，给出最终检索结果。2.根据权利要求1所述的基于视觉词组的图像检索方法，其特征是，所述的对标准图像和待检索图像分别提取显著性区域是指将图像从空间坐标变换到频率坐标，计算图像的对数谱，并将其与滤波后的对数谱进行差分得到谱残差，进而反变换得到显著性区域；所述的提取特征描述子是指在提取到的显著性区域中首先采用高斯差分算子进行特征点检测，然后将每个高斯差分算子通过尺度不变描述子进行描述。3.根据权利要求1或2所述的基于视觉词组的图像检索方法，其特征是，所述的提取显著性区域包括离线处理和实时处理两个步骤，其中所述离线处理中，在图像“提取到的显著性区域馮中，获取到的SIFT描述子表示为式13(1^||，--^ ),其中 ^irU IA-^)是图像^中第r个描述子，维数为1 维，是图像中SIFT描述子的个数，标准图像库中全部SIFT描述子表示为.If」(Jf1,JT2,-- ,Xj,);所述实时处理中，在待检索图像Q提取到的显著性区域&中，获取到的SIFT描述子表示为A□ (/ /,-,/),其中□ …，￡)是图像Q中第ff个描述子，维数为1 维，￡是图像Q中SIFT描述子的个数。4.根据权利要求1或2所述的基于视觉词组的图像检索方法，其特征是，所述的提取特征描述子包括离线处理和实时处理两个步骤，其中所述离线处理中，在图像易提取到的显著性区域S中，获取到的SIFT描述子表示为 JTiIl (巧1，^，…，^ ,其中IX-,ι%)是图像中第『个描述子，维数为1 维，巧是图像矣中SIFT描述子的个数，标准图像库中全部SIFT描述子表示为JTD (JHf^Tjr)；所述实时处理中，在待检索图像Q提取到的显著性区域^中，获取到的SIFT描述子表示为Λ □,其中Zfe □ IX-·,L)是图像Q中第ff个描述子，维数为1 维，￡是图像Q中SIFT描述子的个数。5.根据权利要求1所述的基于视觉词组的图像检索方法，其特征是，所述的对标准图像的特征描述子进行聚类是指在离线处理中，聚类过程中采用随机kd树进行近似最近邻搜索，将特征描述子划分到对应的类别，并在多次迭代后确定聚类中心；采用随机kd树确定聚类中心的步骤包括在全部SIFT描述子I中随机选择fc个对象作为聚类中心CD Cck^3-,1 )；根据聚类中心C创建随机kd树，随机kd树中的每个节点在多个较大方差值对应的维数中随机选择，节点的分割阈值在对应维数靠近中值的元素中随机选择；对SIFT描述子JT采用随机kd树进行近似最近邻搜索，将每个SIFT描述子划分到对应的类别中；重新计算每个类别的均值，确定新的聚类中心；重复步骤2) —4)，设迭代的次数为ff次，直到每个类别不再发生变化为止。6.根据权利要求1所述的基于视觉词组的图像检索方法，其特征是，所述的将标准图像和待检索图像的特征描述子分别通过视觉词组进行表示是指在聚类完成后，根据随机 kd树确定每个SI...

【专利技术属性】
技术研发人员：冯德瀛，杨杰，杨程，刘从新，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人