一种基于集成哈希编码的快速图像检索方法技术

技术编号:11699456 阅读:165 留言:0更新日期:2015-07-08 23:37
本发明专利技术公开了一种基于集成哈希编码的快速图像检索方法,属于数字图像检索技术领域,步骤如下:首先提取训练图像和查询图像的SIFT特征,并利用M种哈希算法对训练图像进行初始哈希编码;然后利用集成学习中的一致性约束准则对初始哈希编码结果进行再学习,得到集成哈希映射矩阵;最后重新对训练图像和查询图像进行集成哈希编码,并在集成哈希编码的基础上通过计算查询图像与训练图像之间的汉明距离来进行快速检索。本发明专利技术中的集成哈希编码能够同时融合不同哈希算法的特点和优势,解决了单一哈希算法判别力不足和适用范围的局限性问题,从而使得图像的快速检索更加准确和高效。

【技术实现步骤摘要】

本专利技术涉及基于内容的图像检索方法,特别涉及一种基于集成哈希编码的快速图 像检索方法,属于数字图像检索

技术介绍
随着多媒体网络技术的发展,互联网上的图像资源呈爆炸式增长,使得用户很难 在浩如烟海的数据中找到真正感兴趣的信息。因此,如何对海量的图像进行快速有效的分 析和检索成了一个非常具有挑战性的任务。传统的基于内容的图像检索技术往往都是通过 提取图像的底层特征进行穷举比对,但因其比较过程的时间复杂度是线性的,无法在大规 模网络图像数据上进行扩展和应用,并且由于图像的底层视觉特征动辄成千上万维,许多 图像检索应用还会遇到维数灾难的问题,如何对如此庞大的原始数据进行存储也是一个巨 大瓶颈。 过去的十年中,研宄者们对图像的快速检索技术进行了详细研宄。其中,基于哈希 编码的图像搜索方法取得了巨大成功。该类算法通过将图像表示成低维的二进制编码向量 来完成近似近邻搜索。利用二进制编码进行图像的近似近邻搜索是极其快速的,其原因在 于:(1)图像的编码向量是高度压缩的,可以将其全部载入内存之中;(2)编码之间的汉明 (Hamming)距离通过按位的异或操作便可得到,因此该计算过程是非常高效的(如今,一台 普通的台式机在几毫秒之内就可以完成数百万汉明距离的计算)。 目前,传统的图像哈希编码算法主要分为非数据依赖和数据依赖两种方案。 其中一种非常著名的非数据依赖哈希算法便是局部敏感哈希(LocalitySensitive Hashing,LSH),但是其投影向量的随机性导致其编码效率并不高,它往往需要构建具有 很长编码长度的多个哈希表才能获得较为理想的效果。近年来,研宄者们将研宄重点 转移到数据依赖的哈希算法上来,试图通过机器学习的方法代替随机投影来寻找更好 的数据依赖哈希函数,如基于深度学习网络的限制玻尔兹曼机(RestrictedBoltzmann Machines,RBMs)和基于谱图分割的谱哈希(SpectralHashing,SH)算法等。RBMs算法通 过神经网络模型逐层对图像的原始特征进行降维和学习,并最终得到一个紧致的二进制编 码。SH算法则通过构建拉普拉斯特征图并利用主成分分析(PCA)方法提取其特征向量对 原始图像进行哈希编码。但是上述方法都是基于单一的图像底层视觉特征信息进行哈希 编码,无法全面地表达图像丰富的内容信息。后续的研宄,如多特征哈希算法(Multiple FeatureHashing,MFH)和多源信息合成哈希算法(CompositeHashingwithMultiple InformationSources,CHMIS)等,又在多种特征信息的融合等方面对数据依赖哈希算法进 行了相关的拓展。虽然上述哈希算法是针对问题的不同角度提出,都具有各自的一些特点 和优越性,但它们往往只在某些特定的设置条件或者数据库上有效,范围扩展性较差。此 外,鉴于网络图像数据特征的多样性和结构的复杂性,目前传统的基于单一哈希编码的图 像检索方法已无法满足实际应用中对于快速图像检索的准确率的需求。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种基于集成哈希编码的快速图像 检索方法。本专利技术的特点在于能够充分利用不同哈希算法的特点,融合不同哈希算法的编 码优势,通过一致性约束准则更有效地进行集成哈希编码的学习,从而提高快速图像检索 方法的准确率和普适性。 本专利技术的技术方案是:,对数据库中 的训练图像和查询图像分别提取其SIFT特征并利用K-均值聚类将其量化表示成特征向量 的形式,利用不同的图像哈希编码算法对训练图像的特征向量进行初始哈希编码,然后在 不同算法得到的初始哈希编码基础上分别计算训练图像之间的相似度矩阵,并通过集成学 习算法的一致性约束准则学习得到新的集成哈希映射矩阵,最后利用集成哈希映射矩阵对 所有训练图像和查询图像的特征向量重新进行集成哈希编码,并在集成哈希编码的基础上 通过计算查询图像与训练图像之间的汉明距离来进行快速检索。其具体步骤如下: (1)给定数据库,将其分为训练图像数据库和查询图像数据库,对每一幅训练图像 ti(1彡i彡n)和查询图像Uj (1彡j彡q)分别提取SIFT特征并利用K-均值聚类将其量 化表示为d维的特征向量,其中n和q分别为训练图像和查询图像的数量,则所有训练图像 的特征向量可以组成一个训练图像特征向量库X= T,其中X为nXd维的矩 阵,X的每一行Xi分别为相应训练图像ti的特征向量,所有查询图像的特征向量可以组成 一个查询图像特征向量库Y=Iiy1,y2, . . .,yq]T,其中Y为qXd维的矩阵,Y的每一行yj分 别为相应查询图像Uj的特征向量。 (2)选取现有的M种不同图像哈希算法对训练图像的特征向量库X分别进行初始 哈希编码,得到的初始哈希编码矩阵分别记为HfflOn= 1,…,M),其中是 一个维度为IiXrm、元素取值为-1或者1的矩阵,每一行代表一幅训练图像的初始哈希编 码,n为训练图像总数,为第m种哈希算法的编码长度。 ⑶从训练图像的特征向量库X中随机按行挑选k幅图像得到一个子矩阵X',维 度是kXd,同时对应地从每一个初始哈希编码矩阵Hm中分别按行随机选取一个子矩阵H' m, 维度是kXrm,在每一种哈希算法的初始哈希编码子矩阵H'm基础上,通过向量的内积来计 算两幅训练图像的初始哈希编码之间的相似度,其中第m种哈希算法下的训练图像的初始 哈希编码之间的相似度计算公式为:【主权项】1. ,其特征在于:具体包括以下步骤: (1) 给定数据库,将其分为训练图像数据库和查询图像数据库,对每一幅训练图像 ti (1彡i彡η)和查询图像Uj (1彡j彡q)分别提取SIFT特征并利用K-均值聚类将其量 化表示为d维的特征向量,其中η和q分别为训练图像和查询图像的数量,则所有训练图像 的特征向量可以组成一个训练图像特征向量库X= T,其中X为nXd维的 矩阵,X的每一行Xi分别为相应训练图像t i的特征向量,所有查询图像的特征向量可以组 成一个查询图像特征向量库Y = T,其中Y为qXd维的矩阵,Y的每一行yj 分别为相应查询图像U j的特征向量; (2) 选取现有的M种不同图像哈希算法对训练图像的特征向量库X分别进行初始哈希 编码,得到的初始哈希编码矩阵分别记为Η>= 1,*··,Μ),其中…,ICf是一 个维度为nXrm、元素取值为-1或者1的矩阵,每一行代表一幅训练图像的初始哈希编码, η为训练图像总数,rm为第m种哈希算法的编码长度; (3) 从训练图像的特征向量库X中随机按行挑选k幅图像得到一个子矩阵X',维度是 kX d,同时对应地从每一个初始哈希编码矩阵Hm中分别按行随机选取一个子矩阵H' m,维度 是kXrm,在每一种哈希算法的初始哈希编码子矩阵H' m基础上,通过向量的内积来计算两 幅训练图像的初始哈希编码之间的相似度,其中第m种哈希算法下的训练图像的初始哈希 编码之间的相似度计算公式为:(1) 式中,Sm为第m种哈希算法下的训练图像的初始哈希编码相似度矩阵,维度是kXk,S m 中的每一个元素纪表示第i幅训练图像与第j幅训练图像在第m种哈希算法下的相似度 数值(1 < i &本文档来自技高网
...

【技术保护点】
一种基于集成哈希编码的快速图像检索方法,其特征在于:具体包括以下步骤:(1)给定数据库,将其分为训练图像数据库和查询图像数据库,对每一幅训练图像ti(1≤i≤n)和查询图像uj(1≤j≤q)分别提取SIFT特征并利用K‑均值聚类将其量化表示为d维的特征向量,其中n和q分别为训练图像和查询图像的数量,则所有训练图像的特征向量可以组成一个训练图像特征向量库X=[x1,x2,...,xn]T,其中X为n×d维的矩阵,X的每一行xi分别为相应训练图像ti的特征向量,所有查询图像的特征向量可以组成一个查询图像特征向量库Y=[y1,y2,...,yq]T,其中Y为q×d维的矩阵,Y的每一行yj分别为相应查询图像uj的特征向量;(2)选取现有的M种不同图像哈希算法对训练图像的特征向量库X分别进行初始哈希编码,得到的初始哈希编码矩阵分别记为Hm(m=1,…,M),其中是一个维度为n×rm、元素取值为‑1或者1的矩阵,每一行代表一幅训练图像的初始哈希编码,n为训练图像总数,rm为第m种哈希算法的编码长度;(3)从训练图像的特征向量库X中随机按行挑选k幅图像得到一个子矩阵X’,维度是k×d,同时对应地从每一个初始哈希编码矩阵Hm中分别按行随机选取一个子矩阵H’m,维度是k×rm,在每一种哈希算法的初始哈希编码子矩阵H’m基础上,通过向量的内积来计算两幅训练图像的初始哈希编码之间的相似度,其中第m种哈希算法下的训练图像的初始哈希编码之间的相似度计算公式为:Sm=Hm,Hm,Trm---(1)]]>式中,Sm为第m种哈希算法下的训练图像的初始哈希编码相似度矩阵,维度是k×k,Sm中的每一个元素表示第i幅训练图像与第j幅训练图像在第m种哈希算法下的相似度数值(1≤i≤k,1≤j≤k),并且的值越大表示两幅图像的初始哈希编码越相似,反之则越不相似,代表矩阵H’m的转置;(4)按照下面的公式计算M种不同哈希算法下的训练图像的初始哈希编码之间的平均相似度:S=1MΣm=1MSm=1MΣm=1MHm,Hm,Trm---(2)]]>式中,S为融合了M种不同哈希算法的初始哈希编码相似度的平均相似度矩阵,维度是k×k;(5)在平均相似度矩阵S的基础上,利用集成学习算法中的一致性约束准则进行图像哈希编码的再学习,所述一致性约束准则是指由再学习得到的集成哈希编码计算得出的相似度要与M种不同哈希算法的平均相似度矩阵S相一致,具体过程通过最小化下面的目标函数实现:H^*=argminH*||H*H*Tr*-S||2---(3)]]>式中,为学习得到的集成哈希编码矩阵,每一行代表一幅训练图像的集成哈希编码,r*为集成哈希编码的长度,若集成哈希编码采用线性映射的形式,则上述目标函数可以写为:W^*=argminW*||sign(X,W*)sign(X,W*)Tr*-S||2---(4)]]>式中,为集成哈希映射矩阵,维度是d×r*,作用是将图像从特征空间映射到汉明空间,sign(.)为取符号函数;(6)对于查询图像特征向量库中的任意一幅查询图像的特征向量yj(1≤j≤q),利用集成哈希映射矩阵将其映射到汉明空间,得到其集成哈希编码hy,同时对训练图像的特征向量库X重新进行集成哈希编码,计算hy与每一幅训练图像的集成哈希编码之间的汉明距离,如果汉明距离的值小于阈值β,则把该幅训练图像作为对应查询图像uj的相似图像返回给用户。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:李鹏卢宝周任鹏
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1