The invention discloses a double compensation multi table hash image retrieval method, which comprises the following steps: 1) image feature extraction and classification of information processing; 2) hash table training; 3) according to the hash table will be mapped to the feature space and the Hamming weight calculation category; 4) according to the query, calculate the Hamming distance, return query results 5); re sorting operation. The method of the invention can obtain fast query response in image retrieval, the memory overhead is small, the characteristics of high performance of query, and a greater improvement in the image retrieval table of Hashi, and to overcome the many shortcomings of Hashi requires additional overhead.
【技术实现步骤摘要】
一种双重补偿的多表哈希图像检索方法
本专利技术涉及图像检索的
,尤其是指一种双重补偿的多表哈希图像检索方法。
技术介绍
随着互联网的发展,多媒体文件数量迅速增长,人们上传的图像也成了一个非常大的规模。这对图像检索问题有了非常大的挑战。传统的基于树形结构的检索方法,一般都需要许多额外的辅助空间,这甚至超过原始的图像数据的大小;而且一旦图像的特征维数很大的时候,基于树形结构的方法性能将会退化,甚至到了线性检索的复杂度。相反,基于哈希的图像检索方法始终拥有超线性的时间复杂度,而且需要的辅助空间也十分令人满意。对于拥有F个哈希位的基于哈希的图像检索方法,首先将图像映射至低维的汉明空间。对于每一个图像都使用F个哈希位代表,并使用这些二进制位的汉明距离来衡量图像之间的相似度。对于一个良好的方法而言应该保证相似的图像拥有小的汉明距离,不相似的图像拥有大的汉明距离。本方法的查询过程如下:对于一个查询图像,本方法首先将图像映射至汉明空间,并计算查询图像与数据库中的图像之间的汉明距离,返回汉明距离较小的图像作为查询结果(由使用者设置的阈值决定)。由于哈希位可以用二进制位表示,汉明距离可以使用机器内置的位操作计算,因此基于哈希的图像检索方法可以使用较少的辅助内存,达到较快的检索速度,至于检索的准确度,则由方法的设计者保证了。在基于哈希的图像检索领域,按照是否使用语义标签而言,可以分为有监督哈希,半监督哈希,无监督哈希三类。有监督哈希方法利用标签信息来训练哈希函数,要求数据库提供完整的标签信息;半监督哈希也利用了数据库中的标签信息,但容忍部分数据是无标签的;无监督哈希指的是 ...
【技术保护点】
一种双重补偿的多表哈希图像检索方法,其特征在于,包括以下步骤:1)图像特征提取和类别信息处理;2)哈希表训练;3)根据哈希表将图像特征映射至汉明空间与类别权重计算;4)根据查询,计算汉明距离,返回查询结果;5)再排序操作。
【技术特征摘要】
1.一种双重补偿的多表哈希图像检索方法,其特征在于,包括以下步骤:1)图像特征提取和类别信息处理;2)哈希表训练;3)根据哈希表将图像特征映射至汉明空间与类别权重计算;4)根据查询,计算汉明距离,返回查询结果;5)再排序操作。2.根据权利要求1所述的一种双重补偿的多表哈希图像检索方法,其特征在于:在步骤1)中,提取图像特征,并进行标签信息的处理,具体步骤如下:1.1)使用gist算法提取图像特征,获取图像特征矩阵X,X=d×n,n为数据集图片数量,d为特征维数,对X矩阵进行中心化操作;1.2)将图像分成两个子集:有语义标签的数据划分成有标签的图像子集,其特征矩阵为Xl,无语义标签的数据划分成无标签的图像子集,其特征矩阵为Xu;1.3)对于无标签数据集,计算其伪标签:对于每一个无标签图像,与所有的有标签图像计算gist特征的欧式距离,并取欧氏距离最近的20%的图像来对该无标签图像的可能的标签进行投票,取数量最多的标签作为该图像的伪标签,如果出现多个标签的数量相同,则任取一个。3.根据权利要求1所述的一种双重补偿的多表哈希图像检索方法,其特征在于,在步骤2)中,进行哈希表训练,具体如下:获取m个哈希表,其中m是哈希表的数量,定义S矩阵,大小为n’×n’,n’为有标签图像的数量,初始化为:Sij=1时说明图像对(xi,xj)具有相同标签,Sij=-1时说明图像对(xi,xj)不具有相同标签;定义F为单个哈希表中哈希函数的数量,包括内外两重循环:2.1)在这一部分说明外层循环的机制:对于当前的第t个哈希表,t=1,…m,具体如下:2.1.1)如果t=1,则直接进入内层循环,否则计算第t-1个哈希表的错误并更新S矩阵,错误指的是:对于有标签的图像,具有相同标签的两个图像汉明距离大于δ,或者不同标签的两个图像汉明距离小于δ,其中δ是一个汉明距离的阈值,S矩阵的更新方法如下:St+1=St+c×ΔSt式中,St指的是第t个哈希表训练时使用的权重矩阵,并初始化S1=S,c是一个参数,影响S的变化速度,ΔSt指的是权重调整的矩阵,定义如下:式中,dH(xi,xj)指的是图像(xi,xj)的汉明距离,使用第t-1个哈希表计算;2.1.2)进入第t层内层循环,计算第t个哈希表;2.1.3)如果t=m,说明m个大小为F的哈希表训练完成,终止;否则t=t+1,调至步骤2.1.1);2.2)第t层内层循环中,第k个哈希函数,k=1,…,F,首先初始化Xtr=X,具体如下:2.2.1)计算M...
【专利技术属性】
技术研发人员:吴永贤,周先成,田星,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。