一种基于位权重的二值码重排方法技术

技术编号:12135991 阅读:77 留言:0更新日期:2015-09-30 18:40
本发明专利技术一种基于位权重的二值码重排方法属于图像检索技术领域,涉及到利用图像哈希方法进行基于内容的图像检索,特别涉及到一种基于位权重的二值码重排方法。该方法对于图像库中的所有图像和查询图像,提取高维欧氏特征;利用图像哈希方法生成二值码;计算查询图像二值码和图像库中所有图像二值码之间的汉明距离,根据汉明距离从小到大进行排序,返回对应的图像作为该查询图像的搜索结果;从返回的搜索结果中选择与查询图像真正具有相似视觉内容的图像子集。该方法基于比特位重要性的权重计算方法执行过程高效,对所有类型的哈希函数生成方法都有效,在没有增加计算复杂度的同时明显提高了检索效果。

【技术实现步骤摘要】

本专利技术属于图像检索
,设及到利用图像哈希方法进行基于内容的图像检 索,特别设及到。
技术介绍
通常,大规模图像捜索系统包含两个关键因素:有效的图像特征表示和快速的捜 索机制。一般而言,高质量的捜索结果更多的是依赖于有力的图像特征。对于快速的捜索 机制该个因素,因为现有的图像特征都是高维的,图像库的规模都比较大,将图像库中每个 样本与查询图像一一进行对比非常耗时。 利用图像哈希技术将高维的图像特征映射成简洁的二值哈希码后,可W利用"异 或"操作在汉明空间中快速地计算查询图像和图像库每个图像之间的汉明距离,W此度量 它们之间的相似程度。汉明码利用异或计算统计两组二值码中不同码值的数量,因此,汉明 距离的范围在0到K,K是哈希码的比特数。在大规模应用中,汉明空间的维数,即哈希码的 比特数通常是小于100的,因此能够减小内存消耗,同时可避免较低的召回率。由于汉明距 离的取值为整数,导致无法对与查询图像汉明距离相等的返回图像进行排序。对于K比特 的哈希码,有C[个不同的哈希码与查询图像之间的距离等于i,i>0。W 48比特哈希码 为例,有1128种哈希码与查询哈希码之间的汉明距离等于2,从而使得成千上万的图像在 捜索结果列表中可能共享相同的排序。 对于某一取值的汉明距离,图像库中可能对应上百幅图像,如何对它们进行排序 W便反映其与查询图像视觉内容的相似性?针对该一问题,研究根据汉明距离捜索后图 像的重排。目前比较经典的二值码重排方法是QsRank技.化ang, L.化ang, and H.化um. QsRank:Query-Sensitive Hash Code Ranking for Efficient e-neighbor Search. In proceedings of CVPR,2012]。根据查询图像邻域内图像取某个哈希码的概率来衡量其与 查询图像的相似度,概率越大,其相似度越高,按概率对图像进行重排。QsRank方法不是利 用图像哈希码之间的汉明距离对图像进行重排,破坏了哈希码检索速度快的优势。而且,虽 然利用QsRank方法对初始检索结果重排后会提高捜索的准确率,但提高的幅度不大。国 家专利技术专利"面向图像检索的自适应哈希重排方法",申请号;201310123163,专利技术人孔祥维 等。该方法将图像库的语义类别信息与哈希函数在每个维度进行关联,通过为每个语义类 训练类权重向量,为查询图像计算自适应权重,从而构造加权汉明距离用于图像重排。该方 法需要已知图像库中的类别信息,对每个类别进行训练获得其类权重向量。当图像库中的 类别数目较少时,效果优于QsRank的方法;随着类别数目增多,计算复杂度会随之增加。
技术实现思路
本专利技术为克服现有技术的缺陷,专利技术,首先根 据查询图像和图像库中所有图像的哈希码,计算它们之间的汉明距离,并对其按照从小到 大进行排序,作为对查询图像的初始排序结果;然后根据初始排序结果中的正样本确定哈 希函数不同比特位的重要性,并为其赋予不同的权重值;旨在解决利用二值码进行大规模 图像检索时返回图像的排序问题,提高检索的准确率和效率。 本专利技术的技术方案是,其特征是,该方法对于 图像库中的所有图像和查询图像,提取高维欧氏特征;利用图像哈希方法生成二值码;计 算查询图像二值码和图像库中所有图像二值码之间的汉明距离,根据汉明距离从小到大进 行排序,返回对应的图像作为该查询图像的捜索结果;从返回的捜索结果中选择与查询图 像真正具有相似视觉内容的图像子集,称作查询图像的"正样本";通过对比查询图像每位 二值码与"正样本"每位二值码之间的异同,确定查询图像不同比特位二值码的重要性,为 重要的比特位赋予较高的权重,为不重要的比特位赋予较小的权重;根据权重向量,重新计 算查询图像二值码和捜索返回图像二值码的加权汉明距离,根据加权汉明距离对返回图像 进行重排;具体实现步骤包括; (1)给定含有N幅图像的图像库I = {I。12, . . .,U和查询图像q ;[000引 (2)对图像库中的所有图像I和查询图像q,利用特征提取算法,提取图像的d维 欧氏特征;图像库I中所有图像的特征向量组成图像特征库F = (fi,f2, . . .,,其中, fiG Rdxi,F G Rdxw,R表示实数集,特征库中的每个特征向量和图像库中的每幅图像 I。1《KN,一一对应;查询图像q的特征向量为Q G Rdxi; (3)对图像特征库F中的每个特征向量和查询图像特征向量Q,采用图像哈希方 法分别生成维数为K的二值哈希码,表示为HF =化fi,册2,. . .,Hf;}和册,其中HfiG {0, 1} KX1是KX1维的列向量,向量的每个元素取值为0或者1;册G {0, U KX1是KX1维的列向 量,向量的每个元素为0或者1 ; (4)计算查询图像q和图像li之间的汉明距离吗別:[001引其中,册k表示册的第k位二值哈希码;Hf\k表示Hfi的第k位二值哈希码;对每 幅图像与查询图像之间的汉明距离按照从小到大进行排序,选择排序靠前的R幅图像作为 查询图像Q的捜索结果; (5)从第4步返回的R幅图像中选择M,M<R幅与查询图像q相似的图像,称 为"正样本"集合;假设"正样本"集合中第m,l幅图像的二值哈希码记为;与册对应的权重向量记为W = {wi,. . .,wj,其中Wk表示第k位权 重值,且初始值设为1 ;采用迭代法确定Wk,迭代次数等于M ;对于第m,1《m《M次迭代,Wk 的值更新为: 其中,0<e <1,是"正样本"集合中第m幅图像的第k位二值哈希码;(6)根据权重向量W={wi,.. . , wJ,计算计算查询图像q和图像1。1《i<N之间 的加权汉明距离; (7)按照从小到大的顺序对加权汉明距离进行排序,其对应的图像即可作为检索 后的重排结果. 本专利技术的效果和益处是;本专利技术。首先根据查 询图像和图像库中所有图像的哈希码,计算它们之间的汉明距离,并对其按照从小到大进 行排序,作为对查询图像的初始排序结果;然后根据初始排序结果中的正样本确定哈希函 数不同比特位的重要性,并为其赋予不同的权重值;在此基础上,计算加权汉明距离,并依 据此对返回结果进行重新排序。该种基于比特位重要性的权重计算方法执行过程高效,弥 补了哈希函数对比特位"一视同仁"的缺陷。而且,对所有类型的哈希函数生成方法都有效, 在没有增加计算复杂度的同时明显提高了检索效果。【附图说明】 图1是本专利技术提出的的流程示意图。 图2是本专利技术分析的微软商品图像库中与查询图像不同汉明距离所对应的图像 库图像数目统计图,其中,横坐标是返回图像与查询图像之间的汉明距离,纵坐标是对应汉 明距离的返回图像的数目。 图3是本专利技术和其他方法在哈希比特数为64时,对丽1ST图像库初始返回的前 1000幅图像重排后的准确率图,其中,Line 1是本专利技术提出的方法的重排准确率曲线, Line 2是经典的QsRank方法的重排准确率,Line 3是未重排之前的准确率。 图4是本专利技术和其它方法对不同查询图像的重排结果图。【具体实施方式】 W下结合技术方案和附图详细叙述本专利技术的【具体实施方式】。 W微软商品图像库为例,随本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/CN104951559.html" title="一种基于位权重的二值码重排方法原文来自X技术">基于位权重的二值码重排方法</a>

【技术保护点】
一种基于位权重的二值码重排方法,其特征是,该方法对于图像库中的所有图像和查询图像,提取高维欧氏特征;利用图像哈希方法生成二值码;计算查询图像二值码和图像库中所有图像二值码之间的汉明距离,根据汉明距离从小到大进行排序,返回对应的图像作为该查询图像的搜索结果;从返回的搜索结果中选择与查询图像真正具有相似视觉内容的图像子集,称作查询图像的正样本;通过对比查询图像每位二值码与正样本每位二值码之间的异同,确定查询图像不同比特位二值码的重要性,为重要的比特位赋予较高的权重,为不重要的比特位赋予较小的权重;根据权重向量,重新计算查询图像二值码和搜索返回图像二值码的加权汉明距离,根据加权汉明距离对返回图像进行重排;具体实现步骤如下:1).给定含有N幅图像的图像库I={I1,I2,...,IN}和查询图像q;2).对图像库中的所有图像I和查询图像q,利用特征提取算法,提取图像的d维欧氏特征;图像库I中所有图像的特征向量组成图像特征库F={f1,f2,...,fN},其中fi∈Rd×1,F∈Rd×N,R表示实数集,特征库中的每个特征向量fi,和图像库中的每幅图像Ii,1≤i<N,一一对应;查询图像q的特征向量为Q∈Rd×1;3).对图像特征库F中的每个特征向量fi和查询图像特征向量Q,采用图像哈希方法分别生成维数为K的二值哈希码,表示为HF={Hf1,Hf2,...,HfN}和HQ,其中Hfi∈{0,1}K×1是K×1维的列向量,向量的每个元素取值为0或者1;HQ∈{0,1}K×1是K×1维的列向量,向量的每个元素为0或者1;4).计算查询图像q和图像Ii之间的汉明距离其中,HQk表示HQ的第k位二值哈希码;Hfi,k表示Hfi的第k位二值哈希码;对每幅图像与查询图像之间的汉明距离按照从小到大进行排序,选择排序靠前的R幅图像作为查询图像Q的搜索结果;5).从第4步返回的R幅图像中选择M,M<R幅与查询图像q相似的图像,称为“正样本”集合;假设“正样本”集合中第m,1≤m≤M幅图像的二值哈希码记为与HQ对应的权重向量记为W={w1,...,wK},其中wk表示第k位权重值,且初始值设为1;采用迭代法确定wk,迭代次数等于M;对于第m,1≤m≤M次迭代,wk的值更新为:其中,0<ε<1,是“正样本”集合中第m幅图像的第k位二值哈希码;6).根据权重向量W={w1,...,wK},计算计算查询图像q和图像Ii,1≤i<N之间的加权汉明距离7).按照从小到大的顺序对加权汉明距离进行排序,其对应的图像即可作为检索后的重排结果。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:付海燕孔祥维
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1