图像检索的视觉重排序方法、系统、设备及存储介质技术方案

技术编号：32460449 阅读：13 留言：0更新日期：2022-02-26 08:47

本发明专利技术公开了一种图像检索的视觉重排序方法、系统、设备及存储介质，相关方法包括：获取初次检索结果列表，选取排序靠前的k个图像进行重排序，称为top

全部详细技术资料下载

【技术实现步骤摘要】
图像检索的视觉重排序方法、系统、设备及存储介质

[0001]本专利技术涉及图像检索
，尤其涉及一种图像检索的视觉重排序方法、系统、设备及存储介质。

技术介绍

[0002]随着互联网的飞速发展和移动智能终端的普及，多媒体数据尤其是视觉数据呈现出爆炸式的增长。数十亿人在网上共享和浏览照片和视频。为了让用户能够快速地从这些多媒体数据中找到自己感兴趣的内容，多媒体检索技术受到了广泛的关注并且得到了快速的发展。在海量的数据面前，如何设计高效的检索算法一直是国内外学术届与工业界的研究热点。
[0003]图像作为多媒体数据的重要组成部分，已经成为了信息检索领域关注的重点。不同于早期的基于文本的图像检索技术，基于内容的图像检索将图像的视觉内容作为搜索的依据，更加直接的表达了用户的搜索意图，同时也可以作为文本搜索的重要补充来进一步提高搜索的性能。
[0004]图像检索任务是根据给定的查询图像在大规模图像数据库中检索得到与查询图像相关的图像。然而原始的检索结果效果可能差强人意，而图像检索重排序是一种能够有效提升检索性能的后处理方法。
[0005]检索重排序主要包括三类方法：扩展查询、基于K近邻的重排方法、基于空间验证的重排方法。
[0006]1)扩展查询方法将检索结果列表中靠前的结果的特征与查询图像特征相加，从而得到一个新的查询特征，并以此进行二次检索。该方法的缺陷在于：需要做二次检索甚至是多次检索，当数据库规模很大时，该方法会严重影响图像检索的效率。
[0007]2)基于K紧邻的重排方法通...

【技术保护点】

【技术特征摘要】
1.一种图像检索的视觉重排序方法，其特征在于，包括：获取初次检索结果列表，选取排序靠前的k个图像进行重排序，称为top
‑
k图像，选取排序靠前的L个图像作为锚点图像；分别计算每一top
‑
k图像与锚点图像的相似性，获得相应的关联特征；使用Transformer的编码器结构聚合所有top
‑
k图像的关联特征，并为每一top
‑
k图像更新得到一个新的关联特征；利用每一top
‑
k图像的新的关联特征，计算与查询图像之间的相似性，并根据相似性大小获得重排序列表。2.根据权利要求1所述的一种图像检索的视觉重排序方法，其特征在于，所述分别计算每一top
‑
k图像与锚点图像的相似性，获得相应的关联特征表示为：其中，表示单个top
‑
k图像与单个锚点图像的相似性，l＝1，...，L。3.根据权利要求1所述的一种图像检索的视觉重排序方法，其特征在于，所述使用Transformer的编码器结构聚合所有top
‑
k图像的关联特征，并为每一top
‑
k图像更新得到一个新的关联特征包括：将所有top
‑
k图像的关联特征构成的关联特征序列A＝{a1，...，a
k
}经过全连接层后，输入至Transformer的编码器结构，所述Transformer编码器能够动态的学习聚合每个top
‑
k图像的权值，输出更新得到的新的关联特征序列Y＝{y1，...，y
k
}，其中，a、y分别为更新前、后的关联特征，角标为图像序号。4.根据权利要求1所述的一种图像检索的视觉重排序方法，其特征在于，所述查询图像为初次检索结果列表中排序第1的图像，所述top
‑
k图像与锚点图像各自构成的图像集合中均包含所述查询图像；在训练阶段，利用查询图像的新的关联特征与其他top
‑
k图像的新的关联特征的相似性计算对比损失函数以及利用top
‑
k图像更新前后的关联特征计算最小均方误差损失函数利用对比损失函数与最小均方误差损失函数构造最终的损失函数，表示为：其中，λ为损失项的权重系数。5.根据权利要求1所述的一种图像检索的视觉重排序方法，其特征在于，所述计算对比损失函数表示为：表示为：其中，1()代表指示函数，若r1与r
i
相关，则指示函数等于1，否则等于0，τ是温度系数，sim()为相似性函数；y1是查询图像r1的新的关联特征，y
i
表示top
‑
k图像r
i
的新的关联特征，2≤i≤k...

【专利技术属性】
技术研发人员：周文罡，李厚强，欧阳剑波，吴晖，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人