一种高效的图像检索结果质量评价方法技术

技术编号:11062113 阅读:200 留言:0更新日期:2015-02-19 09:09
本发明专利技术公开了一种高效的图像检索结果质量评价方法,该方法包括:根据输入的文本查询Q返回的检索图片列表L重建一个视觉查询Q'来表征返回的检索图片列表L所蕴含的视觉主题;将重建的视觉查询Q'输入至一个基于内容的图像检索系统,获得一个对应的检索图片列表L';分别建立检索图片列表L与L'的语言模型,并计算两个语言模型之间的KL距离,将该距离值作为本次检索结果的质量评价结果。通过采用本发明专利技术公开的方法,能够高效、准确的对图像检索性能进行预测。

【技术实现步骤摘要】

本专利技术涉及图像检索
,尤其涉及一种高效的图像检索结果质量评价方 法。
技术介绍
图像检索结果质量评价是图像检索领域研究的前沿问题。该技术试图在没有相关 信息(即未知检索返回结果与查询的相关程度)的情况下,评估检索系统对某一查询其返 回结果的质量高低程度。检索结果质量评价能够同时对用户和检索系统产生积极的影响。 从用户的角度讲,该技术可以起到桥梁的作用,使得用户能够与检索系统互动,以便获得更 好地检索结果;对检索系统来说,在理想情况下,如果一个检索系统能够自动预测某一查询 的性能,那么它就可以自动地调整其参数或者算法来适应不同的查询,从而提供更好的检 索性能。 相对于长期在检索模型上的探索,图像检索查询性能预测的研究还处于初级阶 段。最初关于图像检索查询性能预测的研究是基于文本信息的,主要通过研究检索返回图 片周围的文本信息(上下文文本,图片URL等)与输入查询文本之间的相互关系,例如词汇 的具体性、一般性、歧义性和生动性等,来评估检索结果质量。这些研究主要存在一个重大 问题:忽略了图片的视觉内容而仅仅考虑文本信息,然而文本信息往往包含很多噪声。 目前大部分研究还是基于检索返回图片之间潜在的视觉统计特性出发的。这类方 法的主要做法是先将图片表示成由视觉单词组成的文档,然后借用文本分析方法统计一些 有关返回图片之间的潜在特性,例如计算由返回图片构成的语言模型和由整个图片集构成 的语言模型两者的概率分布差异性;估计返回图片之间的空间一致性;研究针对检索返回 列表排名靠前的图片间视觉一致性;以及研究返回图片的视觉相似性分布等等,最后将这 些得到的统计特性值作为图像检索结果质量的评估值。上述方法的研究在一定程度上极大 地推动了图像检索查询性能预测技术的发展。但是这些方法仍然存在不足之处,它们缺乏 将用户输入文本查询考虑在内,因而也没有对用户输入查询与返回图片之间的潜在关系进 行很好得研究。
技术实现思路
本专利技术的目的是提供,能够高效、准确的 对图像检索性能进行预测。 本专利技术的目的是通过以下技术方案实现的: -种高效的图像检索结果质量评价方法,该方法包括: 根据输入的文本查询Q返回的检索图片列表L重建一个视觉查询Q'来表征返回 的检索图片列表L所蕴含的视觉主题; 将重建的视觉查询Q'输入至一个基于内容的图像检索系统,获得一个对应的检 索图片列表L' ; 分别建立检索图片列表L与L'的语言模型,并计算两个语言模型之间的KL距离, 将该距离值作为本次检索结果的质量评价结果。 进一步的,所述根据输入的文本查询Q返回的检索图片列表L重建一个视觉查询 Q'来表征返回的检索图片列表L所传达的视觉主题包括: 首先,采用视觉词袋模型和向量空间模型将检索图片列表L = U1, I2,…,IN}中的 图片Ii表示成一组向量,包括:采用密集采样尺度不变特征转换技术Dense SIFT提取每一 图片Ii的SIFT特征;然后,使用聚类算法K-means将得到的所有SIFT特征聚成包含S个视 觉单词的码本;按照最近邻准则将所有SIFT特征量化到对应的视觉单词上;再使用TF权 重机制来衡量每个视觉单词在每张图片中的重要性;最后,采用向量空间模型将图片I i表 示一组向量,其表达式为:本文档来自技高网
...
一种高效的图像检索结果质量评价方法

【技术保护点】
一种高效的图像检索结果质量评价方法,其特征在于,该方法包括:根据输入的文本查询Q返回的检索图片列表L重建一个视觉查询Q'来表征返回的检索图片列表L所蕴含的视觉主题;将重建的视觉查询Q'输入至一个基于内容的图像检索系统,获得一个对应的检索图片列表L';分别建立检索图片列表L与L'的语言模型,并计算两个语言模型之间的KL距离,将该距离值作为本次检索结果的质量评价结果。

【技术特征摘要】
1. 一种高效的图像检索结果质量评价方法,其特征在于,该方法包括: 根据输入的文本查询Q返回的检索图片列表L重建一个视觉查询Q'来表征返回的检 索图片列表L所蕴含的视觉主题; 将重建的视觉查询Q'输入至一个基于内容的图像检索系统,获得一个对应的检索图 片列表L' ; 分别建立检索图片列表L与L'的语言模型,并计算两个语言模型之间的KL距离,将该 距离值作为本次检索结果的质量评价结果。2. 根据权利要求1所述的方法,其特征在于,所述根据输入的文本查询Q返回的检索图 片列表L重建一个视觉查询Q'来表征返回的检索图片列表L所传达的视觉主题包括: 首先,采用视觉词袋模型和向量空间模型将检索图片列表L= U1, I2,...,IN}中的图 片Ii表示成一组向量,包括:采用密集采样尺度不变特征转换技术Dense SIFT提取每一图 片Ii的SIFT特征;然后,使用聚类算法K-means将得到的所有SIFT特征聚成包含S个视 觉单词的码本;按照最近邻准则将所有SIFT特征量化到对应的视觉单词上;再使用TF权 重机制来衡量每个视觉单词在每张图片中的重要性;最后,采用向量空间模型将图片Ii表 示一组向量,其表达式为Xi中每维向量通过下式进行计算: X1j = tf :, / = 1,2,...,5 其中,tfj表示视觉单词Wj在图片Ii中出现的频率; 然后,构建一个用于表示视觉单词%在检索图片列表L中的概率分布的语言模型,表 示为: P(WjIl) = SP(WjIli)P(IiIL); 其中,PWlIi)表示视觉单词%在图片Ii中出现的频率,所述P(AlIi)为 tf」的归一化表不;P (Ii I L)表不图片Ii在检索图片列表L中的重要性,表不为再根据构建的语言模型估算每一视觉单词%在检索图片列表L中的重要性得分,其公 式为:其中,P (w」C)表示视觉单词%在整个数据集C中出现的频率; 最后,按...

【专利技术属性】
技术研发人员:田新梅贾强槐
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1