The present invention provides a method and device for obtaining image representation. The first visual feature of the target image is extracted; the coding sequence is obtained by coding the first visual feature according to the pre-obtained visual dictionary; the visual dictionary is obtained by clustering at least twice according to the training image; and the coding sequence is simplified to obtain the target image. The first image represents vectors. The embodiment of the invention makes full use of the visual features of the training image, so the precision of the image retrieval can be improved, and the application flexibility of the image retrieval system can be improved.
【技术实现步骤摘要】
一种获得图像表示的方法和装置
本专利技术涉及图像检索
,特别是涉及一种获得图像表示的方法和装置。
技术介绍
基于内容的大规模图像检索,其基本概念是给定一张图像,可以从特定图像库中检索出与给定图像相同或相似的图像或图像集合。图像检索技术已经成为一种重要的信息检索方式,商用的图像检索系统展现了极为可观的应用前景。图像检索的主要流程包括提取图像特征,构建图像表达,判断图像相似性等。目前针对视觉特征的算法模型存在视觉特征利用不充分、检索精度不均衡等问题,影响了图像检索系统的应用灵活性。
技术实现思路
本专利技术提供一种获得图像表示的方法和装置,以解决现有技术视觉特征利用不充分的问题。为了解决上述问题,本专利技术公开了一种获得图像表示的方法,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。可选地,所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列,包括:根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析获得的视觉单词。可选地,在所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列之前,所述方法还包括:获得所述视觉词典;所述获得所述视觉词典,包括:提取所述训练图像的多个第二视觉特征;对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;根据所述第一视觉词 ...
【技术保护点】
1.一种获得图像表示的方法,其特征在于,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。
【技术特征摘要】
1.一种获得图像表示的方法,其特征在于,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。2.根据权利要求1所述的方法,其特征在于,所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列,包括:根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析获得的视觉单词。3.根据权利要求2所述的方法,其特征在于,在所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列之前,所述方法还包括:获得所述视觉词典;所述获得所述视觉词典,包括:提取所述训练图像的多个第二视觉特征;对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;根据所述第一视觉词典,分别查找各所述第二视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第一残差向量;对各所述第一视觉单词对应的所述第一残差向量进行第二聚类分析,获得各所述第一视觉单词对应的由k2个第二视觉单词构成的第二视觉词典;其中,k1和k2为正整数。4.根据权利要求3所述的方法,其特征在于,所述确定各所述第一视觉单词对应的第一残差向量,包括:分别计算各所述第二视觉特征与查找到的所述第一视觉单词的残差向量;根据计算得到的所述残差向量,确定各所述第一视觉单词对应的所述第一残差向量。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,包括:根据所述第一视觉特征、所述第一视觉词典和所述第二视觉词典,得到各所述第一视觉单词对应的第一长矢量;根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一视觉特征、所述第一层视觉词典和所述第二层视觉词典,得到各所述第一视觉单词对应的第一长矢量,包括:根据所述第一视觉词典,分别查找各所述第一视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第二残差向量;针对所述第一视觉单词对应的所述第二视觉词典,计算所述k2个第二视觉单词与所述第二残差向量的残差向量,并对各所述第二视觉单词对应的残差向量求和,得到k2个第三残差向量;按照所述k2个第二视觉单词在所述第二视觉词典中的索引顺序,将所述k2个第三残差向量组合为所述第一视觉单词对应的所述第一长矢量。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量,包括:按照所述k1个第一视觉单词在所述第一视觉词典中的索引顺序,将所述第一视觉单词对应的所述第一长矢量组合为所述第二长矢量。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:获取测试图像的第二图像表示向量;计算所述第二图像表示向量与多个检索图像的图像表示向量的相似度;查找所述相似度满足预设条件的目标检索图像;比对所述测试图像和所述目标检索图像,输出测试结果。9.一种获得图像表示的装置,其特征在于,所述装置包括:视觉特征提取模块,...
【专利技术属性】
技术研发人员:马福强,崔利阳,薛鸿臻,刘小磊,
申请(专利权)人:京东方科技集团股份有限公司,北京京东方光电科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。