一种获得图像表示的方法和装置制造方法及图纸

技术编号:19009250 阅读:70 留言:0更新日期:2018-09-22 09:06
本发明专利技术提供了一种获得图像表示的方法和装置。提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。本发明专利技术实施例充分利用了训练图像中的视觉特征,因此可以提升图像检索的精度,从而提高图像检索系统的应用灵活性。

Method and device for obtaining image representation

The present invention provides a method and device for obtaining image representation. The first visual feature of the target image is extracted; the coding sequence is obtained by coding the first visual feature according to the pre-obtained visual dictionary; the visual dictionary is obtained by clustering at least twice according to the training image; and the coding sequence is simplified to obtain the target image. The first image represents vectors. The embodiment of the invention makes full use of the visual features of the training image, so the precision of the image retrieval can be improved, and the application flexibility of the image retrieval system can be improved.

【技术实现步骤摘要】
一种获得图像表示的方法和装置
本专利技术涉及图像检索
,特别是涉及一种获得图像表示的方法和装置。
技术介绍
基于内容的大规模图像检索,其基本概念是给定一张图像,可以从特定图像库中检索出与给定图像相同或相似的图像或图像集合。图像检索技术已经成为一种重要的信息检索方式,商用的图像检索系统展现了极为可观的应用前景。图像检索的主要流程包括提取图像特征,构建图像表达,判断图像相似性等。目前针对视觉特征的算法模型存在视觉特征利用不充分、检索精度不均衡等问题,影响了图像检索系统的应用灵活性。
技术实现思路
本专利技术提供一种获得图像表示的方法和装置,以解决现有技术视觉特征利用不充分的问题。为了解决上述问题,本专利技术公开了一种获得图像表示的方法,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。可选地,所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列,包括:根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析获得的视觉单词。可选地,在所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列之前,所述方法还包括:获得所述视觉词典;所述获得所述视觉词典,包括:提取所述训练图像的多个第二视觉特征;对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;根据所述第一视觉词典,分别查找各所述第二视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第一残差向量;对各所述第一视觉单词对应的所述第一残差向量进行第二聚类分析,获得各所述第一视觉单词对应的由k2个第二视觉单词构成的第二视觉词典;其中,k1和k2为正整数。可选地,所述确定各所述第一视觉单词对应的第一残差向量,包括:分别计算各所述第二视觉特征与查找到的所述第一视觉单词的残差向量;根据计算得到的所述残差向量,确定各所述第一视觉单词对应的所述第一残差向量。可选地,所述根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,包括:根据所述第一视觉特征、所述第一视觉词典和所述第二视觉词典,得到各所述第一视觉单词对应的第一长矢量;根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量。可选地,所述根据所述第一视觉特征、所述第一层视觉词典和所述第二层视觉词典,得到各所述第一视觉单词对应的第一长矢量,包括:根据所述第一视觉词典,分别查找各所述第一视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第二残差向量;针对所述第一视觉单词对应的所述第二视觉词典,计算所述k2个第二视觉单词与所述第二残差向量的残差向量,并对各所述第二视觉单词对应的残差向量求和,得到k2个第三残差向量;按照所述k2个第二视觉单词在所述第二视觉词典中的索引顺序,将所述k2个第三残差向量组合为所述第一视觉单词对应的所述第一长矢量。可选地,所述根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量,包括:按照所述k1个第一视觉单词在所述第一视觉词典中的索引顺序,将所述第一视觉单词对应的所述第一长矢量组合为所述第二长矢量。可选地,所述方法还包括:获取测试图像的第二图像表示向量;计算所述第二图像表示向量与多个检索图像的图像表示向量的相似度;查找所述相似度满足预设条件的目标检索图像;比对所述测试图像和所述目标检索图像,输出测试结果。本专利技术实施例还公开了一种获得图像表示的装置,所述装置包括:视觉特征提取模块,用于提取目标图像的第一视觉特征;编码序列获得模块,用于根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;图像表示向量获得模块,用于对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。可选地,所述编码序列获得模块,具体用于根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析后获得的视觉单词。可选地,在所述编码序列获得模块之前,所述装置还包括:视觉词典获得模块,用于获得所述视觉词典;所述视觉词典获得模块包括:视觉特征提取子模块,用于提取所述训练图像的多个第二视觉特征;第一视觉词典获得子模块,用于对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;第一残差向量获得子模块,用于根据所述第一视觉词典,分别查找各所述第二视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第一残差向量;第二视觉词典获得子模块,用于对各所述第一视觉单词对应的所述第一残差向量进行第二聚类分析,获得各所述第一视觉单词对应的由k2个第二视觉单词构成的第二视觉词典;其中,k1和k2为正整数;所述第一残差向量获得子模块包括:第一残差向量计算单元,用于分别计算各所述第二视觉特征与查找到的所述第一视觉单词的残差向量;第一残差向量确定单元,根据计算得到的所述残差向量,确定各所述第一视觉单词对应的所述第一残差向量。可选地,所述编码序列获得模块包括:第一长矢量获得子模块,用于根据所述第一视觉特征、所述第一视觉词典和所述第二视觉词典,得到各所述第一视觉单词对应的第一长矢量;第二长矢量获得子模块,用于根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量。可选地,所述第一长矢量获得子模块包括:第二残差向量计算单元,用于根据所述第一视觉词典,分别查找各所述第一视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第二残差向量;第三残差向量计算单元,用于针对所述第一视觉单词对应的所述第二视觉词典,计算所述k2个第二视觉单词与所述第二残差向量的残差向量,并对各所述第二视觉单词对应的残差向量求和,得到k2个第三残差向量;第一长矢量获得单元,用于按照所述k2个第二视觉单词在所述第二视觉词典中的索引顺序,将所述k2个第三残差向量组合为所述第一视觉单词对应的所述第一长矢量。可选地,所述第二长矢量获得子模块,具体用于按照所述k1个第一视觉单词在所述第一视觉词典中的索引顺序,将所述第一视觉单词对应的所述第一长矢量组合为所述第二长矢量。可选地,所述装置还包括:图像表示向量获取模块,用于获取测试图像的第二图像表示向量;相似度计算模块,用于计算所述第二图像表示向量与多个检索图像的图像表示向量的相似度;目标检索图像查找单元,用于查找所述相似度满足预设条件的目标检索图像;测试结果输出单元,用于比对所述测试图像和所述目标检索图像,输出测试结果。与现有技术相比,本专利技术包括以下优点:本专利技术实施例中,提取目标图像的第一视觉特征,根据预先获得的视觉词典对第一视觉特征进行编码,获得编码序列;对编码序列进行简化处理,获得目标图像的第一图像表示向量。其中,视觉词典是依据训练图像进行至少两次聚类分析后获得的,充分利用了训练图像中的视觉特征,因此可以提升图像检索的精度,从而提高图像检索系统的应用灵活性。附图说明图1示出了本专利技术实施本文档来自技高网...
一种获得图像表示的方法和装置

【技术保护点】
1.一种获得图像表示的方法,其特征在于,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。

【技术特征摘要】
1.一种获得图像表示的方法,其特征在于,所述方法包括:提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。2.根据权利要求1所述的方法,其特征在于,所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列,包括:根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析获得的视觉单词。3.根据权利要求2所述的方法,其特征在于,在所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列之前,所述方法还包括:获得所述视觉词典;所述获得所述视觉词典,包括:提取所述训练图像的多个第二视觉特征;对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;根据所述第一视觉词典,分别查找各所述第二视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第一残差向量;对各所述第一视觉单词对应的所述第一残差向量进行第二聚类分析,获得各所述第一视觉单词对应的由k2个第二视觉单词构成的第二视觉词典;其中,k1和k2为正整数。4.根据权利要求3所述的方法,其特征在于,所述确定各所述第一视觉单词对应的第一残差向量,包括:分别计算各所述第二视觉特征与查找到的所述第一视觉单词的残差向量;根据计算得到的所述残差向量,确定各所述第一视觉单词对应的所述第一残差向量。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,包括:根据所述第一视觉特征、所述第一视觉词典和所述第二视觉词典,得到各所述第一视觉单词对应的第一长矢量;根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一视觉特征、所述第一层视觉词典和所述第二层视觉词典,得到各所述第一视觉单词对应的第一长矢量,包括:根据所述第一视觉词典,分别查找各所述第一视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第二残差向量;针对所述第一视觉单词对应的所述第二视觉词典,计算所述k2个第二视觉单词与所述第二残差向量的残差向量,并对各所述第二视觉单词对应的残差向量求和,得到k2个第三残差向量;按照所述k2个第二视觉单词在所述第二视觉词典中的索引顺序,将所述k2个第三残差向量组合为所述第一视觉单词对应的所述第一长矢量。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量,包括:按照所述k1个第一视觉单词在所述第一视觉词典中的索引顺序,将所述第一视觉单词对应的所述第一长矢量组合为所述第二长矢量。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:获取测试图像的第二图像表示向量;计算所述第二图像表示向量与多个检索图像的图像表示向量的相似度;查找所述相似度满足预设条件的目标检索图像;比对所述测试图像和所述目标检索图像,输出测试结果。9.一种获得图像表示的装置,其特征在于,所述装置包括:视觉特征提取模块,...

【专利技术属性】
技术研发人员:马福强崔利阳薛鸿臻刘小磊
申请(专利权)人:京东方科技集团股份有限公司北京京东方光电科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1