一种图像搜索中建立图像索引的方法和装置制造方法及图纸

技术编号:9667900 阅读:112 留言:0更新日期:2014-02-14 06:19
本发明专利技术公开了一种图像搜索中建立图像索引的方法和装置,本发明专利技术所提供的方法,提取索引图像的多个索引特征点向量,并将索引图像多次模拟变形,得到多个形变图像,提取挑选出的形变图像中的多个形变特征点向量,计算挑选出的索引特征点向量分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离,统计挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离的比值小于第一预设阈值的次数,得到挑选出的索引特征点向量的稳定次数,选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,其中,M为任意一个自然数,本发明专利技术所提供的装置是与方法所对应的装置,提高了图像搜索的精度。

【技术实现步骤摘要】
一种图像搜索中建立图像索引的方法和装置
本申请涉及图像分析领域,特别是一种图像搜索中建立图像索引的方法和装置。
技术介绍
互联网络上传统的图像搜索引擎主要是基于图像的文件名建立索引,通过输入文件名来实现图像搜索功能。图像的文件名一般只有少量的文字,只描述了图像的某一个或某几个典型的特征,不能精确的描述图像的全部特征,因此,输入文件名进行搜索后,可以得到很多具有相同或相近典型特征的图像,造成图像搜索的准确率很低。目前,有的搜索引擎采用基于内容的图像搜索方法。基于内容的图像搜索指的是,提取索引图像的底层特征并建立索引特征点,主要可以分为以下步骤:提取索引图像的底层特征,包括颜色、外观、纹理或形状等底层特征;使用视觉词典对提取的底层特征进行量化,每一个索引图像的底层特征都会被量化为视觉词典中的某一个视觉词;按照视觉词建立倒排文档作为索引特征点。在进行图像搜索时,将一个查询图像本身或者将对查询图像内容的描述作为查询条件,搜索引擎通过比较索引图像中的底层特征和查询条件之间的距离,来获得与查询图像最近似的索引图像,最终实现图像的搜索功能。通常,一个索引图像的底层特征有很多,例如,一张普通大小(1000*800)的索引图像,大约可以提取到2000个以上的底层特征,针对如此庞大的底层特征建立图像索引,不仅需要很大的索引文件存储空间,而且,在建立和查询图像索引的时间上,也会导致时间开销比较大。针对上述底层特征过多而导致的耗时和耗成本问题,在中国专利:《面向近重复图像匹配的SIFT特征裁减方法》(申请号/专利号:200910152880.3)中公开了一种特征裁剪的方法,即减少底层特征的方法。其公开的方法如下:对图像库中每一幅图像进行高斯核卷积处理,得到图像的关键特征点;对关键特征点对比度和关键特征点主曲率比分别进行高斯归一化,并对归一化处理结果进行线性加权得到各个关键特征点的显著度;按照关键特征点的显著度从小到大的顺序,选取用户指定数目的关键特征点,实现图像的特征裁减。使用上述方法可以减少索引图像的底层特征,不仅有效控制了索引文件的大小,提高系统的运行速度,节约了存储空间,缩短了建立和查询图像索引的时间,并且,也减少了由于不稳定特征点引入的错误匹配,从而在一定程度上提高了图像搜索的准确率。然而,在实现本申请的过程中,本申请的专利技术人发现上述方法至少存在如下缺陷:首先,虽然上述专利公开的特征裁剪方法解决了由于底层特征过多而导致的各种问题,但是,在图像搜索过程中,由于索引图像与输入图像之间还存在亮度(明暗)、尺度(缩放)、旋转、仿射、遮挡或图像裁剪等因素的变化,而这些因素会导致索引图像的索引特征点与查询图像的查询特征点之间匹配错误,降低了图像搜索的精度;其次,由于索引图像本身还存在对称性或周期性等自相似性的结构影响,也容易使索引图像的索引特征点与查询图像的查询特征点之间产生匹配错误,进一步降低了图像的搜索精度。
技术实现思路
有鉴于此,本申请提供了一种图像搜索中建立图像索引的方法和装置,选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,提高了图像搜索的精度。一种图像搜索中建立图像索引的方法,所述方法包括:提取索引图像的多个索引特征点向量,并将索引图像多次模拟变形,得到多个形变图像,提取挑选出的形变图像中的多个形变特征点向量;计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离;统计挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离的比值小于第一预设阈值的次数,得到挑选出的索引特征点向量的稳定次数;选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,其中,M为任意一个自然数。优选的,所述提取索引图像的多个索引特征点向量后进一步包括:计算任意两个索引特征点向量的欧氏距离作为特征点欧氏距离;判断所述特征点欧氏距离是否小于第二预设阈值,如果是,将所述两个索引特征点向量剔除。优选的,所述计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离具体包括:查找挑选出的索引特征点向量分别在挑选出的形变图像中的多个临近点形变特征点向量;计算挑选出的索引特征点向量与每一个临近点形变特征点向量的第一欧氏距离;选取最小的第一欧氏距离作为最临近点欧氏距离,选取第二小的第一欧氏距离作为次临近点欧氏距离。优选的,所述计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离具体包括:计算挑选出的索引特征点向量分别与挑选出的形变图像中的所有形变特征点向量的第二欧氏距离;选取最小的第二欧氏距离作为最临近点欧氏距离,选取第二小的第二欧氏距离作为次临近点欧氏距离。优选的,所述将索引图像多次模拟变形包括:将索引图像通过改变亮度、改变分辨率、改变采样角度、不同视角下放射变换中的任意一种或任意多种方式进行多次模拟变形。一种图像搜索中建立图像索引的装置,所述装置包括:图像处理模块,用于提取索引图像的多个索引特征点向量,并将索引图像多次模拟变形,得到多个形变图像,提取挑选出的形变图像中的多个形变特征点向量;欧氏距离获取模块,用于计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离;稳定次数累计模块,用于统计挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离的比值小于第一预设阈值的次数,得到挑选出的索引特征点向量的稳定次数;稳定点输出模块,用于选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,其中,M为任意一个自然数。优选的,所述装置进一步包括:特征点欧氏距离计算模块和特征点剔除模块;所述特征点欧氏距离计算模块,用于计算任意两个索引特征点向量的欧氏距离作为特征点欧氏距离;所述特征点剔除模块,用于判断所述特征点欧氏距离是否小于第二预设阈值,如果是,将所述特征点欧氏距离对应的两个索引特征点向量剔除。优选的,所述欧氏距离获取模块包括:临近点查找模块、第一欧氏距离计算模块和第一欧氏距离选取模块;所述临近点查找模块,用于查找挑选出的索引特征点向量分别在挑选出的形变图像中的多个临本文档来自技高网
...
一种图像搜索中建立图像索引的方法和装置

【技术保护点】
一种图像搜索中建立图像索引的方法,其特征在于,所述方法包括:提取索引图像的多个索引特征点向量,并将索引图像多次模拟变形,得到多个形变图像,提取挑选出的形变图像中的多个形变特征点向量;计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离;统计挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离的比值小于第一预设阈值的次数,得到挑选出的索引特征点向量的稳定次数;选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,其中,M为任意一个自然数。

【技术特征摘要】
1.一种图像搜索中建立图像索引的方法,其特征在于,所述方法包括:提取索引图像的多个索引特征点向量,并将索引图像多次模拟变形,得到多个形变图像,提取挑选出的形变图像中的多个形变特征点向量;计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离,所述挑选出的索引特征点向量是从所述提取出的索引图像的多个索引特征点向量中挑选出的索引特征点向量;统计挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离和次临近点欧氏距离的比值小于第一预设阈值的次数,得到挑选出的索引特征点向量的稳定次数;选取稳定次数由大到小排列在前M的索引特征点向量作为稳定点建立图像索引,其中,M为任意一个正整数。2.根据权利要求1所述的方法,其特征在于,所述提取索引图像的多个索引特征点向量后进一步包括:计算任意两个索引特征点向量的欧氏距离作为特征点欧氏距离;判断所述特征点欧氏距离是否小于第二预设阈值,如果是,将所述两个索引特征点向量剔除。3.根据权利要求1所述的方法,其特征在于,所述计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离具体包括:查找挑选出的索引特征点向量分别在挑选出的形变图像中的多个临近点形变特征点向量;计算挑选出的索引特征点向量与每一个临近点形变特征点向量的第一欧氏距离;选取最小的第一欧氏距离作为最临近点欧氏距离,选取第二小的第一欧氏距离作为次临近点欧氏距离。4.根据权利要求1所述的方法,其特征在于,所述计算挑选出的索引特征点向量分别与挑选出的形变图像中的最临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的最临近点欧氏距离,并计算挑选出的索引特征点向量分别与挑选出的形变图像中的次临近点形变特征点向量的欧氏距离作为挑选出的索引特征点分别在挑选出的形变图像中的次临近点欧氏距离具体包括:计算挑选出的索引特征点向量分别与挑选出的形变图像中的所有形变特征点向量的第二欧氏距离;选取最小的第二欧氏距离作为最临近点欧氏距离,选取第二小的第二欧氏距离作为次临近点欧氏距离。5.根据权利要求1-4...

【专利技术属性】
技术研发人员:薛晖
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1