当前位置: 首页 > 专利查询>贵州大学专利>正文

一种多媒体对象的相似检索方法及装置制造方法及图纸

技术编号:13969721 阅读:95 留言:0更新日期:2016-11-10 04:36
本发明专利技术公开了一种多媒体对象的相似检索方法及装置,通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量,对d维特征向量进行降维处理,提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q,根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点,在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值及查询点与对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。本发明专利技术减少无效的I/O查询,并以三角剪枝的方式降低计算开销,进而提高查询效率。

【技术实现步骤摘要】

本专利技术涉及相似性检索领域,尤其涉及一种多媒体对象的相似检索方法及装置
技术介绍
现如今许多数据处理应用需要处理结构更为松散甚至无结构的数据。很多实际应用更是需要处理基于样本的检索,例如基于内容的图像检索等。而这些应用都可以归结到相似性检索的范畴,尤其在多媒体应用中,基于多媒体数据的内容进行相似搜索的技术,也变得越来越重要。为了提升多媒体相似性检索的处理效率,通常针对多媒体对象的高维特征建立高维索引。多年来,研究者们已经设计和开发了很多高维索引技术用于组织视频、图像、音频等多媒体数据的特征向量,以提升检索性能。由于“维度灾难”的存在,当数据量很大,维度很高时,提升多媒体检索任务的性能仍然是一项艰巨的工作,现有技术中的高维索引技术,当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能。
技术实现思路
本专利技术提供一种多媒体对象的相似检索方法及装置,解决现有技术中高维索引技术当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能的技术问题。本专利技术的目的是通过以下技术方案实现的:一种多媒体对象的相似检索方法,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。前述的多媒体对象的相似检索方法,所述特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。前述的多媒体对象的相似检索方法,所述将d维特征向量划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,包括:将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1;为每个分区选定参照点Q0、Q1、…、Qm-1;根据d维特征向量对应的数据点p到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y=i×c+dist(p,Qi),0≤i≤m-1,c为弹性系数,dist(p,Qi)为d维特征向量对应的数据点p到参照点Qi的距离;采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键值y及所述d维特征向量。前述的多媒体对象的相似检索方法,所述根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点的步骤,包括:将所述查询点q与查询半径r所形成的超球扩展成超立方体;判断每个Partition是否与所述超立方体相交;当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q,center)及查询半径r,是否满足dist(p,center)≤r+dist(q,center),当不满足时,修剪掉数据点p。前述的多媒体对象的相似检索方法,在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量的步骤,包括:当第一种情况时,根据查询范围,向B+-Tree树的叶子节点两边进行遍历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前Partition包含查询点q;当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树的叶子节点内部进行遍历,其中,所述第二种情况为查询点q在当前Partition外,且所述查询点q与查询半径r所形成的超球与Partition相交。一种多媒体对象的相似检索装置,包括:特征向量提取模块,用于通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;降维模块,用于将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;映射模块,用于提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;剪枝模块,用于根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;查询模块,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。前述的多媒体对象的相似检索装置,所述降维模块包括:分区单元,用于将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1;映射单元,用于为每个分区选定参照点Q0、Q1、…、Qm-1,根据d维特征向量对应的数据点p到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y=i×c+dist(p,Qi),0≤i≤m-1,c为弹性系数,dist(p,Qi)为d维特征向量对应的数据点p到参照点Qi的距离;索引单元,用于采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键值y及所述d维特征向量。前述的多媒体对象的相似检索装置,所述剪枝模块包括:变换单元,用于将所述查询点q与查询半径r所形成的超球扩展成超立方体;判断单元,用于判断每个Partition是否与所述超立方体相交;第一修剪单元,用于当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;第二修剪单元,用于当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q,center)及查询半径r,是否满足dist(p,center)≤r+dist(q,center),当不满足时,修剪掉数据点p。前述的多媒体对象的相似检索装置,所述查询模块包括:查询执行单元,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值及查询点q与当前partition的情况,对所述查询空间内的数据点进行查询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;第一遍历单元,用于当第一种情况时,根据查询范围,向B+-Tree树的叶子节点两边进行遍历,查询待检索多媒体对本文档来自技高网...

【技术保护点】
一种多媒体对象的相似检索方法,其特征在于,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。

【技术特征摘要】
1.一种多媒体对象的相似检索方法,其特征在于,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。2.根据权利要求1所述的多媒体对象的相似检索方法,其特征在于,所述特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。3.根据权利要求2所述的多媒体对象的相似检索方法,其特征在于,所述将d维特征向量划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,包括:将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1;为每个分区选定参照点Q0、Q1、…、Qm-1;根据d维特征向量对应的数据点p到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y=i×c+dist(p,Qi),0≤i≤m-1,c为弹性系数,dist(p,Qi)为d维特征向量对应的数据点p到参照点Qi的距离;采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键值y及所述d维特征向量。4.根据权利要求3所述的多媒体对象的相似检索方法,其特征在于,所述根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点的步骤,包括:将所述查询点q与查询半径r所形成的超球扩展成超立方体;判断每个Partition是否与所述超立方体相交;当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q,center)及查询半径r,是否满足dist(p,center)≤r+dist(q,center),当不满足时,修剪掉数据点p。5.根据权利要求4所述的多媒体对象的相似检索方法,其特征在于,在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量的步骤,包括:在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值及查询点q与当前partition的情况,对所述查询空间内的数据点进行查询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;当第一种情况时,根据查询范围,向B+-Tree树的叶子节点两边进行遍历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前Partition包含查询点q;当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树的叶...

【专利技术属性】
技术研发人员:李晖陈梅
申请(专利权)人:贵州大学
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1