【技术实现步骤摘要】
本专利技术涉及相似性检索领域,尤其涉及一种多媒体对象的相似检索方法及装置。
技术介绍
现如今许多数据处理应用需要处理结构更为松散甚至无结构的数据。很多实际应用更是需要处理基于样本的检索,例如基于内容的图像检索等。而这些应用都可以归结到相似性检索的范畴,尤其在多媒体应用中,基于多媒体数据的内容进行相似搜索的技术,也变得越来越重要。为了提升多媒体相似性检索的处理效率,通常针对多媒体对象的高维特征建立高维索引。多年来,研究者们已经设计和开发了很多高维索引技术用于组织视频、图像、音频等多媒体数据的特征向量,以提升检索性能。由于“维度灾难”的存在,当数据量很大,维度很高时,提升多媒体检索任务的性能仍然是一项艰巨的工作,现有技术中的高维索引技术,当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能。
技术实现思路
本专利技术提供一种多媒体对象的相似检索方法及装置,解决现有技术中高维索引技术当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能的技术问题。本专利技术的目的是通过以下技术方案实现的:一种多媒体对象的相似检索方法,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据 ...
【技术保护点】
一种多媒体对象的相似检索方法,其特征在于,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。
【技术特征摘要】
1.一种多媒体对象的相似检索方法,其特征在于,包括:通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;将d维特征向量的数据空间划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点;在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。2.根据权利要求1所述的多媒体对象的相似检索方法,其特征在于,所述特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。3.根据权利要求2所述的多媒体对象的相似检索方法,其特征在于,所述将d维特征向量划分为M个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据库,包括:将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1;为每个分区选定参照点Q0、Q1、…、Qm-1;根据d维特征向量对应的数据点p到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y=i×c+dist(p,Qi),0≤i≤m-1,c为弹性系数,dist(p,Qi)为d维特征向量对应的数据点p到参照点Qi的距离;采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键值y及所述d维特征向量。4.根据权利要求3所述的多媒体对象的相似检索方法,其特征在于,所述根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点的步骤,包括:将所述查询点q与查询半径r所形成的超球扩展成超立方体;判断每个Partition是否与所述超立方体相交;当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q,center)及查询半径r,是否满足dist(p,center)≤r+dist(q,center),当不满足时,修剪掉数据点p。5.根据权利要求4所述的多媒体对象的相似检索方法,其特征在于,在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量的步骤,包括:在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值及查询点q与当前partition的情况,对所述查询空间内的数据点进行查询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;当第一种情况时,根据查询范围,向B+-Tree树的叶子节点两边进行遍历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前Partition包含查询点q;当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树的叶...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。