一种多媒体对象的相似检索方法及装置制造方法及图纸

技术编号：13969721 阅读：95 留言：0更新日期：2016-11-10 04:36

本发明专利技术公开了一种多媒体对象的相似检索方法及装置，通过对多媒体对象进行特征提取，获取多媒体对象的d维特征向量,对d维特征向量进行降维处理,提取待检索多媒体对象的d维特征向量，并通过iDistance算法，将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q,根据查询点q、查询空间及距离度量，修剪掉不需查询的Partition分区及不需查询的数据点,在经过修剪后的数据点中，确定包含于所述查询空间内的数据点，根据所述一维键值及查询点与对所述查询空间内的数据点进行查询，以查询待检索多媒体对象的d维特征向量。本发明专利技术减少无效的I/O查询，并以三角剪枝的方式降低计算开销，进而提高查询效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及相似性检索领域，尤其涉及一种多媒体对象的相似检索方法及装置。
技术介绍
现如今许多数据处理应用需要处理结构更为松散甚至无结构的数据。很多实际应用更是需要处理基于样本的检索，例如基于内容的图像检索等。而这些应用都可以归结到相似性检索的范畴，尤其在多媒体应用中，基于多媒体数据的内容进行相似搜索的技术，也变得越来越重要。为了提升多媒体相似性检索的处理效率，通常针对多媒体对象的高维特征建立高维索引。多年来，研究者们已经设计和开发了很多高维索引技术用于组织视频、图像、音频等多媒体数据的特征向量，以提升检索性能。由于“维度灾难”的存在，当数据量很大，维度很高时，提升多媒体检索任务的性能仍然是一项艰巨的工作，现有技术中的高维索引技术，当数据规模较大，维度较高时，I/O开销及计算开销均会变大，降低了索引查询的性能。
技术实现思路
本专利技术提供一种多媒体对象的相似检索方法及装置，解决现有技术中高维索引技术当数据规模较大，维度较高时，I/O开销及计算开销均会变大，降低了索引查询的性能的技术问题。本专利技术的目的是通过以下技术方案实现的：一种多媒体对象的相似检索方法，包括：通过对多媒体对象进行特征提取，获取多媒体对象的d维特征向量；将d维特征向量的数据空间划分为M个区域，通过iDistance算法，将d维特征向量映射为一维键值，并通过一维索引结构存储所述一维键值及所述d维特征向量，以获得查询数据库，其中，所述数据空间中包括d维特征向量对应的数据点；提取待检索多媒体对象的d维特征向量，并通过iDistance算法，将待检索多媒体对象的d维特征向量映射为一维键值及数据...

【技术保护点】
一种多媒体对象的相似检索方法，其特征在于，包括：通过对多媒体对象进行特征提取，获取多媒体对象的d维特征向量；将d维特征向量的数据空间划分为M个区域，通过iDistance算法，将d维特征向量映射为一维键值，并通过一维索引结构存储所述一维键值及所述d维特征向量，以获得查询数据库，其中，所述数据空间中包括d维特征向量对应的数据点；提取待检索多媒体对象的d维特征向量，并通过iDistance算法，将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q；根据查询点q、查询空间及距离度量，修剪掉不需查询的Partition分区及不需查询的数据点；在经过修剪后的数据点中，确定包含于所述查询空间内的数据点，根据所述一维键值，对所述查询空间内的数据点进行查询，以查询待检索多媒体对象的d维特征向量。

【技术特征摘要】
1.一种多媒体对象的相似检索方法，其特征在于，包括：通过对多媒体对象进行特征提取，获取多媒体对象的d维特征向量；将d维特征向量的数据空间划分为M个区域，通过iDistance算法，将d维特征向量映射为一维键值，并通过一维索引结构存储所述一维键值及所述d维特征向量，以获得查询数据库，其中，所述数据空间中包括d维特征向量对应的数据点；提取待检索多媒体对象的d维特征向量，并通过iDistance算法，将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q；根据查询点q、查询空间及距离度量，修剪掉不需查询的Partition分区及不需查询的数据点；在经过修剪后的数据点中，确定包含于所述查询空间内的数据点，根据所述一维键值，对所述查询空间内的数据点进行查询，以查询待检索多媒体对象的d维特征向量。2.根据权利要求1所述的多媒体对象的相似检索方法，其特征在于，所述特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。3.根据权利要求2所述的多媒体对象的相似检索方法，其特征在于，所述将d维特征向量划分为M个区域，通过iDistance算法，将d维特征向量映射为一维键值，并通过一维索引结构存储所述一维键值及所述d维特征向量，以获得查询数据库，包括：将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1；为每个分区选定参照点Q0、Q1、…、Qm-1；根据d维特征向量对应的数据点p到参照点Qi的距离，将d维特征向量映射为一维键值，其中，一维键值y＝i×c+dist(p，Qi)，0≤i≤m-1，c为弹性系数，dist(p，Qi)为d维特征向量对应的数据点p到参照点Qi的距离；采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键值y及所述d维特征向量。4.根据权利要求3所述的多媒体对象的相似检索方法，其特征在于，所述根据查询点q、查询空间及距离度量，修剪掉不需查询的Partition分区及不需查询的数据点的步骤，包括：将所述查询点q与查询半径r所形成的超球扩展成超立方体；判断每个Partition是否与所述超立方体相交；当所述Partition与所述超立方体不相交时，修剪掉不需查询的所述Partition，并扩大查询半径r，重新进行修剪判断，直至KNN检索结束；当KNN检索结束后，对未修剪的Partition中的数据点p增加数据点到数据空间中心的距离dist(p，center)，判断所述查询点q到数据空间中心的距离dist(q，center)及查询半径r，是否满足dist(p，center)≤r+dist(q，center)，当不满足时，修剪掉数据点p。5.根据权利要求4所述的多媒体对象的相似检索方法，其特征在于，在经过修剪后的数据点中，确定包含于所述查询空间内的数据点，根据所述一维键值，对所述查询空间内的数据点进行查询，以查询待检索多媒体对象的d维特征向量的步骤，包括：在经过修剪后的数据点中，确定包含于所述查询空间内的数据点，根据所述一维键值及查询点q与当前partition的情况，对所述查询空间内的数据点进行查询，其中，查询点q与当前partition的情况包括第一种情况和第二种情况；当第一种情况时，根据查询范围，向B+-Tree树的叶子节点两边进行遍历，查询待检索多媒体对象的d维特征向量对应的数据点p，其中，所述第一种情况为当前Partition包含查询点q；当第二种情况时，根据查询范围及Partition的半径，向B+-Tree树的叶...

【专利技术属性】
技术研发人员：李晖，陈梅，
申请(专利权)人：贵州大学，
类型：发明
国别省市：贵州;52

全部详细技术资料下载我是这个专利的主人