一种采用双key值的高维索引结构构建方法和检索方法技术

技术编号：9569086 阅读：180 留言：0更新日期：2014-01-16 02:38

本发明专利技术公开了一种采用双key值的高维索引结构构建方法和检索方法。在本发明专利技术中，提出了一种采用双key值的高维到一维转换索引结构DKB-tree，它在高维空间中选取两个参考点将高维空间中的各高维向量映射为双一维key值，统一选取采用相同参考点得到的某一key值作为主key，另一key值作为辅key，每个主key都绑定一个指向其对应辅key的指针，每个辅key都绑定一个指向其对应高维向量的指针。进行检索时，通过主key实现第一层过滤，通过辅key实现再一次过滤。本发明专利技术提出的DKB-tree通过简单的双key值大小比较，大大地减少了相似度匹配的运算量，加快检索速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种采用双key值的高维索引结构构建方法和检索方法
本专利技术属于多媒体信息检索、智能信息处理、数据挖掘等数据处理领域，具体涉及的是一种采用双key值的高维索引结构构建方法和一种采用双key值的高维向量检索方法。
技术介绍
随着计算机和信息技术的发展，产生了海量的多媒体数据，如何在海量的多媒体数据库中快速找到所需的信息是当前多媒体数据库领域研究的一个重点问题。传统的方法是由人工对多媒体数据进行标注，然后通过文本检索来实现多媒体信息检索。然而人工标注存在工作量大和主观性强的缺陷，对于爆炸式增长的多媒体数据来说，完全人工标注是不可实现的，因此需要研究基于内容的多媒体信息检索技术。实现基于内容的多媒体信息检索的技术路线是：通过特征变换，将多媒体数据映射到高维空间中的点——特征向量，用该特征向量来描述多媒体对象，得到特征库；然后用同样的特征变换方法来提取查询对象的特征向量，最后通过特征向量间的相似度匹配来实现多媒体信息的相似检索。因此多媒体信息的相似检索转变为在高维特征空间中寻找与给定查询点最近的点集的过程。要在高维空间中寻找与给定查询点最相近的点集，最简单直观的方法就是顺序扫描，即依次将特征库中的每个特征(高维向量)与查询点进行相似度匹配，返回最匹配的那些特征点集，得到检索结果。顺序扫描随着特征库中特征数目和特征维度的增加，计算消耗时间线性增大，当特征库中的特征数目很大时，顺序扫描将不能满足实时性需求。为了加快检索速度，需借助于高维索引技术。为了实现对海量高维向量的管理，研究者们提出了大量的索引结构，其中最为经典的是以R-tree为代表的R-tree家族系列索引...
一种采用双key值的高维索引结构构建方法和检索方法

【技术保护点】
一种采用双key值的高维索引结构构建方法，其特征在于具体步骤如下：1)在高维空间中选取两个参考点；2)将高维空间中的各高维向量利用高维向量与这两个参考点间的距离映射为双一维key值，统一选取该高维空间中采用相同参考点得到的某一key值作为主key，另一key值作为辅key；3)然后逐一将这些高维向量和对应的主key、辅key插入到DKB?tree中，该DKB?tree采用B+?tree管理上层的主key值，B+?tree叶子节点层的所有主key形成DKB?tree的主key层，同时主key层的每个主key都绑定一个指向其对应辅key的指针，每个主key节点对应一个辅key节点，所有辅key形成DKB?tree的辅key层，每个辅key都绑定一个指向其对应高维向量的指针，这些高维向量根据辅key层其对应辅key的排列顺序按序存储；插入的方法为根据待插入高维向量的主key大小定位其应插入到DKB?tree主key层的某一节点中，根据该节点及其兄弟节点是否已满，处理的方法为：31)首先判断该节点是否已满，如果该节点未满，则直接将该主key插入到该节点中，其辅key按照主key的排列顺序插入到...

【技术特征摘要】
1.一种采用双key值的高维索引结构构建方法，其特征在于具体步骤如下：1)在高维空间中选取两个参考点；2)将高维空间中的各高维向量利用高维向量与这两个参考点间的距离映射为双一维key值，统一选取该高维空间中采用相同参考点得到的某一key值作为主key，另一key值作为辅key；3)然后逐一将这些高维向量和对应的主key、辅key插入到DKB-tree中，该DKB-tree采用B+-tree管理上层的主key值，B+-tree叶子节点层的所有主key形成DKB-tree的主key层，同时主key层的每个主key都绑定一个指向其对应辅key的指针，每个主key节点对应一个辅key节点，所有辅key形成DKB-tree的辅key层，每个辅key都绑定一个指向其对应高维向量的指针，这些高维向量根据辅key层其对应辅key的排列顺序按序存储；插入的方法为根据待插入高维向量的主key大小定位其应插入到DKB-tree主key层的某一节点中，根据该节点及其兄弟节点是否已满，处理的方法为：31)首先判断该节点是否已满，如果该节点未满，则直接将该主key插入到该节点中，其辅key按照主key的排列顺序插入到该节点对应的辅key节点中，待插入特征向量按照辅key的排列顺序插入到该辅key节点对应的高维向量存储位置处，并使该主key产生指向其对应辅key的指针，其对应辅key产生指向待插入高维向量的指针，更新主key所在节点对应的父节点key值；32)如果该节点已满，再判断该节点的左右兄弟节点是否存在未满的情况，若存在，则结合其左右兄弟节点，进行待插入高维向量和其对应主key、辅key值的插入，并更新其父节点对应的key值；33)若该节点及其左右兄弟节点均满，则结...

【专利技术属性】
技术研发人员：杨丽芳，黄祥林，吕锐，王永滨，
申请(专利权)人：中国传媒大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人