一种高维数据快速搜索方法技术

技术编号：26170829 阅读：39 留言：0更新日期：2020-10-31 13:40

本发明专利技术提供一种高维数据快速搜索方法，包括如下步骤：1）从根开始计算，根节点作为父节点，栈清空，DIST取最大值，记数器CNT置为0；2).取出父节点指向的当前向量对应的分类维s和中间値MEAN,计算Y(s)跟MEAN差的平方SQRT；3).比较DIST与SQRT的大小；4).比较Y(s)与MEAN的大小：5)．按照先进后出FILO方式进行出栈操作，生成新的父节点；6).判断栈是否为空；7).搜索中止，获得搜索结果。本发明专利技术所给出这种能够自动生成优先序列的查找模型和方法，解决了BBF方式存在的最优排序耗时的问题，可以获得更高的计算性价比，为大数据高维搜索提供了全新的更有效的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种高维数据快速搜索方法
本专利技术属于大数据，计算机软件和信息技术处理领域，对高维数据搜索计算提供快速计算模型，以实现数据的快速计算搜索的方法。
技术介绍
对一个规模为n的一维数组，遍历型数据查找的计算量是O(n)，通过排序，可以获得O（log(n)）规模的查找计算量，因此称为快速查找。一旦数组维数超过1，一维情况的快速查找就无法实现了。不过，人们按照一维快速查找思路，提出了KD树的多维建模方法，也可以实现类似一维的查找算法，有时也能接近O（log(n)）的计算量。遗憾的是，这种方法对于数据规模巨大的数据集是有效的，而且数据规模是维数的指数幂次量级，但大部分应用往往到不了这个规模，计算效率也就变得低效了，甚至比遍历计算还差。如果使用大写字母X，Y表示一个维数为d的数组，也称向量。两个向量的距离用欧氏距离定义为D(X,Y)=（1）其中X=(x1,x2,...,xd)，Y=(y1,y2,...,yd)。对于一个向量集，我们用X1,X2,...,Xn表示n个数据的d维向量数组，高维数据搜索的目标是对一个目标向量Y寻找一个向量集中最近的数，也即满足（2）这个问题的求解很简单，就是逐一计算Y与每个向量Xi的距离，取最小的那个。这种遍历型计算也称为暴力计算，其计算量是O(n)级的。当维数d和集合数目n很大时，计算量是很可观的。为了降低计算量，加快搜索速度，人们提出了KD树的平衡二叉树数据结构。把向量集X1,X2,...,Xn存贮为二叉树的节点，然后通过寻求二叉树的叶节点，对（2）...

【技术保护点】
1.一种高维数据快速搜索方法，其特征在于：该方法采用如下步骤实现：/n1).从根开始计算，根节点作为父节点，栈清空，DIST取最大值，记数器CNT 置为 0，其中DIST表示两个向量的距离平方；/n2). 取出父节点指向的当前向量对应的分类维s和中间値MEAN, 计算Y(s)跟MEAN差的平方SQRT，其中Y表示查询向量，s为当前节点的子维数；/n3). 比较DIST与SQRT的大小，如果DIST大于SQRT，则进入以下步骤：/n3.1).计算Y(s)与当前向量的距离平方TMP，如果TMP小于DIST，则DIST= TMP；/n3.2).计数器CNT加1，如果超过指定数，跳转至步骤7)；/n4). 比较Y(s)与MEAN的大小，/n4.1).如果Y(s)大于MEAN，则进入以下步骤：/n4.1a).判断右孩子是否为空，如果右孩子非空，同时DIST大于SQRT，则右孩子进栈；/n4.1b).判断左孩子是否为空，如果左孩子非空，则左孩子进栈，否则跳转至步骤5)；/n4.2).所述步骤4.1)中如果条件不满足则进入以下步骤：/n4.2a).判断左孩子是否为空，如果左孩子非空，同时DIST大...

【技术特征摘要】
1.一种高维数据快速搜索方法，其特征在于：该方法采用如下步骤实现：
1).从根开始计算，根节点作为父节点，栈清空，DIST取最大值，记数器CNT置为0，其中DIST表示两个向量的距离平方；
2).取出父节点指向的当前向量对应的分类维s和中间値MEAN,计算Y(s)跟MEAN差的平方SQRT，其中Y表示查询向量，s为当前节点的子维数；
3).比较DIST与SQRT的大小，如果DIST大于SQRT，则进入以下步骤：
3.1).计算Y(s)与当前向量的距离平方TMP，如果TMP小于DIST，则DIST=TMP；
3.2).计数器CNT加1，如果超过指定数，跳转至步骤7)；
4).比较Y(s)与MEAN的大小，
4.1).如果Y(s)大于MEAN，则进入以下步骤：
4.1a).判断右孩子是否为空，如果右孩子非空，同时DIST大于SQRT，则右孩子进栈；
4.1b).判断左孩子是否为空，如果左孩子非空，则左孩子进栈，否则跳转至步骤5)；
4.2).所述步...

【专利技术属性】
技术研发人员：赵风光，
申请(专利权)人：上海闻通信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人