【技术实现步骤摘要】
一种面向高维大数据的基于权重求解的哈希查询方法
本专利技术涉及一种哈希查询方法,特别涉及一种面向高维大数据的基于权重求解的哈希查询方法。
技术介绍
近似近邻问题是一个计算机学科基础问题。一般情况下,哈希技术是能够解决大规模高维数据查询的一种有效方法。相关技术中,对于这个数据集的哈希编码,哈希技术不考虑各维度的权重,即认为各维度权值相等,但哈希编码不同维度对于数据之间相似性的影响是不同的,相关技术没有充分考虑哈希编码权重,有待改进。
技术实现思路
本专利技术所要解决的技术问题是提供一种能够针对数据集的特性对编码进行加权量化得到对应的哈希编码,减少数据存储空间及计算代价,提高查询准确性的面向高维大数据的基于权重求解的哈希查询方法。本专利技术解决上述技术问题所采用的技术方案为:一种面向高维大数据的基于权重求解的哈希查询方法,包括以下步骤:①获取由n个原始高维数据组成的原始高维数据集X并给定查询数据q,X为n×d维的矩阵,使用主成分分析法对X进行降维,得到与X对应的低维向量集V,其中,V为n×c维的矩阵,vij表示原始高维数据中第i个数据第j维度在V中对应的低维向量元素,再使 ...
【技术保护点】
1.一种面向高维大数据的基于权重求解的哈希查询方法,其特征在于包括以下步骤:①获取由n个原始高维数据组成的原始高维数据集X并给定查询数据q,X为n×d维的矩阵,使用主成分分析法对X进行降维,得到与X对应的低维向量集V,
【技术特征摘要】
1.一种面向高维大数据的基于权重求解的哈希查询方法,其特征在于包括以下步骤:①获取由n个原始高维数据组成的原始高维数据集X并给定查询数据q,X为n×d维的矩阵,使用主成分分析法对X进行降维,得到与X对应的低维向量集V,其中,V为n×c维的矩阵,vij表示原始高维数据中第i个数据第j维度在V中对应的低维向量元素,再使用主成分分析法对q进行降维,得到与q对应的低维向量q';②通过迭代获取最终二进制编码矩阵B″和最终权重矩阵W”,具体过程如下:②-1设定最大迭代次数,随机给定初始二进制编码矩阵B,B∈{-1,1}n×c,随机给定初始权值矩阵W,W=diag(w1,w2,…wj…,wc),其中,wj表示第j维度的维度权重;②-2开始迭代过程,在当前一次迭代过程中,首先保持W不变,通过对进行最小化求解对B进行更新,将最小时更新得到的B记为B′,其中,||||F为取矩阵的F-范数符号,中的2表示平方符号,bij表示原始高维数据中第i个数据第j维度对应的二进制编码值;②-3在当前一次迭代过程中对所有维度的维度权重进行更新,其中对wj进行更新的过程如下:将B′中的第j列的列向量记为βj,将V中的第j列列向量记为γj’,则有B...
【专利技术属性】
技术研发人员:孙瑶,钱江波,胡伟,任艳多,
申请(专利权)人:宁波大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。