The present invention discloses a nearest neighbor search method based on double bit quantization and weighting. The method is as follows: 1) the characteristics of s projection of each K dimension in the database for the intermediate vector g (s); 2) according to G (s) positive and negative symbols in each dimension of the data will be g (s) data are divided into two types; then, in each dimension are calculated respectively. The median of two types of data; 3) according to the signs of each dimension data feature of the s and two median, each dimensional data partition characteristics of s into four categories; with each dimension of quantitative data for binary encoding 2 bits, each dimension data indicate characteristics of S type; two hexadecimal encoding according to the dimension data feature s categories corresponding to the binary encoding to generate the feature of S; 4) calculated between each feature binary encoding binary encoding query features and the features in the library will be weighted Hamming distance and Hamming distance corresponding to the minimum value of the nearest neighbor of the query feature as feature feature. The invention improves the query precision.
【技术实现步骤摘要】
一种基于双倍比特量化及加权的最近邻搜索方法
本专利技术涉及一种基于双倍比特量化及加权的最近邻搜索方法,属于计算机软件
技术介绍
高维特征的最近邻搜索是很多视觉应用,如图像检索、目标识别以及拷贝检测的关键技术之一。最近邻搜索旨在高维大规模数据库中为查询数据找到与之最相似的数据。当在大规模数据库中寻找最近邻时,通常把计算量较大的欧式距离作为衡量高维数据之间距离的度量标准。然而,这将造成严重的性能瓶颈。对高维特征最近邻搜索的性能的影响主要包括两个方面:计算时间和内存占用。而二进制编码正好能解决这两大问题。一方面,海明距离的计算非常高效,只需要极少的机器指令即可完成;另一方面,二进制编码占用的存储空间远远少于浮点型数据。s表示一个在Ω空间下的K维图像特征,hk表示一种二进制嵌入方法,也就是说hk:Ω→{0,1}。一组由K个这样的二进制嵌入方法构成了集合H={hk,k=1…K},这个集合定义了一个多维的二进制嵌入方法h(s)=[h1(s)…hi(s)…hK(s)]′,其中,hi(s)是指将s中第i维特征映射为第i比特的二进制编码。所以,特征s被映射为K比特的二进制 ...
【技术保护点】
一种基于双倍比特量化及加权的最近邻搜索方法,其特征在于包括如下步骤:步骤1.用多维投影方法把数据库中的每一个K维的特征s投影为中间向量g(s);步骤2.根据中间向量g(s)的每一维数据的正负符号将该中间向量g(S)的数据划分为两类;然后,在每个维度上分别计算出这两类数据的中值;其中,nmi表示第i维的正数数据的中值,pmi表示第i维的负数数据的中值;步骤3.根据特征s的每维数据的正负符号以及两个中值,将特征s的每一维数据划分为四类;利用每一维数据量化为2比特的二进制编码,标明特征s的每一维数据的类别;根据特征s的各维数据的类别对应的二进制编码,生成该特征s的二进制编码;步骤 ...
【技术特征摘要】
2017.03.09 CN 20171013733661.一种基于双倍比特量化及加权的最近邻搜索方法,其特征在于包括如下步骤:步骤1.用多维投影方法把数据库中的每一个K维的特征s投影为中间向量g(s);步骤2.根据中间向量g(s)的每一维数据的正负符号将该中间向量g(S)的数据划分为两类;然后,在每个维度上分别计算出这两类数据的中值;其中,nmi表示第i维的正数数据的中值,pmi表示第i维的负数数据的中值;步骤3.根据特征s的每维数据的正负符号以及两个中值,将特征s的每一维数据划分为四类;利用每一维数据量化为2比特的二进制编码,标明特征s的每一维数据的类别;根据特征s的各维数据的类别对应的二进制编码,生成该特征s的二进制编码;步骤4.对于K维的查询特征,采用步骤1~4的方法生成该查询特征的二进制编码步骤5.计算该查询特征的二进制编码与该特征库中每一特征的二进制编码之间的加权海明距离,将加权海明距离最小值对应的特征作为该查询特征的最近邻特征。2.根据权利要求1所述的一种基于双倍比特量化及加权的最近邻搜索方法,其特征在于对中间向量g(s)的每一维数据gk(s)进行归一化,得到l(s)=[lk(s),k=1…K]′;其中,k=1…K,表示对数据进行归一化。3.根据权利要求1或2所述的一种基于双倍比特量化及加权的最近...
【专利技术属性】
技术研发人员:颜成钢,邓涵,孙垚棋,张勇东,薛安克,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。