一种基于改进PQ算法的CBIR方法技术

技术编号：24206697 阅读：31 留言：0更新日期：2020-05-20 14:58

本发明专利技术涉及一种基于改进PQ算法的CBIR方法，属于图像处理技术领域。通过改进深度卷积网络提取图像深度特征，然后通过采用非线性检索ANN搜索策略的基于倒排索引的乘积量化IVPQ算法的索引检索模块编码压缩图像特征数据，并生成基于Faiss框架的动态索引数据库的索引，通过特征向量编码对全索引库的数据空间进行分割，进行查询图片的检索时，通过汉明距离重排，快速锁定某一子空间再进行遍历，并输出检索图像。本发明专利技术基于Faiss框架实现了检索索引库的动态化，避免了实际应用场合为重建索引库产生的高昂运维成本。

CBIR method based on improved PQ algorithm

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进PQ算法的CBIR方法
本专利技术属于图像处理领域，涉及一种基于改进PQ算法的CBIR方法。
技术介绍
实际应用场景下，用户需要对海量的、无标签的、复杂未知的图像进行基于关键敏感图像库检索判断，实现“以图搜图”的功能。目前公认表示索引图像信息的最有效方式基于图像内容自身，故选用基于内容的图像检索(CBIR,ContentBasedImageRetrieval)方法进行大规模图像检索系统设计。传统CBIR方法采用相似性度量的暴力检索(Brute-force)策略，暴力检索策略会随着图片特征索引数据的增加而加剧内存资源的耗费。特别是当实际应用场合的数据集规模达到几百个百万规模时，由于索引规模的增加，运行内存(RAM)占用得不到满足，从而导致检索性能会急剧降低，系统性能无法取得预期目标，硬件成本也会急剧增加。为此，主流的解决方法是采用近似最近邻(ANN,ApproximateNearestNeighbor)检索策略，其本质是通过对检索数据集的全空间进行分割成子空间，以某种方式快速锁定(几个)子空间集并进行遍历。ANN主要分为KD树法、图索引量化法、哈希法、矢量量化法。对于常规的KD树算法而言，随着KD树的树深度越深，KD树法检索模型的性能表现越发欠佳；而将图引入ANN搜索的方法，以已经成熟应用的HNSW(HierarchicalNavigableSmallWorldGraphs)算法为例，其召回率高、但索引内存占用大、独特的索引结构不利于数据的动态增删；对于哈希法而言，出现了多表局部敏感哈希(M...

【技术保护点】
1.一种基于改进乘积量化PQ算法的基于内容的图像检索CBIR方法，其特征在于：通过改进深度卷积网络提取图像深度特征，然后通过采用非线性检索ANN搜索策略的基于倒排索引的乘积量化IVPQ算法的索引检索模块编码压缩图像特征数据，并生成基于Faiss框架的动态索引数据库的索引，通过特征向量编码对全索引库的数据空间进行分割，进行查询图片的检索时，通过汉明距离重排，快速锁定某一子空间再进行遍历，并输出检索图像。/n

【技术特征摘要】
1.一种基于改进乘积量化PQ算法的基于内容的图像检索CBIR方法，其特征在于：通过改进深度卷积网络提取图像深度特征，然后通过采用非线性检索ANN搜索策略的基于倒排索引的乘积量化IVPQ算法的索引检索模块编码压缩图像特征数据，并生成基于Faiss框架的动态索引数据库的索引，通过特征向量编码对全索引库的数据空间进行分割，进行查询图片的检索时，通过汉明距离重排，快速锁定某一子空间再进行遍历，并输出检索图像。

2.根据权利要求1所述的一种基于改进PQ算法的CBIR方法，其特征在于：所述IVPQ算法分为索引构建与非线性检索查询，记X＝[x1,x2,...,xN]∈RN×Ω为训练样本集的特征向量数据集矩阵，其中Ω为训练样本数据维度，N为训练样本集的样本个数，查询样本为xq；
所述索引构建具体为：
进行编码预处理：对训练样本特征向量数据集X进行K-Means聚类算法，得到M个样本聚类中心C＝[c1,c2,...,cM]∈RM×Ω，设ci＝NNC(xi)表示训练样本数据特征向量xi最近的样本聚类中心，两两相减得到残差向量组R，R表示公式为：
R＝[r1,r2,...,ri,...,rN]∈RN×Ω
ri＝|xi-ci|(2)
对残差向量ri的维度空间Ω进行P平分，记ri＝[ri,1,ri,2,...,ri,j,...,ri,P]∈R1×Ω且ω1+...+ωj+...+ωP＝Ω,并分别对不同子空间内所有训练样本的残差子向量进行K-Means聚类生成聚类中心个数一致的码本集CΩ，CΩ表示公式如下：

其中，为训练样本残差向量组R的维度空间Ω被平分后形成的第j个维度子空间的码本(聚类集)，P为Ω平分后的维度子空间的个数；为中的第k个聚类中心，M'为每个子空间的聚类中心个数，且满足M'＝2p，2p为IVPQ二进制编码位数；
利用CΩ对ri进行IVPQ编码，每个样本残差向量ri由其P个残差子向量对应的聚类中心的ID号来表示，生成训练样本IVPQ编码集S，S表示公式如...

【专利技术属性】
技术研发人员：曾浩，高凡，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人