一种基于树形聚类矢量量化的图像检索方法技术

技术编号:21432237 阅读:35 留言:0更新日期:2019-06-22 11:56
本发明专利技术请求保护一种基于树形聚类矢量量化的图像检索方法,包括步骤:S1对图片进行预处理并提取出图片的矢量特征;S2对图像的矢量进行聚类;S3使用递归聚类对数据空间进行划分;S4根据制定的规则使聚类停止;S5保存图片的路径指纹以及树模型。本发明专利技术基于树形聚类的矢量量化算法,并利用深度学习模型的特征抽取能力提取出图片的高维特征向量,充分表达了图像的内容与语义,结合了树形聚类算法的查找能力,提升了图像检索的准确度以及检索速度。

【技术实现步骤摘要】
一种基于树形聚类矢量量化的图像检索方法
本专利技术属于图像检索领域,特别涉及基于树形聚类的矢量量化算法和深度学习的特征提取方法以及两种方法的结合。
技术介绍
随着移动互联网技术的飞速发展,图像、视频、音频、文本等异构数据每天都在以惊人的速度增长。例如,Facebook注册用户超过10亿,每月上传超过10亿的图片;Flickr图片社交网站2015年用户上传图片数目达7.28亿,平均每天用户上传约200万的图片;中国最大的电子商务系统淘宝网的后端系统上保存着286亿多张图片。针对这些包含丰富视觉信息的海量图片,如何在这些浩瀚的图像库中方便、快速、准确地查询并检索到用户所需的或感兴趣的图像,成为多媒体信息检索领域研究的热点。从宏观上对ANN(ApproximateNearestNeighbor,此ANN非彼ANN,ArtificialNeuralNetwork)有下面的认知很有必要:brute-force搜索的方式是在全空间进行搜索,为了加快查找的速度,几乎所有的ANN方法都是通过对全空间分割,将其分割成很多小的子空间,在搜索的时候,通过某种方式,快速锁定在某一(几)子空间,然后在该(几个)子空间里做遍历。可以看到,正是因为缩减了遍历的空间大小范围,从而使得ANN能够处理大规模数据的索引。在大数据时代,如何快速的进行图像搜索呢,现有图像搜索方法大致可以分为三类:基于树的方法、基于哈希方法、基于矢量量化的方法。基于树的方法采用树这种数据结构的方法来表达对全空间的划分,其中又以KD树最为经典。图1是KD树对全空间的划分过程,以及用树这种数据结构来表达的一个过程。一般而言,在空间维度比较低的时候,KD树是比较高效的,当空间维度较高时,可以采用下面的哈希方法或者矢量量化方法。局部敏感哈希(LocalSensitiveHashing,LSH)。哈希,顾名思义,就是将连续的实值散列化为0、1的离散值。当一个函数(或者更准确的说,哈希函数家族)具有如下属性的时候,我们说该哈希函数是局部敏感的:相近的样本点对比相远的样本点对更容易发生碰撞。LSH划分空间示意图如图2所示。对于bruteforce搜索,需要遍历数据集中的所有点,而使用哈希则首先找到查询样本落入在哪个cell(即所谓的桶)中,如果空间的划分是在想要的相似性度量下进行分割的,则查询样本的最近邻将极有可能落在查询样本的cell中,如此只需要在当前的cell中遍历比较,而不用在所有的数据集中进行遍历,因此遍历速度非常快,但使用哈希检索也极易发生碰撞,划分粒度不细。矢量量化方法,即vectorquantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中,关键是码本的建立和码字搜索算法。比如常见的聚类算法,就是一种矢量量化方法。而在ANN近似最近邻搜索中,矢量量化方法又以乘积量化(PQ,ProductQuantization)最为典型。其主要步骤为:先划分空间,再将子空间分别聚类,计算出查询向量的距离池,最后直接在距离池中查询出子空间向量所对应的距离进行加和再排序。虽然相对于bruteforce搜索速度更快,但还是对所有数据都进行了查找。倒排PQ乘积量化(IVFPQ)是PQ乘积量化的更进一步加速版。采用的是通过聚类的方式实现感兴趣区域的快速定位,具体是在PQ乘积量化之前,增加了一个粗量化过程:得到了聚类中心后,针对每一个样本找到其距离最近的类中心后,两者相减得到样本的残差向量,后面剩下的过程,就是针对残差向量的PQ乘积量化过程。使用聚类可以加速查询兴趣区域,但查询空间依然很大,而且不在同一个兴趣区域的无法查找。
技术实现思路
本专利技术旨在解决图像检索查找速度和准确度的问题。提出了一种降低了检索时间复杂度并提高准确率和召回率的结合树形聚类矢量量化算法以及基于深度学习的特征抽取方法。为实现上述目的本专利技术采用的技术方案是:一种基于树形聚类矢量量化的图像检索方法,包括训练过程和检索过程,所述训练过程包括以下步骤:S11、先将输入的原始图片进行预处理,图像大小缩放到224*224,使用ResNet-50CNN模型对图片提取2048维图像特征,保存所有图片的图像特征;S12、使用k-means++聚类算法对图像特征进行聚类得到聚类模型,聚类数为k,保存该聚类模型到树模型的当前根节点中;S13、对这k个类中的数据进行递归聚类,聚类数依然为k,以此来将所有数据全部划分到叶子结点上;S14、当子类中的数量小于N,或者树的深度达到H停止聚类;S15、保存树模型,对已有图片计算在叶子结点的位置,经过的路径即为该图片指纹,保存所有图片指纹;所述检索过程包括以下步骤:S21、对输入的查询图像进行预处理,图像大小缩放到224*224,使用ResNet-50CNN模型对图像提取2048维图像特征;S22、对S21中得到的图像特征进行递归类别预测,从根节点开始,每个聚类模型递归预测该图像特征的类别;S23、当S22中的图像已经落到叶子节点中时,输出该叶子节点的路径作为图像的指纹;S24、查找和该指纹相同的所有图像I;S25、计算该查询图像与图像I中图像矢量的余弦距离,对距离进行排序即可得到相似图像。步骤S12中所述k-means++聚类算法,按照如下聚类规则选取K个聚类中心:a)从输入的数据点集合中随机选择一个点作为第一个聚类中心μ1;b)对于数据集中的每一个点xi,计算它与已选择的聚类中心中最近聚类中心的距离D(x),该距离的计算公式为:μr为聚类中心、r为选取的聚类中心的个数、kselected选择的聚类中心c)选择一个新的数据点作为新的聚类中心,选择的原则是D(x)较大的点,被选取作为聚类中心的概率较大;d)重复b和c直到选择出k个聚类质心。所述递归聚类建树的过程为:在第一次聚类的时候聚5个类,并对这5个类继续递归的聚类下去,直到叶子节点的样本数少于设定阈值或者分裂的节点不足N个或者树的深度达到H为止。进一步,S15所述图片指纹生成过程为:对所有样本从根节点开始进行聚类的类别预测,得到预测类别的子树,再进行递归预测直到样本落到叶子节点上,样本所经过的子树编号作为生成的指纹,子树编号即为聚类的类别编号。步骤S25所述的检索过程中的余弦距离公式为:其中A、B为图像特征向量。Ai、Bi为不同的特征向量,n表示向量的个数。本专利技术的优点及有益效果如下:本专利技术将树形聚类的矢量量化算法和基于深度学习的特征提取方法相结合,利用深度学习对于图像内容和语义的精确与抽象表达能力,将非结构化的图像数据转化为结构化的矢量,然后利用树形聚类的空间划分能力进行快速检索,提升了图像检索的速度和准确率,同时,通过向上以及平行查找来提升召回。本专利技术基于树形聚类的矢量量化检索方法可以向上和平行查找,并且可以在多次聚类的同时生成指纹,并缩小查询空间。并且是递归的方式聚类,时间复杂度由O(K*m*n)降到O(log(K)*m*n),其中K是聚类中心数,m、n是数据的行列数。附图说明图1为
技术介绍
中KD树对全空间的划分过程;图2为
技术介绍
中LSH划分空间示意图;图3为本方法的流程图;图4为树模型的数据结构;图5为节点的数据结构;图6为聚类模型的数据结构;图7为ResNet-50CN本文档来自技高网
...

【技术保护点】
1.一种基于树形聚类矢量量化的图像检索方法,包括训练过程和检索过程,其特征在于:所述训练过程包括以下步骤:S11、先将输入的原始图片进行预处理,图像大小缩放到224*224,使用ResNet‑50 CNN模型对图片提取2048维图像特征,保存所有图片的图像特征;S12、使用k‑means++聚类算法对图像特征进行聚类得到聚类模型,聚类数为k,保存该聚类模型到树模型的当前根节点中;S13、对这k个类中的数据进行递归聚类,聚类数依然为k,以此来将所有数据全部划分到叶子结点上;S14、当子类中的数量小于N,或者树的深度达到H停止聚类;S15、保存树模型,对已有图片计算在叶子结点的位置,经过的路径即为该图片指纹,保存所有图片指纹;所述检索过程包括以下步骤:S21、对输入的查询图像进行预处理,图像大小缩放到224*224,使用ResNet‑50 CNN模型对图像提取2048维图像特征;S22、对S21中得到的图像特征进行递归类别预测,从根节点开始,每个聚类模型递归预测该图像特征的类别;S23、当S22中的图像已经落到叶子节点中时,输出该叶子节点的路径作为图像的指纹;S24、查找和该指纹相同的所有图像I;S25、计算该查询图像与图像I中图像矢量的余弦距离,对距离进行排序即可得到相似图像。...

【技术特征摘要】
1.一种基于树形聚类矢量量化的图像检索方法,包括训练过程和检索过程,其特征在于:所述训练过程包括以下步骤:S11、先将输入的原始图片进行预处理,图像大小缩放到224*224,使用ResNet-50CNN模型对图片提取2048维图像特征,保存所有图片的图像特征;S12、使用k-means++聚类算法对图像特征进行聚类得到聚类模型,聚类数为k,保存该聚类模型到树模型的当前根节点中;S13、对这k个类中的数据进行递归聚类,聚类数依然为k,以此来将所有数据全部划分到叶子结点上;S14、当子类中的数量小于N,或者树的深度达到H停止聚类;S15、保存树模型,对已有图片计算在叶子结点的位置,经过的路径即为该图片指纹,保存所有图片指纹;所述检索过程包括以下步骤:S21、对输入的查询图像进行预处理,图像大小缩放到224*224,使用ResNet-50CNN模型对图像提取2048维图像特征;S22、对S21中得到的图像特征进行递归类别预测,从根节点开始,每个聚类模型递归预测该图像特征的类别;S23、当S22中的图像已经落到叶子节点中时,输出该叶子节点的路径作为图像的指纹;S24、查找和该指纹相同的所有图像I;S25、计算该查询图像与图像I中图像矢量的余弦距离,对距离进行排序即可得到相似图像。2.根据权利要...

【专利技术属性】
技术研发人员:丰江帆付雪君夏英周耀韩思祺
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1