一种基于树形聚类矢量量化的图像检索方法技术

技术编号：21432237 阅读：35 留言：0更新日期：2019-06-22 11:56

本发明专利技术请求保护一种基于树形聚类矢量量化的图像检索方法，包括步骤：S1对图片进行预处理并提取出图片的矢量特征；S2对图像的矢量进行聚类；S3使用递归聚类对数据空间进行划分；S4根据制定的规则使聚类停止；S5保存图片的路径指纹以及树模型。本发明专利技术基于树形聚类的矢量量化算法，并利用深度学习模型的特征抽取能力提取出图片的高维特征向量，充分表达了图像的内容与语义，结合了树形聚类算法的查找能力，提升了图像检索的准确度以及检索速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于树形聚类矢量量化的图像检索方法
本专利技术属于图像检索领域，特别涉及基于树形聚类的矢量量化算法和深度学习的特征提取方法以及两种方法的结合。
技术介绍
随着移动互联网技术的飞速发展，图像、视频、音频、文本等异构数据每天都在以惊人的速度增长。例如，Facebook注册用户超过10亿，每月上传超过10亿的图片；Flickr图片社交网站2015年用户上传图片数目达7.28亿，平均每天用户上传约200万的图片；中国最大的电子商务系统淘宝网的后端系统上保存着286亿多张图片。针对这些包含丰富视觉信息的海量图片，如何在这些浩瀚的图像库中方便、快速、准确地查询并检索到用户所需的或感兴趣的图像，成为多媒体信息检索领域研究的热点。从宏观上对ANN(ApproximateNearestNeighbor，此ANN非彼ANN，ArtificialNeuralNetwork)有下面的认知很有必要：brute-force搜索的方式是在全空间进行搜索，为了加快查找的速度，几乎所有的ANN方法都是通过对全空间分割，将其分割成很多小的子空间，在搜索的时候，通过某种方式，快速锁定在某一(几)子空间，然后在该(几个)子空间里做遍历。可以看到，正是因为缩减了遍历的空间大小范围，从而使得ANN能够处理大规模数据的索引。在大数据时代，如何快速的进行图像搜索呢，现有图像搜索方法大致可以分为三类：基于树的方法、基于哈希方法、基于矢量量化的方法。基于树的方法采用树这种数据结构的方法来表达对全空间的划分，其中又以KD树最为经典。图1是KD树对全空间的划分过程，以及用树这种数据结构来表达的一个过程。一般...

【技术保护点】
1.一种基于树形聚类矢量量化的图像检索方法，包括训练过程和检索过程，其特征在于：所述训练过程包括以下步骤：S11、先将输入的原始图片进行预处理，图像大小缩放到224*224，使用ResNet‑50 CNN模型对图片提取2048维图像特征，保存所有图片的图像特征；S12、使用k‑means++聚类算法对图像特征进行聚类得到聚类模型，聚类数为k，保存该聚类模型到树模型的当前根节点中；S13、对这k个类中的数据进行递归聚类，聚类数依然为k，以此来将所有数据全部划分到叶子结点上；S14、当子类中的数量小于N，或者树的深度达到H停止聚类；S15、保存树模型，对已有图片计算在叶子结点的位置，经过的路径即为该图片指纹，保存所有图片指纹；所述检索过程包括以下步骤：S21、对输入的查询图像进行预处理，图像大小缩放到224*224，使用ResNet‑50 CNN模型对图像提取2048维图像特征；S22、对S21中得到的图像特征进行递归类别预测，从根节点开始，每个聚类模型递归预测该图像特征的类别；S23、当S22中的图像已经落到叶子节点中时，输出该叶子节点的路径作为图像的指纹；S24、查找和该指纹相同的所有...

【技术特征摘要】
1.一种基于树形聚类矢量量化的图像检索方法，包括训练过程和检索过程，其特征在于：所述训练过程包括以下步骤：S11、先将输入的原始图片进行预处理，图像大小缩放到224*224，使用ResNet-50CNN模型对图片提取2048维图像特征，保存所有图片的图像特征；S12、使用k-means++聚类算法对图像特征进行聚类得到聚类模型，聚类数为k，保存该聚类模型到树模型的当前根节点中；S13、对这k个类中的数据进行递归聚类，聚类数依然为k，以此来将所有数据全部划分到叶子结点上；S14、当子类中的数量小于N，或者树的深度达到H停止聚类；S15、保存树模型，对已有图片计算在叶子结点的位置，经过的路径即为该图片指纹，保存所有图片指纹；所述检索过程包括以下步骤：S21、对输入的查询图像进行预处理，图像大小缩放到224*224，使用ResNet-50CNN模型对图像提取2048维图像特征；S22、对S21中得到的图像特征进行递归类别预测，从根节点开始，每个聚类模型递归预测该图像特征的类别；S23、当S22中的图像已经落到叶子节点中时，输出该叶子节点的路径作为图像的指纹；S24、查找和该指纹相同的所有图像I；S25、计算该查询图像与图像I中图像矢量的余弦距离，对距离进行排序即可得到相似图像。2.根据权利要...

【专利技术属性】
技术研发人员：丰江帆，付雪君，夏英，周耀，韩思祺，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人