一种基于深度哈希的类别失衡图像分层检索方法技术

技术编号：35000050 阅读：18 留言：0更新日期：2022-09-21 14:49

本发明专利技术涉及一种基于深度哈希的类别失衡图像分层检索方法，包括：S1、获取训练数据集输入到网络模型的特征提取模块，经多个卷积层处理后得到图像的高维特征向量；S2、高维特征向量输入到网络模型的隐含层，隐含层根据高维特征向量来学习图像的特征表示，同时输出图像对应的近似哈希码；S3、近似哈希码经激活函数与量化处理后形成离散的二进制串，作为最终哈希码输入到隐含层的分类层中，分类层通过二次检索方法计算出图库中对应的图像，完成分类模型的训练；S4、将待检索图像输入到完成训练的分类模型中，输出待检索图像在图库中对应的图像。与现有技术相比，本发明专利技术具有提高图像检索精度，减少模型参数量，使模型移植、存储更为方便等优点。便等优点。便等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度哈希的类别失衡图像分层检索方法

[0001]本专利技术涉及图像识别
，尤其是涉及一种基于深度哈希的类别失衡图像分层检索方法。

技术介绍

[0002]二十一世纪，世界进入“互联网时代”，互联网的发展给人类生活提供了巨大的便利，各类社交软件和电商平台的出现，让人们不出家门便可实现与亲朋好友分享所见所景和购遍全球好物的愿望。这些软件的快速发展也使得互联网上相关图像、视频的数据量飞速增加。据有关资料显示，全球用户每天在社交平台上上传的图片量接近10亿张，而线上购物平台内更是存储有286亿多张图片。在这种情况下，如何使得每个用户都能从大规模图像数据中快速找到想要的图像变成了一个亟待解决的难题，该问题的解决方案就是使用图像检索技术。
[0003]图像检索技术的主要流程首先需要找到图像的一种可量化的表达方式，然后利用一种距离度量方式将待检索图像与图像库中的图像进行一一对比，求得它们之间的相似性度量，然后根据度量结果进行排序并输出对应的图像，即获得图像检索的结果。在图像检索技术发展的早期，主要使用基于文本的图像检索方法(Text
‑
Based Image Retrieval，TBIR)，主要思想是先将图像的内容用文字来表示，即人为对图像进行标注，接下来的图像检索过程其实就是对标注内容进行匹配的过程，根据搜索的内容找到匹配的图像标注后，再根据标注找到其对应的图像数据。这种方式操作简单、检索效率高，但是在图像数据规模急剧增大的情况下，对图像进行标注极其耗费人力、物力，并且图像标注的内容受人的主...

【技术保护点】

【技术特征摘要】
1.一种基于深度哈希的类别失衡图像分层检索方法，其特征在于，具体包括以下步骤：S1、获取训练数据集输入到网络模型的特征提取模块，经多个卷积层处理后得到图像的高维特征向量；S2、高维特征向量输入到网络模型的隐含层，隐含层根据高维特征向量来学习图像的特征表示，同时输出图像对应的近似哈希码；S3、近似哈希码经激活函数与量化处理后形成离散的二进制串，作为最终哈希码输入到隐含层的分类层中，分类层通过二次检索方法计算出图库中对应的图像，完成分类模型的训练；S4、将待检索图像输入到完成训练的分类模型中，输出待检索图像在图库中对应的图像。2.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法，其特征在于，所述隐含层的结构具体为采用1*1卷积核和全局平均池化操作，或采用分块全连接层的结构。3.根据权利要求2所述的一种基于深度哈希的类别失衡图像分层检索方法，其特征在于，所述1*1卷积核对高维特征向量进行降维操作，全局平均池化操作对特征图进行压缩，将生成的特征图内数据取均值作为输出。4.根据权利要求2所述的一种基于深度哈希的类别失衡图像分层检索方法，其特征在于，所述分块全连接层对高维特征向量的处理过程具体为将高维特征向量分为多个特征片段，每个特征片段通过一个全连接层生成输出结点，公式如下：fc
i
(x
(i)
)＝W
i
x
(i)
其中，x
(i)
为特征片段，W
i
为对应的参数矩阵，fc
i
为输出结点的特征值。5.根据权利要求1所述的一种基于深度哈希的类别失衡图像分层检索方法，其特征在于，所述步骤S3中计算最终哈希码的公式如下所示...

【专利技术属性】
技术研发人员：李冰，赵生捷，姚晗，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人