一种基于目标检测的无监督深度哈希方法技术

技术编号:22022222 阅读:31 留言:0更新日期:2019-09-04 01:16
本发明专利技术涉及一种基于目标检测的无监督深度哈希方法,属于计算机信息检索技术以及图片检索技术领域。利用目标检测获得图片中存在的物体标签,并将这些标签作为图片的伪标签,基于伪标签训练设计好的端到端深度哈希模型,得到每张图片在汉明空间中的哈希码表示;再通过对应哈希码在图片检索任务中的平均准确率均值来评价深度哈希模型的好坏;其中,平均准确率均值即MAP;所依托的无监督深度哈希模型包括目标检测算法单元以及哈希网络单元。所述方法能获得更有指导性的信息;能充分利用深度模型的能力来学习高质量的保持相似度的哈希码;在真实图片数据集中进行图片检索取得了最好的效果,即MAP值最高。

An unsupervised depth hashing method based on target detection

【技术实现步骤摘要】
一种基于目标检测的无监督深度哈希方法
本专利技术涉及一种基于目标检测的无监督深度哈希方法,属于计算机信息检索技术以及图片检索

技术介绍
随着图像数据的快速增长,近似近邻(ANN)搜索在大规模图像搜索领域受到越来越多研究者的关注。在现有的人工神经网络搜索技术中,保留相似性的哈希方法具有检索效率高、存储成本低等优点。哈希方法的主要思想是将高维数据点转换成一组紧凑的二进制代码,同时保持原始数据点的相似性。由于原始数据点是用二进制代码表示的,而不是用实值特征表示的,因此可以大大减少搜索的时间和内存开销。目前取得较好效果的哈希方法大多数都是有监督哈希方法,相比于无监督的哈希方法,有监督哈希方法需要利用到图片的类别标签信息作为监督信息来训练网络。然而,在许多实际应用中,没有可以用作监督信息的图像语义标签。因此,在这种情况下,我们可以使用无监督哈希方法来处理大规模的图像检索任务。但是,现有的很多无监督哈希方法都没有挖掘图片中潜在的标签信息并以此作为指导信息来训练模型,因而使得模型的图片检索效果较差。
技术实现思路
本专利技术的目的是为了解决深度无监督哈希方法中无法利用图片中潜在标签信息的问题本文档来自技高网...

【技术保护点】
1.一种基于目标检测的无监督深度哈希方法,其特征在于:利用目标检测获得图片中存在的物体标签,并将这些标签作为图片的伪标签,基于伪标签训练设计好的端到端深度哈希模型,得到每张图片在汉明空间中的哈希码表示;再通过对应哈希码在图片检索任务中的平均准确率均值来评价深度哈希模型的好坏;其中,平均准确率均值,即Mean Average Precision,简称MAP;基于目标检测的无监督深度哈希方法依托的无监督深度哈希模型包括目标检测算法单元以及哈希网络单元;其中,哈希网络单元包括顺序连接的五个卷积层和三个全连接层;其中,五个卷积层和三个全连接层中的前两个全连接层的激活函数均为ReLU,最后一个全连接层的...

【技术特征摘要】
1.一种基于目标检测的无监督深度哈希方法,其特征在于:利用目标检测获得图片中存在的物体标签,并将这些标签作为图片的伪标签,基于伪标签训练设计好的端到端深度哈希模型,得到每张图片在汉明空间中的哈希码表示;再通过对应哈希码在图片检索任务中的平均准确率均值来评价深度哈希模型的好坏;其中,平均准确率均值,即MeanAveragePrecision,简称MAP;基于目标检测的无监督深度哈希方法依托的无监督深度哈希模型包括目标检测算法单元以及哈希网络单元;其中,哈希网络单元包括顺序连接的五个卷积层和三个全连接层;其中,五个卷积层和三个全连接层中的前两个全连接层的激活函数均为ReLU,最后一个全连接层的激活函数为双曲正切函数tanh;目标检测算法单元与哈希网络单元相连;目标检测算法单元用于挖掘图片中的隐语义标签;哈希网络单元用于生成图片的哈希码;所述基于目标检测的无监督深度哈希方法,包括如下步骤:步骤1:选取一个目标检测方法,将该方法在大规模的图片数据集上按照选取的目标检测方法的训练步骤进行训练,输出训练好的目标检测单元;步骤2:选取公共图片数据集中百分之八十的图片作为图片数据集P,剩下的百分之二十作为测试集T;其中,图片数据集P中包含n张图片,测试集T中包含r张图片;P中的第k张图片表示为Pk∈P;k的取值范围为1到n;T中的第k张图片表示为Tk∈T;k的取值范围为1到r;步骤3:将图片数据集P中的图片输入到预训练好的目标检测单元中检测标签;若一张图片能被检测出标签,则将检测出的标签作为该图片伪标签;若检测不出标签则舍去该图片,将所有被检测出标签的图片构成新的图片数据集P′;其中,预训练好的目标检测单元即步骤1输出的训练好的目标检测单元;其中,图片数据集P′中包含m张图片,m表示被检测出标签的图片总数,且m小于等于n;P′中的第j张图片表示为P′j∈P′;j的取值范围为1到m;步骤4:根据图片数据集P′中图片的伪标签构造图片数据集P′中的图片对相似性矩阵S;其中,图片对相似性矩阵S中的第i行第j列表示为sij,S中的元素sij取值范围为[0,1],且sij越接近1表示图片Pi和图片Pj越相似,反之sij越接近0表示图片Pi和图片Pj越不相似;步骤5:初始化无监督深度哈希模型中哈希网络单元参数;其中,哈希网络单元参数,记为包括哈希网络单元中所有网络层的权重参数和偏置参数;步骤6设置收敛判断值flag为判断初始值;步骤7:选取mini-batch大小为B并对每个mini-batch集合进行训练;其中,mini-batch集合是指将图片数据集P′随机分成份,每一份有B张图片,每一份就是一个mini-batch,简记为MB;其中,表示的值向下取整;步骤7,包括如下子步骤:对图片数据集P′,按大小为B划分个mini-batch集合,对每一个MB做如下训练:步骤7.1:将MBi输入哈希网络单元,获得输出ui;其中,MBi代表MB中的第i张图片;ui表示MBi经过哈希网络单元处理后的输出;步骤7.2:对输出ui进行量化,得到bi,按照损失函数公式(2)计算损失:其中,ui表示图片Pi经过哈希网络单元处理后的输出;表示哈希网络单元中的所有权重参数及偏置参数;且表示ui和uj的点积,近似为哈希码之间的汉明距离;bi表示量化...

【专利技术属性】
技术研发人员:毛先领涂荣成黄河燕程序邹佳
申请(专利权)人:北京理工大学中电科大数据研究院有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1