基于深度哈希和GPU加速的大规模图像检索方法技术

技术编号:19635223 阅读:32 留言:0更新日期:2018-12-01 15:55
本发明专利技术公开了基于深度哈希和GPU加速的大规模图像检索方法,该方法基于图片对的哈希方法,采用多任务深度学习机制,将分类损失函数与对比损失函数相结合,量化过程中,在保留图片对之间的相似性的同时,尽可能地保留图片本身的语义信息,分类任务与量化任务互相指导学习;同时,采用局部连接模块取代量化网络的全连接层,减少特征之间的冗余信息。设计并实现了更深层次的网络,深层次网络通常能够得到良好的特征表达。在汉明排序的基础上,实现了基于GPU的多层次并行检索方法。本发明专利技术不仅提高了检索精度,且能够在百万规模的图像库中完成单张检索延时0.8ms的效果。

Large-scale image retrieval method based on depth hashing and GPU acceleration

The invention discloses a large-scale image retrieval method based on depth hashing and GPU acceleration. The method is based on image pair hashing method, adopts multi-task depth learning mechanism, combines classification loss function with contrast loss function, and preserves as much as possible the similarity between image pairs in the quantization process. The semantic information of the image itself, the classification task and the quantization task guide each other to learn. At the same time, the local connection module is used to replace the full connection layer of the quantization network to reduce redundant information between features. A deeper network is designed and implemented, and the deep network can usually get good feature expression. On the basis of Hamming ranking, a multi-level parallel retrieval method based on GPU is implemented. The invention not only improves the retrieval accuracy, but also achieves the effect of 0.8ms delay in single sheet retrieval in a million-scale image database.

【技术实现步骤摘要】
基于深度哈希和GPU加速的大规模图像检索方法
本专利技术涉及计算机视觉领域,具体涉及一种基于深度哈希和GPU加速的大规模图像检索方法。
技术介绍
近年来,随着互联网络以及各种多媒体设备的飞速发展,从互联网中获取图像变得越来越方便快捷,同时,当前社交网络变得越来越流行,比如Facebook,QQ等,据不完全统计,互联网中每月增加的图片数量在十亿级别;无独有偶,随着人们对网购越来越习惯,目前的各大电商平台后台系统中也积累了数百亿的图片。对于这些海量的数据,如何去组织、有效利用这些数据成为了一个亟待解决的问题,因此,图像检索技术备受关注并得到了迅速地发展。但面对这如今大规模的图像集合,该技术仍然因为图像数据量大、特征维度高、要求检索速度快等面临着巨大的挑战。基于内容的图像检索过程分为图像预处理、图像特征表达、建立图像数据库、查询数据库等几个步骤,首先,对要建立数据库的所有图片进行预处理,提取特征,建立特征数据库,然后为待检索图片进行预处理以及特征提取,按照一定的方式对特征数据库进行查询,最后返回最相似的结果。最近邻检索作为图像检索领域中一个最重要的方法,其基本算法思想为:假设数据库规模为n本文档来自技高网...

【技术保护点】
1.基于深度哈希和GPU加速的大规模图像检索方法,其特征在于,该方法包括以下步骤:步骤一、将分类任务和量化任务融合到一个完整网络中,在训练数据集上进行多任务深度学习训练,得到深度哈希网络模型;步骤二、在GPU中,采用步骤一训练得到的深度哈希网络模型对待检索图片进行多层次并行检索,具体步骤包括:步骤2.1使用步骤一训练得到的深度哈希模型对待检索图片提取浮点特征和哈希特征;步骤2.2批次计算待检索图片的哈希特征和特征数据库中哈希特征的汉明距离,同时统计所有汉明距离的数量信息;步骤2.3使用分析核函数与索引选取核函数根据汉明距离和统计信息,对满足候选条件的图片索引进行选取得到候选集;步骤2.4使用欧...

【技术特征摘要】
1.基于深度哈希和GPU加速的大规模图像检索方法,其特征在于,该方法包括以下步骤:步骤一、将分类任务和量化任务融合到一个完整网络中,在训练数据集上进行多任务深度学习训练,得到深度哈希网络模型;步骤二、在GPU中,采用步骤一训练得到的深度哈希网络模型对待检索图片进行多层次并行检索,具体步骤包括:步骤2.1使用步骤一训练得到的深度哈希模型对待检索图片提取浮点特征和哈希特征;步骤2.2批次计算待检索图片的哈希特征和特征数据库中哈希特征的汉明距离,同时统计所有汉明距离的数量信息;步骤2.3使用分析核函数与索引选取核函数根据汉明距离和统计信息,对满足候选条件的图片索引进行选取得到候选集;步骤2.4使用欧式距离和浮点特征进行二次相似性计算,并使用K近邻算法从候选集中选出结果。2.根据权利要求1所述的基于深度哈希和GPU加速的大规模图像检索方法,其特征在于,所述步骤一中所述的深度哈希网络模型包括由ResNet的BuildingBlock堆叠而成的神经网络,并结合损失函数解决分类损失与量化损失对网络参数更新的影响程度,该损失函数表示如下:式中,Ls为对比损失函数,Liden为分类损失函数,W为网络的可学习参数,α和β是两个权重因子,N为训练数据集中图片的数量,P为训练数据集经过完全组合能够得到的图片对数量,yi表示第i个图片对的相似情况,||hi,a-hi,b||2表示第i个图片对之间的欧式距离,||·||1表示L1范数,其中I表示与其相减向量同维度...

【专利技术属性】
技术研发人员:段翰聪付美蓉黄子镭闵革勇谭春强
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1