一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法技术

技术编号：19857888 阅读：38 留言：0更新日期：2018-12-22 11:47

本发明专利技术提供了一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法，基于分类任务可以提高哈希码的判别性及聚合性和检索任务可以保留哈希码的语义相似性，将分类任务与检索任务融入只有一个输出的单流(one‑stream)框架里，充分利用语义监督信息，以提高哈希码的紧致性、判别性及保留哈希码的语义相似性；本发明专利技术方案构建了单流(one‑stream)网络框架，结合多任务学习的方法，提高了哈希检索性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法
本专利技术涉及一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法，涉及图像检索领域。
技术介绍
互联网及移动终端设备的普及带来了多媒体数据(图像、文本、语音及视频等)的快速增长。面对如此大规模的数据，如何有效地存储、分析和管理这些数据成为了极具挑战的问题。如何设计一种可以用于大尺度图像语义检索任务的高效检索算法成为了一个热门的研究问题。在检索任务中，传统的实值描述符如词袋(BoW)、颜色直方图、空间描述符(GIST)等等需要消耗大量的内存及计算资源。为了解决基于实值的大规模图像检索问题，提出了一些基于树的方法，例如kd-tree和R-tree。然而，因为维度灾难的存在，相似性检索效率随着数据维度的增加而减少。为了减少维度灾难的影响，一些早期的数据独立哈希方法如局部敏感性哈希(LSH)采用随机线性投影的方法将高维空间的实值描述符投影到低维的哈明空间。这类哈希方法的主要缺陷是在短的码长检索性能不能令人满意。为了学习更加有效和紧致的哈希码，一些研究者通过机器学习的方法设计了一些数据独立的哈希方法学习哈希函数。现有的数据独立的哈希方法可以大致分成两种：无监督的哈希方法和有监督的哈希方法。无监督的哈希方法利用样本的内在数据特性而没有利用任何标签信息学习二值码。其中代表性的哈希方法包括谱哈希(SH)、迭代量化(ITQ)、各项异性哈希(IsoH)、锚点图哈希(AGH)等等。这类方法的缺点是在实际应用中很难取得满意的检索性能。为了提升哈希的性能，监督的哈希方法将标签信息引入学习模型。代...

【技术保护点】
1.一种基于多任务学习深度语义哈希的快速图像检索模型构建方法，具体方法包括，S1，收集大量的训练图片，并进行图片类别标注；调整所有图片的大小到一个固定尺寸；将整个数据库随机划分成三个集合：查询集、数据库集和训练集。S2：构建一个哈希学习网络，对所构建的哈希学习网络进行参数初始化；在哈希学习网络的最后添加损失层。网络的损失函数J定义如下：J＝NJcl+λJre其中N代表训练集图像的总数，λ表示超参数以平衡用于分类任务的COCO损失Jcl及检索任务的成对损失Jre；对于单标签情形，采用下面的损失函数形式用于分类任务哈希码的学习：

【技术特征摘要】
1.一种基于多任务学习深度语义哈希的快速图像检索模型构建方法，具体方法包括，S1，收集大量的训练图片，并进行图片类别标注；调整所有图片的大小到一个固定尺寸；将整个数据库随机划分成三个集合：查询集、数据库集和训练集。S2：构建一个哈希学习网络，对所构建的哈希学习网络进行参数初始化；在哈希学习网络的最后添加损失层。网络的损失函数J定义如下：J＝NJcl+λJre其中N代表训练集图像的总数，λ表示超参数以平衡用于分类任务的COCO损失Jcl及检索任务的成对损失Jre；对于单标签情形，采用下面的损失函数形式用于分类任务哈希码的学习：其中ui表示网络最后一层经过tanh(·)激活函数的输出Y表示训练样本的标签矩阵，L表示类别数目，ck表示第k类的中心；对于多标签情形，采用下面的损失函数形式用于分类任务哈希码的学习：其中C＝[c1,c2,…,cL]表示在单标签情形下的原类别中心，表示给定的第i张图片的新的语义中心；针对检索任务，采用下面的成对损失形式：其中S∈{-1,1}N×N表示相似性矩阵，表示两张图片的汉明相似性；S3，将训练图片的RGB三个通道分别减去一个恒定的值作归一化处理；将归一化后的图片输入网络，经过最后tanh(·)激活函数的输出得到近似二值码的特征表示其中K表示哈希码的码长；对于单标签情形，计算损失函数对ui的偏导数其中对于多标签情形，计算损失函数对ui的偏导数其中利用反向传播算法，求得损失函数对网络参数Θ的偏导数；网络参数的更新使用梯度下降算法；对于语义中心的更新，分成...

【专利技术属性】
技术研发人员：李宏亮，马雷，
申请(专利权)人：成都快眼科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人