一种基于循环神经网络的图像哈希码生成方法技术

技术编号：22330199 阅读：47 留言：0更新日期：2019-10-19 12:17

本发明专利技术公开了一种基于循环神经网络的图像哈希码生成方法，通过多实例学习提取图像的属性，并使用注意机制在该LSTM中利用和计算训练中的属性，以便在每个时间步骤关注图像/图像批次的不同属性。在提取之后，基于LSTM来近似每个时间步长之间的维数减少并且去相关，以便逐位地生成有意义的缩放矢量，然后，通过LSTM输出经过全连接层生成一个向量和图像特征图像特征通过另一个全连接层输出另个向量，二者点乘后，用三元组损失函数优化，得到图像哈希码。与仅从图像特征生成的哈希码相比，生成的哈希码的性能从深度特征和语义属性中获益更多。此外，特征和属性的融合使图像哈希码获得检索能力和可区分的语义含义。

An image hash code generation method based on recurrent neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于循环神经网络的图像哈希码生成方法
本专利技术属于图像检索
，更为具体地讲，涉及一种基于循环神经网络的图像哈希码生成方法。
技术介绍
由于近年来互联网上的数据在存储和类别方面都有快速增长的速度，人们自然会被鼓励寻求新的方法来快速有效地生成数据模式。基于内容的信息检索(CBIR)是一种专注于基于视觉内容查询和索引大型数据集的技术，是许多多媒体应用的关键，包括人脸识别，动作检测等。哈希学习尤其是大数据哈希学习是根据基于内容的信息检索思路形成的一种重要方法。哈希学习的原理是基于近似最近邻(ANN)搜索，生成尽可能保留数据空间结构的由1/-1组成的哈希码。从局部敏感哈希(LSH)到现在的一系列新方法，证明了哈希学习是一种前景良好的检索技术。仅将生成的图像特征用于深度学习并不是唯一的解决方案。通常，对目标哈希函数生成的二进制代码施加的离散约束将导致在网络中的梯度下降出现困难，这些问题通常是NP难的。为了简化二进制代码学习过程中涉及的优化，大多数上述方法选择首先通过丢弃离散约束来解决松弛问题，然后求解出一个连续解以实现近似二元解。这种放松方案极大地简化了原始的离散优化。遗憾的是，这种近似解决方案通常具有低质量并且经常使得所得到的散列函数可能由于累积的量化误差而不太有效，这在学习较长长度的哈希码时尤其如此。另一方面，当尝试将深度学习调整为哈希学习任务时，其与深度学习的集成是一个至关重要的问题。最近的进展证明了卷积神经网络(CNN)在图像分类，物体检测，人脸识别和许多其他视觉任务中的不同变化的令人印象深刻的学习能力。CNN在各种任务中的成功应用表明，CNN学到...

【技术保护点】
1.一种基于循环神经网络的图像哈希码生成方法，其特征在于，包括以下步骤：(1)、利用卷积神经网络(CNN)提取图像的特征(图像特征)，采用多实例学习(MIL)提取图像的属性(图像属性)：在VGG‑16网络上应用MIL机制，用一个改变VGG‑16的fc8层的原始计算sigmoid激活层通过预测边界来计算边界框中(bounding box)的误差函数，边界框通过词袋(bag of words)模型训练语料库，使用MIL的组合OR版本，可以表示为：

【技术特征摘要】
1.一种基于循环神经网络的图像哈希码生成方法，其特征在于，包括以下步骤：(1)、利用卷积神经网络(CNN)提取图像的特征(图像特征)，采用多实例学习(MIL)提取图像的属性(图像属性)：在VGG-16网络上应用MIL机制，用一个改变VGG-16的fc8层的原始计算sigmoid激活层通过预测边界来计算边界框中(boundingbox)的误差函数，边界框通过词袋(bagofwords)模型训练语料库，使用MIL的组合OR版本，可以表示为：其中，p(bi|w)是包含在词袋w中的单词bi出现(在该张图片中)的总概率，由一个属性向量表示，表示给定的图像i中的图像区域j中出现词袋w的概率；(2)、将图像特征经过初始化即全连接层降为n维后，与属性向量作为注意机制(attentionmechanism)中的上下文向量(contextvector)继续处理后的向量进行融合，得到融合特征向量xt,t＝0,1,...,n-1，n为融合特征向量的数量；(3)、将融合特征向量xt依次输入到长短期记忆网络(LSTM，LongShort-Te...

【专利技术属性】
技术研发人员：杨阳，汪政，傅熙尧，
申请(专利权)人：成都澳海川科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人