一种图像检索方法及终端技术

技术编号：15329784 阅读：90 留言：0更新日期：2017-05-16 13:23

本发明专利技术实施例提供了一种图像检索方法及终端，所述方法包括：获取三元组样本，其中，所述三元组样本包括：待查询图像，正样本图像和负样本图像；采用预设卷积网络对所述三元组样本进行训练，得到图像特征三元组，其中，所述预设卷积网络至少包含四个卷积层和一个平均池化层；将所述图像特征三元组映射为目标哈希编码；采用预设三元组排序损失模型对所述目标哈希编码进行训练，得到目标相似性特征。通过本发明专利技术实施例可降低相似性特征的复杂度，从而，提高图像检索效率。

Image retrieval method and terminal

The embodiment of the invention provides an image retrieval method and a terminal. The method comprises: acquiring three tuple samples, among them, the three tuple sample include: query image, positive sample and negative sample image image; the preset convolutional network is trained on the three tuple sample image features three tuples. Among them, the preset convolutional network includes at least four rolls of laminated layer and an average pool; the image characteristic of three tuple is mapped to the target by three tuple hash encoding; default sort loss model on the target in the hash encoding training target similarity. The embodiment of the invention can reduce the complexity of the similarity feature, thereby improving the efficiency of image retrieval.

全部详细技术资料下载

【技术实现步骤摘要】
一种图像检索方法及终端
本专利技术涉及视频监控
，具体涉及一种图像检索方法及终端。
技术介绍
目前来看，以图搜图是通过搜索图像文本或者视觉特征，为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统，是搜索引擎的一种细分。涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科。商用的图像搜索引擎有谷歌图像搜索和百度图像搜索。这些搜索系统都是基于关键字和图像标签的。基于关键字的图像视频检索有着其本质的缺点。图像中内容丰富，仅用几个关键字或数句话很难表达清楚，而且不同的人对图像有不同的理解，导致同一幅图像可能会有相差很大的说明。并且，现在图像的数量呈爆炸式的增加，很多图像只有很少的文字信息或者根本就没有说明文字，想要高效地索引这些图像就需要人们手工的添加标签和说明文字，对于大量的图像来说，这是非常繁重的工作。因此，通过样本的搜索，到查询图像类似的图像搜索，已经逐渐成为现代图像搜索引擎中不可缺少的功能。一个有效的图像相似性度量是在寻找类似的图像的核心。现有技术中，对于以图搜图算法，常用的方法种类比较多，比如基于颜色、纹理和形状等。深度训练是一种目的在于建立、模拟人脑进行分析训练的深度网络，它模仿人脑的机制来解释数据。通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。它显著的优点是可抽象出高级特征，构建出复杂高性能的模型。基于深度特征训练的以图搜图方法主要包括两个步骤：一是特征提取，提取可靠稳定的特征表达图像内容；二是特征相似度度量，将不同图像特征进行比较和相似度排序，但是，由于得到的相似性特征...
一种图像检索方法及终端

【技术保护点】
一种图像检索方法，其特征在于，包括：获取三元组样本，其中，所述三元组样本包括：待查询图像，正样本图像和负样本图像；采用预设卷积网络对所述三元组样本进行训练，得到图像特征三元组，其中，所述预设卷积网络至少包含四个卷积层和一个平均池化层；将所述图像特征三元组映射为目标哈希编码；采用预设三元组排序损失模型对所述目标哈希编码进行训练，得到目标相似性特征。

【技术特征摘要】
1.一种图像检索方法，其特征在于，包括：获取三元组样本，其中，所述三元组样本包括：待查询图像，正样本图像和负样本图像；采用预设卷积网络对所述三元组样本进行训练，得到图像特征三元组，其中，所述预设卷积网络至少包含四个卷积层和一个平均池化层；将所述图像特征三元组映射为目标哈希编码；采用预设三元组排序损失模型对所述目标哈希编码进行训练，得到目标相似性特征。2.根据权利要求1所述的方法，其特征在于，所述将所述图像特征三元组映射为目标哈希编码，包括：将所述图像特征三元组中处于所述预设卷积网络的指定层特征分割成等长的Q个片段，所述Q为大于1的整数；通过所述预设卷积网络的全连接层分别将所述Q个片段映射成一维向量，得到所述Q个一维向量；通过sigmoid激活函数将所述Q个一维向量的值限制在0到1之间，得到所述Q个目标一维向量；按照如下公式将所述Q个目标一维向量的值转换成二进制的哈希编码，得到所述Q个哈希编码：其中：ε为预设阈值，s为一维向量的任一位，H为哈希编码；将所述Q个哈希编码进行连接，得到所述目标哈希编码。3.根据权利要求1或2任一项所述的方法，其特征在于，所述采用预设三元组排序损失模型对所述目标哈希编码进行训练，得到目标相似性特征，包括：按照如下公式对所述目标哈希编码进行训练，得到目标相似性特征：rI,I+≥rI,I-其中，Iq表示所述待查询图像，q表示卷积最大激活区域，I+表示所述正样本图像，I-表示所述负样本图像，m为常数，l(Iq,I+,I-)为目标相似性特征。4.根据权利要求1或2任一项所述的方法，其特征在于，所述预设卷积网络的每一卷积层插入了1×1的滤波卷积层，且所述每一卷积层包含矫正激活函数。5.根据权利要求1所述的方法，其特征在于，所述采用预设三元组排序损失模型对所述目标哈希编码进行训练，得到目标相似性特征之后，所述方法还包括：根据所述目标相似性特征，确定所述待查询图像与预设图像库中的N张图像中的每一图像之间的汉明距离，得到所述N个汉明距离值，所述N为正整数；将所述N个汉明距离值中的最小值对应的图像作为目标图像。6.一种终端，其特征在于，包括：获取单元，用于获取...

【专利技术属性】
技术研发人员：吴伟华，康春生，蔡复兴，
申请(专利权)人：深圳市华尊科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人