一种图像检索方法及终端技术

技术编号:15329784 阅读:90 留言:0更新日期:2017-05-16 13:23
本发明专利技术实施例提供了一种图像检索方法及终端,所述方法包括:获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;将所述图像特征三元组映射为目标哈希编码;采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。通过本发明专利技术实施例可降低相似性特征的复杂度,从而,提高图像检索效率。

Image retrieval method and terminal

The embodiment of the invention provides an image retrieval method and a terminal. The method comprises: acquiring three tuple samples, among them, the three tuple sample include: query image, positive sample and negative sample image image; the preset convolutional network is trained on the three tuple sample image features three tuples. Among them, the preset convolutional network includes at least four rolls of laminated layer and an average pool; the image characteristic of three tuple is mapped to the target by three tuple hash encoding; default sort loss model on the target in the hash encoding training target similarity. The embodiment of the invention can reduce the complexity of the similarity feature, thereby improving the efficiency of image retrieval.

【技术实现步骤摘要】
一种图像检索方法及终端
本专利技术涉及视频监控
,具体涉及一种图像检索方法及终端。
技术介绍
目前来看,以图搜图是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科。商用的图像搜索引擎有谷歌图像搜索和百度图像搜索。这些搜索系统都是基于关键字和图像标签的。基于关键字的图像视频检索有着其本质的缺点。图像中内容丰富,仅用几个关键字或数句话很难表达清楚,而且不同的人对图像有不同的理解,导致同一幅图像可能会有相差很大的说明。并且,现在图像的数量呈爆炸式的增加,很多图像只有很少的文字信息或者根本就没有说明文字,想要高效地索引这些图像就需要人们手工的添加标签和说明文字,对于大量的图像来说,这是非常繁重的工作。因此,通过样本的搜索,到查询图像类似的图像搜索,已经逐渐成为现代图像搜索引擎中不可缺少的功能。一个有效的图像相似性度量是在寻找类似的图像的核心。现有技术中,对于以图搜图算法,常用的方法种类比较多,比如基于颜色、纹理和形状等。深度训练是一种目的在于建立、模拟人脑进行分析训练的深度网络,它模仿人脑的机制来解释数据。通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。它显著的优点是可抽象出高级特征,构建出复杂高性能的模型。基于深度特征训练的以图搜图方法主要包括两个步骤:一是特征提取,提取可靠稳定的特征表达图像内容;二是特征相似度度量,将不同图像特征进行比较和相似度排序,但是,由于得到的相似性特征较为复杂,因而,图像的检索效率较低。
技术实现思路
本专利技术实施例提供了一种图像检索方法及终端,以期降低相似性特征的复杂度,从而,提高图像检索效率。本专利技术实施例第一方面提供了一种图像检索方法,包括:获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;将所述图像特征三元组映射为目标哈希编码;采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。可选地,所述将所述图像特征三元组映射为目标哈希编码,包括:将所述图像特征三元组中处于所述预设卷积网络的指定层特征分割成等长的Q个片段,所述Q为大于1的整数;通过所述预设卷积网络的全连接层分别将所述Q个片段映射成一维向量,得到所述Q个一维向量;通过sigmoid激活函数将所述Q个一维向量的值限制在0到1之间,得到所述Q个目标一维向量;按照如下公式将所述Q个目标一维向量的值转换成二进制的哈希编码,得到所述Q个哈希编码:其中:ε为预设阈值,s为一维向量的任一位,H为哈希编码;将所述Q个哈希编码进行连接,得到所述目标哈希编码。可选地,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征,包括:按照如下公式对所述目标哈希编码进行训练,得到目标相似性特征:其中,Iq表示所述待查询图像,q表示卷积最大激活区域,I+表示所述正样本图像,I-表示所述负样本图像,m为常数,l(Iq,I+,I-)为目标相似性特征。可选地,所述预设卷积网络的每一卷积层插入了1×1的滤波卷积层,且所述每一卷积层包含矫正激活函数。可选地,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征之后,所述方法还包括:根据所述目标相似性特征,确定所述待查询图像与预设图像库中的N张图像中的每一图像之间的汉明距离,得到所述N个汉明距离值,所述N为正整数;将所述N个汉明距离值中的最小值对应的图像作为目标图像。本专利技术实施例第二方面提供了一种终端,包括:获取单元,用于获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;第一训练单元,用于采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;映射单元,用于将所述图像特征三元组映射为目标哈希编码;第二训练单元,用于采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。可选地,所述映射单元包括:分割模块,用于将所述图像特征三元组中处于所述预设卷积网络的指定层特征分割成等长的Q个片段,所述Q为大于1的整数;映射模块,用于通过所述预设卷积网络的全连接层分别将所述Q个片段映射成一维向量,得到所述Q个一维向量;处理模块,用于通过sigmoid激活函数将所述Q个一维向量的值限制在0到1之间,得到所述Q个目标一维向量;转换模块,用于按照如下公式将所述Q个目标一维向量的值转换成二进制的哈希编码,得到所述Q个哈希编码:其中:ε为预设阈值,s为一维向量的任一位,H为哈希编码;连接模块,用于将所述Q个哈希编码进行连接,得到所述目标哈希编码。可选地,所述第二训练单元具体用于:按照如下公式对所述目标哈希编码进行训练,得到目标相似性特征:其中,Iq表示所述待查询图像,q表示卷积最大激活区域,I+表示所述正样本图像,I-表示所述负样本图像,m为常数,l(Iq,I+,I-)为目标相似性特征。可选地,所述预设卷积网络的每一卷积层插入了1×1的滤波卷积层,且所述每一卷积层包含矫正激活函数。可选地,所述终端还包括:确定单元,用于在所述第二训练单元采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征之后,根据所述目标相似性特征,确定所述待查询图像与预设图像库中的N张图像中的每一图像之间的汉明距离,得到所述N个汉明距离值,所述N为正整数;所述确定单元还具体用于:将所述N个汉明距离值中的最小值对应的图像作为目标图像。实施本专利技术实施例,具有如下有益效果:通过本专利技术实施例,获取三元组样本,其中,该三元组样本包括:待查询图像,正样本图像和负样本图像,采用预设卷积网络对三元组样本进行训练,得到图像特征三元组,其中,预设卷积网络至少包含四个卷积层和一个平均池化层,将图像特征三元组映射为目标哈希编码,采用预设三元组排序损失模型对目标哈希编码进行训练,得到目标相似性特征。如此,可降低相似性特征的复杂度,从而,提高图像检索效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种图像检索方法的第一实施例流程示意图;图2是本专利技术实施例提供的一种图像检索方法的第二实施例流程示意图;图3a是本专利技术实施例提供的一种终端的第一实施例结构示意图;图3b是本专利技术实施例提供的图3a所描述的终端的映射单元的结构示意图;图3c是本专利技术实施例提供的图3a所描述的终端的又一结构示意图;图4是本专利技术实施例提供的一种终端的第二实施例结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下本文档来自技高网
...
一种图像检索方法及终端

【技术保护点】
一种图像检索方法,其特征在于,包括:获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;将所述图像特征三元组映射为目标哈希编码;采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。

【技术特征摘要】
1.一种图像检索方法,其特征在于,包括:获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;将所述图像特征三元组映射为目标哈希编码;采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。2.根据权利要求1所述的方法,其特征在于,所述将所述图像特征三元组映射为目标哈希编码,包括:将所述图像特征三元组中处于所述预设卷积网络的指定层特征分割成等长的Q个片段,所述Q为大于1的整数;通过所述预设卷积网络的全连接层分别将所述Q个片段映射成一维向量,得到所述Q个一维向量;通过sigmoid激活函数将所述Q个一维向量的值限制在0到1之间,得到所述Q个目标一维向量;按照如下公式将所述Q个目标一维向量的值转换成二进制的哈希编码,得到所述Q个哈希编码:其中:ε为预设阈值,s为一维向量的任一位,H为哈希编码;将所述Q个哈希编码进行连接,得到所述目标哈希编码。3.根据权利要求1或2任一项所述的方法,其特征在于,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征,包括:按照如下公式对所述目标哈希编码进行训练,得到目标相似性特征:rI,I+≥rI,I-其中,Iq表示所述待查询图像,q表示卷积最大激活区域,I+表示所述正样本图像,I-表示所述负样本图像,m为常数,l(Iq,I+,I-)为目标相似性特征。4.根据权利要求1或2任一项所述的方法,其特征在于,所述预设卷积网络的每一卷积层插入了1×1的滤波卷积层,且所述每一卷积层包含矫正激活函数。5.根据权利要求1所述的方法,其特征在于,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征之后,所述方法还包括:根据所述目标相似性特征,确定所述待查询图像与预设图像库中的N张图像中的每一图像之间的汉明距离,得到所述N个汉明距离值,所述N为正整数;将所述N个汉明距离值中的最小值对应的图像作为目标图像。6.一种终端,其特征在于,包括:获取单元,用于获取...

【专利技术属性】
技术研发人员:吴伟华康春生蔡复兴
申请(专利权)人:深圳市华尊科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1