用于检索图像的方法、电子设备和计算机可读存储介质技术

技术编号：20866406 阅读：24 留言：0更新日期：2019-04-17 09:20

根据本公开的实施例，提供了用于检索图像的方法、电子设备和计算机可读存储介质。该方法包括：使用第一神经网络来处理待检索图像，以确定所述待检索图像的局部特征向量；使用第二神经网络来处理所述待检索图像，以确定所述待检索图像的全局特征向量；以及基于所述局部特征向量和所述全局特征向量，确定与所述待检索图像的相似度高于预定阈值的图像。

全部详细技术资料下载

【技术实现步骤摘要】
用于检索图像的方法、电子设备和计算机可读存储介质
本公开涉及图像处理领域，且更具体地涉及用于检索图像的方法、电子设备和计算机可读存储介质。
技术介绍
深度学习是近十年来人工智能领域取得的最重要的突破之一。它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域都取得了巨大成功。例如，在传统的图像检索技术中，通常可利用图像的底层可视化特征来进行检索。但是由于底层特征与高层语义之间存在“语义鸿沟”问题，导致图像检索效果不满意。相对地，在基于深度学习的图像检索技术中，可以使用卷积神经网络(CNN)来进行图像检索，其具有强大的学习能力、高效的特征表达能力，能够从像素级原始数据到抽象的语义概念逐层提取信息。这使得它在提取图像的全局特征和上下文信息方面具有突出的优势，可以通过组合低级的特征形成更加抽象的高层表示属性类别或者特征，在图像检索中获得好的效果。
技术实现思路
然而，由于视角、距离、光照等因素的变化而经常导致图像检索的结果并不能令人十分满意，因此需要一种能够提高图像检索准确度的方案。为了至少部分解决或减轻上述问题，提供了根据本公开实施例的用于检索图像的方法、设备和计算机可读存储介质。根据本公开的第一方面，提供了一种用于检索图像的方法。该方法包括：使用第一神经网络来处理待检索图像，以确定所述待检索图像的局部特征向量；使用第二神经网络来处理所述待检索图像，以确定所述待检索图像的全局特征向量；以及基于所述局部特征向量和所述全局特征向量，确定与所述待检索图像的相似度高于预定阈值的图像。在一些实施例中，所述第一神经网络是使用图像的具有不同分辨率的多个图像数据...

【技术保护点】
1.一种用于检索图像的方法，包括：使用第一神经网络来处理待检索图像，以确定所述待检索图像的局部特征向量；使用第二神经网络来处理所述待检索图像，以确定所述待检索图像的全局特征向量；以及基于所述局部特征向量和所述全局特征向量，确定与所述待检索图像的相似度高于预定阈值的图像。

【技术特征摘要】
1.一种用于检索图像的方法，包括：使用第一神经网络来处理待检索图像，以确定所述待检索图像的局部特征向量；使用第二神经网络来处理所述待检索图像，以确定所述待检索图像的全局特征向量；以及基于所述局部特征向量和所述全局特征向量，确定与所述待检索图像的相似度高于预定阈值的图像。2.根据权利要求1所述的方法，其中，所述第一神经网络是使用图像的具有不同分辨率的多个图像数据来训练和/或使用的。3.根据权利要求2所述的方法，其中，具有不同分辨率的多个图像数据的最短边的像素数目包括以下各项中的至少两项：256、384、512、640和768。4.根据权利要求1所述的方法，其中，所述第一神经网络包括以下各层：具有维度为11*11*3的96个卷积核的第一卷积层；具有维度为5*5*96的256个卷积核的第二卷积层；具有维度为3*3*256的384个卷积核的第三卷积层；具有维度为3*3*384的384个卷积核的第四卷积层；具有维度为3*3*384的256个卷积核的第五卷积层；具有维度为1*1*256的4096个卷积核的第六卷积层；以及具有维度为13*13*4096的4096个卷积核的第七卷积层。5.根据权利要求3所述的方法，其中，所述第一神经网络还包括在所述第七卷积层之后的最大池化层和求和池化层。6.根据权利要求1所述的方法，其中，所述第一神经网络是通过使用以下损失函数来训练的：其中，Lt表示针对所述第一神经网络的损失函数，yα是标准图像的特征向量，yp是正样本的特征向量，yn是负样本的特征向量，表示向量的2范数的平方，max()表示取最大值函数，以及α为余量值。7.根据权利要求6所述的方法，其中，α具有如下定义：8.根据权利要求1所述的方法，其中，使用第一神经网络来处理待检索图像，以确定所述待检索图像的局部特征向量的步骤包括：使用所述第一神经网络中的各个卷积层来处理所述待检索图像的具有不同分辨率的多个待检索图像数据，并确定作为输出的针对各个分辨率的多个特征图中相应具有最大激活值的多个...

【专利技术属性】
技术研发人员：王婷婷，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人