图像检索模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:22055393 阅读:48 留言:0更新日期:2019-09-07 15:18
本申请公开了一种图像检索模型的训练方法、装置、设备及存储介质。所述方法包括:获取图像检索模型;获取训练样本,训练样本包括图像样本以及图像样本的标注信息;根据图像样本的标注信息,确定图像样本对应的哈希中心;通过图像样本的哈希码和图像样本对应的哈希中心,对图像检索模型进行训练,得到完成训练的图像检索模型。由于在每一轮训练过程中是将图像样本的哈希码与其所属类别的哈希中心靠近,该哈希中心反映的是图像所属类别的类别特征,因此在每一轮训练中可以同时获取到一个类别的相似度信息;相比于相关技术中,每一轮训练中只能得到两张图像或三张图像的相似度信息,训练效率更高。

Training Method, Device, Equipment and Storage Medium of Image Retrieval Model

【技术实现步骤摘要】
图像检索模型的训练方法、装置、设备及存储介质
本申请实施例涉及图像检索
,特别涉及一种图像检索模型的训练方法、装置、设备及存储介质。
技术介绍
随着大数据时代的到来,互联网中图像、视频、文本等资源迅猛增长。为了在大规模图像库中进行快速有效地检索,在图像检索模型中引入哈希函数,通过哈希函数将图像保持相似性地转换为二进制哈希码。由于二进制哈希码在汉明距离计算上的高效性和存储空间上的优势,哈希函数广泛应用于大规模图像检索中。在相关技术中,利用数据的成对相似性(即每轮训练样本为两张图像,该两张图像为相同类别或不同类别)或者数据的三联体相似性(即每轮训练样本为三张图像,其中两张图像为相同类别,另一张图像为其它类别),通过最小化相同类别的两张图像之间的汉明距离,最大化不同类别的两张图像之间的汉明距离训练包含哈希函数的图像检索模型,通过该图像检索模型生成图像的哈希码用于图像检索。上述相关技术中,每一轮训练中只能得到两张图像或三张图像的相似度信息,训练效率低。
技术实现思路
本申请实施例提供了一种图像检索模型的训练方法、装置、设备及存储介质,可用于解决相关技术提供的训练方法,训练效率低的技术问题。所述技术方案如下:一方面,本申请实施例提供一种图像检索模型的训练方法,所述方法包括:构建图像检索模型;获取训练样本,所述训练样本包括图像样本以及所述图像样本的标注信息,所述图像样本的标注信息用于指示所述图像样本所属类别;根据所述图像样本的标注信息,确定所述图像样本对应的哈希中心,所述哈希中心用于通过哈希码反映图像所属类别的类别特征;通过所述图像样本的哈希码和所述图像样本对应的哈希中心,对所述图像检索模型进行训练,得到完成训练的图像检索模型。另一方面,本申请实施例提供一种图像检索方法,所述方法包括:获取待检索图像;调用图像检索模型,生成所述待检索图像的目标哈希码,所述图像检索模型是通过图像样本的哈希码和所述图像样本对应的哈希中心训练的;计算所述目标哈希码与图像库中图像的哈希码之间的相似度;根据所述相似度从所述图像库中选择至少一张图像输出,得到所述待检索图像的检索结果。又一方面,本申请实施例提供一种图像检索模型的训练装置,所述装置包括:模型获取模块,用于获取图像检索模型;样本获取模块,用于获取训练样本,所述训练样本包括图像样本以及所述图像样本的标注信息,所述图像样本的标注信息用于指示所述图像样本所属类别;中心确定模块,用于根据所述图像样本的标注信息,确定所述图像样本对应的哈希中心,所述哈希中心用于通过哈希码反映图像所属类别的类别特征;模型训练模块,用于通过所述图像样本的哈希码和所述图像样本对应的哈希中心,对所述图像检索模型进行训练,得到完成训练的图像检索模型。还一方面,本申请实施例提供一种图像检索装置,所述装置包括:图像获取模块,用于获取待检索图像;哈希码生成模块,用于调用图像检索模型,生成所述待检索图像的目标哈希码,所述图像检索模型是通过图像样本的哈希码和所述图像样本对应的哈希中心训练的;相似度计算模块,用于计算所述目标哈希码与图像库中图像的哈希码之间的相似度;结果获取模块,用于根据所述相似度从所述图像库中选择至少一张图像输出,得到所述待检索图像的检索结果。再一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述图像检索模型的训练方法,或者实现上述图像检索方法。又一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述图像检索模型的训练方法,或者实现上述图像检索方法。又一方面,本申请实施例提供一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述图像检索模型的训练方法,或者上述图像检索方法。本申请实施例提供的技术方案至少包括如下有益效果:本申请实施例提供的技术方案,首先获取图像检索模型,并通过训练样本中的图像样本以及图像样本的标注信息,确定出图像样本对应的哈希中心;然后,通过图像样本的哈希码和图像样本对应的哈希中心对图像检索模型进行训练,得到完成训练的图像检索模型。由于在每一轮训练过程中是将图像的哈希码与其所属类别的哈希中心靠近,该哈希中心反映的是图像所属类别的类别特征,因此在每一轮训练中可以同时获取到一个类别的相似度信息;相比于相关技术中,每一轮训练中只能得到两张图像或三张图像的相似度信息,训练效率更高。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示例性示出了本申请提供的图像检索模型的训练方法的流程图;图2是本申请一个实施例提供的图像检索模型的训练方法的流程图;图3是本申请另一个实施例提供的图像检索模型的训练方法的流程图;图4示例性示出了生成图像样本的哈希码的流程示意图;图5示例性示出了采用本方案与相关技术得到的哈希码分布的示意图;图6是本申请一个实施例提供的图像检索方法的流程图;图7示例性示出了图像检索方法的流程示意图;图8示例性示出了采用本方案与相关技术得到的图像检索结果的示意图;图9是本申请一个实施例提供的图像检索模型的训练装置的框图;图10是本申请另一个实施例提供的图像检索模型的训练装置的框图;图11是本申请一个实施例提供的图像检索装置的框图;图12是本申请一个实施例提供的计算机设备的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。首先,对本申请实施例中涉及的名词进行简要介绍。哈希码:指通过哈希函数将图像保持相似性地转换为一组固定长度的二进制编码,该编码即为该图像的哈希码,通常使用-1和1,或者0和1表示其中的比特。在本申请实施例中,图像的哈希码采用0和1表示。由于哈希码在汉明距离计算上的高效性和存储空间上的优势,哈希函数广泛应用于大规模图像检索中。在本申请实施例中,将哈希函数应用于哈希码生成器中,以生成输入图像的哈希码。汉明距离(HammingDistance):表示两个相同长度的字符串对应位不同的数量。例如,以DH(X,Y)表示两个字符串之间的汉明距离,X和Y表示两个字符串,对两个字符串进行异或运算,对应位的值相同时运算结果为0,对应位的值不同时运算结果为1,统计运算结果为1的个数,该个数即为汉明距离。例如,X=(x1,x2,…,xn),Y=(y1,y2,…,yn),则X和Y之间的汉明距离可以表示为:其中,表示异或运算符号,的定义为:(1)当xi=0,yi=0,则(2)当xi=1,yi=0,则(3)当xi=0,yi=1,则(4)当xi=1,yi=1,则例如,X为1011101,Y为1001001,其中只有第三对应位和第五对应位上X和Y的值不相同,即X和Y之间的汉明距离为2。在本申请实施例中,汉明距离是指两张图像的本文档来自技高网...

【技术保护点】
1.一种图像检索模型的训练方法,其特征在于,所述方法包括:获取图像检索模型;获取训练样本,所述训练样本包括图像样本以及所述图像样本的标注信息,所述图像样本的标注信息用于指示所述图像样本所属类别;根据所述图像样本的标注信息,确定所述图像样本对应的哈希中心,所述哈希中心用于通过哈希码反映图像所属类别的类别特征;通过所述图像样本的哈希码和所述图像样本对应的哈希中心,对所述图像检索模型进行训练,得到完成训练的图像检索模型。

【技术特征摘要】
1.一种图像检索模型的训练方法,其特征在于,所述方法包括:获取图像检索模型;获取训练样本,所述训练样本包括图像样本以及所述图像样本的标注信息,所述图像样本的标注信息用于指示所述图像样本所属类别;根据所述图像样本的标注信息,确定所述图像样本对应的哈希中心,所述哈希中心用于通过哈希码反映图像所属类别的类别特征;通过所述图像样本的哈希码和所述图像样本对应的哈希中心,对所述图像检索模型进行训练,得到完成训练的图像检索模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述图像样本的标注信息,确定所述图像样本对应的哈希中心,包括:根据所述图像样本的标注信息,从m个样本哈希中心中确定所述图像样本对应的哈希中心,每个所述样本哈希中心对应于各自的类别,所述m为大于等于1的整数。3.根据权利要求2所述的方法,其特征在于,所述根据所述图像样本的标注信息,从m个样本哈希中心中确定所述图像样本对应的哈希中心之前,还包括:选择m个满足目标条件的候选哈希中心,确定为m个所述样本哈希中心;其中,所述目标条件包括:每个所述候选哈希中心中各个维度的值为1或者0,和,m个所述候选哈希中心中任意两个所述候选哈希中心之间的平均距离小于或等于距离阈值。4.根据权利要求3所述的方法,其特征在于,所述选择m个满足目标条件的候选哈希中心,确定为m个所述样本哈希中心,包括:从哈达玛矩阵中选择任意m行作为m个所述候选哈希中心,确定为m个所述样本哈希中心,所述哈达玛矩阵符合所述目标条件。5.根据权利要求1所述的方法,其特征在于,所述通过所述图像样本的哈希码和所述图像样本对应的哈希中心,对所述图像检索模型进行训练,得到完成训练的图像检索模型,包括:通过所述图像样本的误差损失函数和量化损失函数,来调整所述图像检索模型的参数,得到所述完成训练的图像检索模型;其中,所述误差损失函数用于衡量所述图像样本的哈希码与所述图像样本对应的哈希中心之间的差异程度,所述量化损失函数用于衡量所述图像样本的哈希码中各个维度的值与二值之间的差异程度,所述二值包括1和0。6.根据权利要求5所述的方法,其特征在于,所述通过所述图像样本的误差损失函数和量化损失函数,来调整所述图像检索模型的参数,得到所述完成训练的图像检索模型之前,还包括:根据所述图像样本的哈希码与所述图像样本对应的哈希中心,计算所述误差损失函数的误差;根据所述图像样本的哈希码,计算所述量化损失函数的值。7.根据权利要求6所述的方法,其特征在于,所述通过所述图像样本的误差损失函数和量化损失函数,来调整所述图像检索模型的参数,得到所述完成训练的图像检索模型,包括:根据所述误差损失函数与所述量化损失函数,构建目标函数;通过最小化所述目标函数的值,来调整所述图像检索模型的参数,得到所述完成训练的图像检索模型。8.根据权利要求5至7任一项所述的方法,其特...

【专利技术属性】
技术研发人员:揭泽群
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1