图像检索模型的训练方法技术

技术编号:39646044 阅读:6 留言:0更新日期:2023-12-09 11:13
本公开提供了一种图像检索模型的训练方法

【技术实现步骤摘要】
图像检索模型的训练方法、图像检索方法和相关设备


[0001]本公开涉及图像检索
,特别涉及一种图像检索模型的训练方法

图像检索方法和相关设备


技术介绍

[0002]随着计算机视觉技术的发展,基于内容的图像检索
(Content

Based Image Retrieval,CBIR)
方法开始大量研究,这种“以图找图”的方法依据图像本身的颜色

形状

纹理等特征进行检索,避免文本描述和图像内容的语义差异

目前用于图像检索的度量学习模型在训练过程时使用的损失函数分为两类:
pair loss(
或说
contrastive)

triplet loss

Pair loss
考虑成对样本间的相关性;
Triplet loss
建模三元组间的相关性

其中,传统的
triplet loss
需要设定一个先验
margin
值,这个先验
margin
值关系到三元组间相关性的度,而一个良好的先验
margin
值难以给定,从而容易导致模型难以收敛,训练效果较差


技术实现思路

[0003]本公开目的在于:提供了一种图像检索模型的训练方法

图像检索方法和相关设备,其在进行图像检索的度量学习模型的训练时,不需要设定先验
margin
值,从而使得模型训练可以快速收敛,具有更好的训练效果

[0004]为达上述目的,本公开采用以下技术方案:一种图像检索模型的训练方法,包括:
[0005]获取训练样本,所述训练样本包括锚样本

正样本和负样本;
[0006]将所述训练样本输入度量学习模型进行模型训练,在模型训练过程中,基于每个批次的所述锚样本

所述正样本和所述负样本进行三元组采样,并根据
C

Index
损失函数进行
loss
值计算,直至模型收敛,得到所述图像检索模型

[0007]本公开还提供了一种图像检索方法,包括:
[0008]获取待识别图像;
[0009]将所述待识别图像输入图像检索模型进行识别,利用所述图像检索模型从图像库中筛选得到与所述待识别图像的相似度大于阈值的相似图像,其中,所述图像检索模型由如上所述的图像检索模型的训练方法训练得到;
[0010]将所述相似图像输出到显示界面

[0011]本公开还提供了一种图像检索模型的训练装置,包括:
[0012]第一获取模块,用于获取训练样本,所述训练样本包括锚样本

正样本和负样本;
[0013]训练模块,用于将所述训练样本输入度量学习模型进行模型训练,在模型训练过程中,基于每个批次的所述锚样本

所述正样本和所述负样本进行三元组采样,并根据
C

Index
损失函数进行
loss
值计算,直至模型收敛,得到所述图像检索模型

[0014]本公开还提供了一种图像检索装置,包括:
[0015]第二获取模块,用于获取待识别图像;
[0016]检索模块,用于将所述待识别图像输入图像检索模型进行识别,利用所述图像检
索模型从图像库中筛选得到与所述待识别图像的相似度大于阈值的相似图像,其中,所述图像检索模型由如上所述的图像检索模型的训练方法训练得到;
[0017]输出模块,用于将所述相似图像输出到显示界面

[0018]本公开还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤

[0019]本公开还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤

[0020]本公开中提供的一种图像检索模型的训练方法

图像检索方法和相关设备,训练时,首先获取训练样本,该训练样本包括锚样本

正样本和负样本

然后将训练样本输入度量学习模型进行模型训练,在模型训练过程中,基于每个批次的锚样本

正样本和负样本进行三元组采样,并根据
C

Index
损失函数进行
loss
值计算,直至模型收敛,得到图像检索模型

应用时,首先获取待识别图像,然后将待识别图像输入图像检索模型进行识别,利用图像检索模型从图像库中筛选得到与待识别图像的相似度大于阈值的相似图像;最后将相似图像输出到显示界面

本公开通过在模型训练过程中使用
C

Index
损失函数进行
loss
值计算,利用三元组样本的关系构建相关性关系来起到一致性学习效果,从而实现既不需要设定先验
margin
值,同时还能有效驱动模型学习,既能使模型训练快速收敛,还能使得训练所得的图像检索模型预测的效果符合真实的相关性
(
即一致性
)
,从而有效提升模型训练效果
(
即训练完成后的图像检索模型在应用时的准确度更高
)。
附图说明
[0021]图1是本公开一实施例中图像检索模型的训练方法的步骤示意图;
[0022]图2是本公开一实施例的
e
x
指数函数图;
[0023]图3是本公开一实施例中图像检索方法的步骤示意图;
[0024]图4是本公开一实施例中图像检索模型的训练装置的整体结构框图;
[0025]图5是本公开一实施例中图像检索装置的整体结构框图;
[0026]图6是本公开一实施例的计算机设备的结构示意框图

[0027]本公开目的的实现

功能特点及优点将结合实施例,参照附图做进一步说明

具体实施方式
[0028]为了使本公开的目的

技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明

应当理解,此处描述的具体实施例仅仅用以解释本公开,并不用于限定本公开

[0029]参照图1,本公开一实施例中提供了一种图像检索模型的训练方法,包括:
[0030]S1:
获取训练样本,所述训练样本包括锚样本

正样本和负样本;
[0031]S2:
将所述训练样本输入度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图像检索模型的训练方法,其特征在于,包括:获取训练样本,所述训练样本包括锚样本

正样本和负样本;将所述训练样本输入度量学习模型进行模型训练,在模型训练过程中,基于每个批次的所述锚样本

所述正样本和所述负样本进行三元组采样,并根据
C

Index
损失函数进行
loss
值计算,直至模型收敛,得到所述图像检索模型
。2.
根据权利要求1所述的图像检索模型的训练方法,其特征在于,所述
C

Index
损失函数为:其中,
L
为所述
loss
值,
N
表征一个批次的训练样本的数量,
E
表征三元组采样的样本集合,
a
表征所述锚样本,
p
表征所述正样本,
n
表征所述负样本,
D(f
θ
(a),f
θ
(p))
表征所述锚样本和所述正样本经模型预测的第一向量距离,
D(f
θ
(a),f
θ
(n))
表征所述锚样本和所述负样本经模型预测的第二向量距离
。3.
根据权利要求2所述的图像检索模型的训练方法,其特征在于,若所述第一向量距离小于所述第二向量距离,则判定模型预测正确;若所述第一向量距离大于所述第二向量距离,则判定模型预测错误
。4.
根据权利要求1所述的图像检索模型的训练方法,其特征在于,所述将所述训练样本输入度量学习模型进行模型训练,在模型训练过程中,基于每个批次的所述锚样本

所述正样本和所述负样本进行三元组采样,并根据
C

Index
损失函数进行
loss
值计算,直至模型收敛,得到所述图像检索模型的步骤,包括:将同一批次的所述锚样本

所述正样本和所述负样本进行降维处理,得到所述锚样本

所述正样本和所述负样本各自对应的低维向量特征;对同一批次的所述低维向量特征进行三元组采样,得到多个三元组样本;将各所述三元组样本输入所述度量学习模型进行模型训练,利用欧几里得距离计算所述正样本和所述锚样本各自对应的...

【专利技术属性】
技术研发人员:方建生
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1