图像检索模型的训练方法技术

技术编号：39646044 阅读：6 留言：0更新日期：2023-12-09 11:13

本公开提供了一种图像检索模型的训练方法

全部详细技术资料下载

【技术实现步骤摘要】
图像检索模型的训练方法、图像检索方法和相关设备

[0001]本公开涉及图像检索
，特别涉及一种图像检索模型的训练方法
、
图像检索方法和相关设备
。

技术介绍

[0002]随着计算机视觉技术的发展，基于内容的图像检索
(Content
‑
Based Image Retrieval,CBIR)
方法开始大量研究，这种“以图找图”的方法依据图像本身的颜色
、
形状
、
纹理等特征进行检索，避免文本描述和图像内容的语义差异
。
目前用于图像检索的度量学习模型在训练过程时使用的损失函数分为两类：
pair loss(
或说
contrastive)
和
triplet loss
，
Pair loss
考虑成对样本间的相关性；
Triplet loss
建模三元组间的相关性
。
其中，传统的
triplet loss
需要设定一个先验
margin
值，这个先验
margin
值关系到三元组间相关性的度，而一个良好的先验
margin
值难以给定，从而容易导致模型难以收敛，训练效果较差
。

技术实现思路

[0003]本公开目的在于：提供了一种图像检索模型的训练方法
、
图像检索方法和相关设备，其在进行图像检索的度量学习...

【技术保护点】

【技术特征摘要】
1.
一种图像检索模型的训练方法，其特征在于，包括：获取训练样本，所述训练样本包括锚样本
、
正样本和负样本；将所述训练样本输入度量学习模型进行模型训练，在模型训练过程中，基于每个批次的所述锚样本
、
所述正样本和所述负样本进行三元组采样，并根据
C
‑
Index
损失函数进行
loss
值计算，直至模型收敛，得到所述图像检索模型
。2.
根据权利要求1所述的图像检索模型的训练方法，其特征在于，所述
C
‑
Index
损失函数为：其中，
L
为所述
loss
值，
N
表征一个批次的训练样本的数量，
E
表征三元组采样的样本集合，
a
表征所述锚样本，
p
表征所述正样本，
n
表征所述负样本，
D(f
θ
(a),f
θ
(p))
表征所述锚样本和所述正样本经模型预测的第一向量距离，
D(f
θ
(a),f
θ
(n))
表征所述锚样本和所述负样本经模型预测的第二向量距离
。3.
根据权利要求2所述的图像检索模型的训练方法，其特征在于，若所述第一向量距离小于所述第二向量距离，则判定模型预测正确；若所述第一向量距离大于所述第二向量距离，则判定模型预测错误
。4.
根据权利要求1所述的图像检索模型的训练方法，其特征在于，所述将所述训练样本输入度量学习模型进行模型训练，在模型训练过程中，基于每个批次的所述锚样本
、
所述正样本和所述负样本进行三元组采样，并根据
C
‑
Index
损失函数进行
loss
值计算，直至模型收敛，得到所述图像检索模型的步骤，包括：将同一批次的所述锚样本
、
所述正样本和所述负样本进行降维处理，得到所述锚样本
、
所述正样本和所述负样本各自对应的低维向量特征；对同一批次的所述低维向量特征进行三元组采样，得到多个三元组样本；将各所述三元组样本输入所述度量学习模型进行模型训练，利用欧几里得距离计算所述正样本和所述锚样本各自对应的...

【专利技术属性】
技术研发人员：方建生，
申请(专利权)人：广州视源人工智能创新研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人