训练特征提取模型、检测相似图像的方法和装置制造方法及图纸

技术编号：32032134 阅读：17 留言：0更新日期：2022-01-27 13:09

本公开提供了训练特征提取模型、检测相似图像的方法和装置，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于图像处理和图像识别等场景下。具体实现方案为：获取样本集；从样本集中选取样本；将选取的样本中的目标图像输入相似图像识别网络的编码器，得到第一特征向量；将正样本和负样本输入相似图像识别网络的动量编码器，得到第二特征向量集合；计算第一特征向量和第二特征向量集合中每个第二特征向量的相似度；基于相似度计算相似图像识别网络的损失值；若损失值小于预定阈值，则将编码器确定为特征提取模型。通过该实施方式能够得到一种可以用于提取图像特征的模型，并且该模型能够提高相似图像识别的速度和准确率。的速度和准确率。的速度和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
训练特征提取模型、检测相似图像的方法和装置

[0001]本公开涉及人工智能
，具体为计算机视觉和深度学习
，可应用于图像处理和图像识别等场景下。

技术介绍

[0002]现有相似图识别方法大多是基于特征进行交叉比对，但是由于特征的表达能力不够，相似的图质检的置信度不够高。由于实际业务场景的复杂性，以及作弊手段的多样性，相似图识别难度非常大。

技术实现思路

[0003]本公开提供了一种训练特征提取模型和检测相似图像的方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的第一方面，提供了一种训练特征提取模型的方法，包括：获取样本集，其中，样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本；执行以下训练步骤：从样本集中选取样本；将选取的样本中的目标图像输入相似图像识别网络的编码器，得到第一特征向量；将正样本和负样本输入相似图像识别网络的动量编码器，得到第二特征向量集合；计算第一特征向量和第二特征向量集合中每个第二特征向量的相似度；基于相似度计算相似图像识别网络的损失值；若损失值小于预定阈值，则将编码器确定为特征提取模型。
[0005]根据本公开的第二方面，提供了一种检测相似图像的方法，包括：获取待对比的图像集合；将图像集合输入根据第一方面的方法训练得到的第一特征提取模型，得到第一特征集合；将第一特征集合进行交叉对比，得到各图像之间的第一相似度；将第一相似度大于第一阈值的图像对确定为相似图像。
[0006]根据本公开的第三方面，提...

【技术保护点】

【技术特征摘要】
1.一种训练特征提取模型的方法，包括：获取样本集，其中，所述样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本；执行以下训练步骤：从所述样本集中选取样本；将选取的样本中的目标图像输入相似图像识别网络的编码器，得到第一特征向量；将正样本和负样本输入相似图像识别网络的动量编码器，得到第二特征向量集合；计算所述第一特征向量和第二特征向量集合中每个第二特征向量的相似度；基于所述相似度计算所述相似图像识别网络的损失值；若所述损失值小于预定阈值，则将所述编码器确定为特征提取模型。2.根据权利要求1所述的方法，其中，所述方法还包括：若所述损失值不小于预定阈值，则调整所述相似图像识别网络中的编码器的相关参数和动量编码器的相关参数，继续执行所述训练步骤。3.根据权利要求2所述的方法，其中，所述调整所述相似图像识别网络中的编码器的相关参数和动量编码器的相关参数，包括：通过梯度回传的方式调整所述相似图像识别网络中的编码器的相关参数；通过编码器的相关参数对动量编码器的相关参数进行动量更新。4.根据权利要求1所述的方法，其中，所述获取样本集，包括：获取原始图像集；对于每张原始图像，从该原始图像中随机裁剪出两个图像片段作为目标图像和正样本，从其它原始图像中随机裁剪出至少一个图像片段作为所述目标图像的负样本。5.一种检测相似图像的方法，包括：获取待对比的图像集合；将所述图像集合输入根据权利要求1
‑
4中任一项所述的方法训练得到的第一特征提取模型，得到第一特征集合；将所述第一特征集合进行交叉对比，得到各图像之间的第一相似度；将第一相似度大于第一阈值的图像对确定为相似图像。6.根据权利要求5所述的方法，其中，所述方法还包括：对于第一相似度大于第二阈值且小于等于第一阈值的目标图像对，将所述目标图像对输入第二特征提取模型，得到第二特征集合，基于所述第二特征集合计算所述目标图像对的第二相似度，其中，所述第一特征提取模型用于提取全局特征，所述第二特征提取模型用于提取局部特征；将第二相似度大于第一阈值的图像对确定为相似图像。7.根据权利要求6所述的方法，其中，所述基于所述第二特征集合计算所述目标图像对的第二相似度，包括：基于所述第二特征集合进行特征点匹配得到内点对，根据内点对的分布确定出所述目标图像对的重叠区域；将所述重叠区域对应的所述目标图像对中的图像片段输入所述第一特征提取模型，得到第三特征集合；将所述第三特征集合进行交叉对比，得到所述目标图像对的第二相似度。8.一种训练特征提取模型的装置，包括：
获取单元，被配置成获取样本集，其中，所述样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本；训练单元，被配置成执行以下训练步骤：从所述样本集中选取样本；将选取的样本中的目标图像输入相似图像识别网络的编码器，得到第一特征向量；将正样本和负样本输入相似图像识别网络的动量编码器，得到第二特征...

【专利技术属性】
技术研发人员：倪子涵，安容巧，孙逸鹏，姚锟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人