训练特征提取模型、检测相似图像的方法和装置制造方法及图纸

技术编号:32032134 阅读:17 留言:0更新日期:2022-01-27 13:09
本公开提供了训练特征提取模型、检测相似图像的方法和装置,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理和图像识别等场景下。具体实现方案为:获取样本集;从样本集中选取样本;将选取的样本中的目标图像输入相似图像识别网络的编码器,得到第一特征向量;将正样本和负样本输入相似图像识别网络的动量编码器,得到第二特征向量集合;计算第一特征向量和第二特征向量集合中每个第二特征向量的相似度;基于相似度计算相似图像识别网络的损失值;若损失值小于预定阈值,则将编码器确定为特征提取模型。通过该实施方式能够得到一种可以用于提取图像特征的模型,并且该模型能够提高相似图像识别的速度和准确率。的速度和准确率。的速度和准确率。

【技术实现步骤摘要】
训练特征提取模型、检测相似图像的方法和装置


[0001]本公开涉及人工智能
,具体为计算机视觉和深度学习
,可应用于图像处理和图像识别等场景下。

技术介绍

[0002]现有相似图识别方法大多是基于特征进行交叉比对,但是由于特征的表达能力不够,相似的图质检的置信度不够高。由于实际业务场景的复杂性,以及作弊手段的多样性,相似图识别难度非常大。

技术实现思路

[0003]本公开提供了一种训练特征提取模型和检测相似图像的方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的第一方面,提供了一种训练特征提取模型的方法,包括:获取样本集,其中,样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本;执行以下训练步骤:从样本集中选取样本;将选取的样本中的目标图像输入相似图像识别网络的编码器,得到第一特征向量;将正样本和负样本输入相似图像识别网络的动量编码器,得到第二特征向量集合;计算第一特征向量和第二特征向量集合中每个第二特征向量的相似度;基于相似度计算相似图像识别网络的损失值;若损失值小于预定阈值,则将编码器确定为特征提取模型。
[0005]根据本公开的第二方面,提供了一种检测相似图像的方法,包括:获取待对比的图像集合;将图像集合输入根据第一方面的方法训练得到的第一特征提取模型,得到第一特征集合;将第一特征集合进行交叉对比,得到各图像之间的第一相似度;将第一相似度大于第一阈值的图像对确定为相似图像。
[0006]根据本公开的第三方面,提供了一种训练特征提取模型的装置,包括:获取单元,被配置成获取样本集,其中,样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本;训练单元,被配置成执行以下训练步骤:从样本集中选取样本;将选取的样本中的目标图像输入相似图像识别网络的编码器,得到第一特征向量;将正样本和负样本输入相似图像识别网络的动量编码器,得到第二特征向量集合;计算第一特征向量和第二特征向量集合中每个第二特征向量的相似度;基于相似度计算相似图像识别网络的损失值;若损失值小于预定阈值,则将编码器确定为特征提取模型。
[0007]根据本公开的第四方面,提供了一种检测相似图像的装置,包括:获取单元,被配置成获取待对比的图像集合;提取单元,被配置成将图像集合输入根据第二方面的装置训练得到的第一特征提取模型,得到第一特征集合;第一对比单元,被配置成将第一特征集合进行交叉对比,得到各图像之间的第一相似度;确定单元,被配置成将第一相似度大于第一阈值的图像对确定为相似图像。
[0008]一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储
器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面和第二方面所述的方法。
[0009]一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行第一方面和第二方面的方法。
[0010]一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现第一方面和第二方面的方法。
[0011]本公开实施例提供的训练特征提取模型、检测相似图像的方法和装置,通过相似图像的正样本和负样本训练相似图像识别网络,并从相似图像识别网络提取出特征提取模型。从而使得训练出的模型提取的特征更准确。通过训练出特征提取模型对图像进行识别,如果识别结果不够可信则进行二次识别。从而提高了图像识别的准确率。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是本公开可以应用于其中的示例性系统架构图;
[0015]图2是根据本公开训练特征提取模型的方法的一个实施例的流程图;
[0016]图3a、3b是根据本公开训练特征提取模型的方法中样本采集过程的示意图;
[0017]图4是根据本公开训练特征提取模型的方法中特征提取模型的网络结构的示意图;
[0018]图5是根据本公开检测相似图像的方法的一个实施例的流程图;
[0019]图6是根据本公开训练特征提取模型的装置的一个实施例的结构示意图;
[0020]图7是根据本公开检测相似图像的装置的一个实施例的结构示意图;
[0021]图8是适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]图1示出了可以应用本公开实施例的训练特征提取模型的方法、训练特征提取模型的装置、检测相似图像的方法或检测相似图像的装置的示例性系统架构100。
[0024]如图1所示,系统架构100可以包括终端101、102,网络103、数据库服务器104和服务器105。网络103用以在终端101、102,数据库服务器104与服务器105之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0025]用户110可以使用终端101、102通过网络103与服务器105进行交互,以接收或发送消息等。终端101、102上可以安装有各种客户端应用,例如模型训练类应用、相似图像检测识别类应用、购物类应用、支付类应用、网页浏览器和即时通讯工具等。
[0026]这里的终端101、102可以是硬件,也可以是软件。当终端101、102为硬件时,可以是
具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、膝上型便携计算机和台式计算机等等。当终端101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
[0027]当终端101、102为硬件时,其上还可以安装有图像采集设备。图像采集设备可以是各种能实现采集图像功能的设备,如摄像头、传感器等等。用户110可以利用终端101、102上的图像采集设备采集图像。
[0028]数据库服务器104可以是提供各种服务的数据库服务器。例如数据库服务器中可以存储有样本集。样本集中包含有大量的样本。其中,样本可以包括目标图像(参考图像)、与目标图像相似的正样本以及与目标图像不相似的负样本。这样,用户1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练特征提取模型的方法,包括:获取样本集,其中,所述样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本;执行以下训练步骤:从所述样本集中选取样本;将选取的样本中的目标图像输入相似图像识别网络的编码器,得到第一特征向量;将正样本和负样本输入相似图像识别网络的动量编码器,得到第二特征向量集合;计算所述第一特征向量和第二特征向量集合中每个第二特征向量的相似度;基于所述相似度计算所述相似图像识别网络的损失值;若所述损失值小于预定阈值,则将所述编码器确定为特征提取模型。2.根据权利要求1所述的方法,其中,所述方法还包括:若所述损失值不小于预定阈值,则调整所述相似图像识别网络中的编码器的相关参数和动量编码器的相关参数,继续执行所述训练步骤。3.根据权利要求2所述的方法,其中,所述调整所述相似图像识别网络中的编码器的相关参数和动量编码器的相关参数,包括:通过梯度回传的方式调整所述相似图像识别网络中的编码器的相关参数;通过编码器的相关参数对动量编码器的相关参数进行动量更新。4.根据权利要求1所述的方法,其中,所述获取样本集,包括:获取原始图像集;对于每张原始图像,从该原始图像中随机裁剪出两个图像片段作为目标图像和正样本,从其它原始图像中随机裁剪出至少一个图像片段作为所述目标图像的负样本。5.一种检测相似图像的方法,包括:获取待对比的图像集合;将所述图像集合输入根据权利要求1

4中任一项所述的方法训练得到的第一特征提取模型,得到第一特征集合;将所述第一特征集合进行交叉对比,得到各图像之间的第一相似度;将第一相似度大于第一阈值的图像对确定为相似图像。6.根据权利要求5所述的方法,其中,所述方法还包括:对于第一相似度大于第二阈值且小于等于第一阈值的目标图像对,将所述目标图像对输入第二特征提取模型,得到第二特征集合,基于所述第二特征集合计算所述目标图像对的第二相似度,其中,所述第一特征提取模型用于提取全局特征,所述第二特征提取模型用于提取局部特征;将第二相似度大于第一阈值的图像对确定为相似图像。7.根据权利要求6所述的方法,其中,所述基于所述第二特征集合计算所述目标图像对的第二相似度,包括:基于所述第二特征集合进行特征点匹配得到内点对,根据内点对的分布确定出所述目标图像对的重叠区域;将所述重叠区域对应的所述目标图像对中的图像片段输入所述第一特征提取模型,得到第三特征集合;将所述第三特征集合进行交叉对比,得到所述目标图像对的第二相似度。8.一种训练特征提取模型的装置,包括:
获取单元,被配置成获取样本集,其中,所述样本集中的样本包括目标图像、与目标图像相似的正样本以及与目标图像不相似的负样本;训练单元,被配置成执行以下训练步骤:从所述样本集中选取样本;将选取的样本中的目标图像输入相似图像识别网络的编码器,得到第一特征向量;将正样本和负样本输入相似图像识别网络的动量编码器,得到第二特征...

【专利技术属性】
技术研发人员:倪子涵安容巧孙逸鹏姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1