一种图像处理网络的训练方法及装置制造方法及图纸

技术编号:36897007 阅读:10 留言:0更新日期:2023-03-18 09:17
本公开提供了一种图像处理网络的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域。具体实现方案为:获取样本图像,将样本图像分别输入第一编码网络和第二编码网络,分别得到样本图像的查询向量和键向量;基于同一样本图像的查询向量和键向量构建正样本对;针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量;基于样本图像的查询向量、与该查询向量的相似度低于预设阈值的其他样本图像的键向量,构建负样本对;基于正样本对、负样本对训练图像处理网络。实现准确、合理的提取图像特征,从而提高图像处理精度。精度。精度。

【技术实现步骤摘要】
一种图像处理网络的训练方法及装置


[0001]本公开涉及人工智能
,尤其涉及计算机视觉和深度学习


技术介绍

[0002]近年来,随着深度学习的发展,越来越多的深度学习网络被应用于图像处理,图像处理中,通常先采用神经网络提取图像特征,再基于图像特征进行后续处理。

技术实现思路

[0003]本公开提供了一种图像处理网络的训练方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种图像处理网络的训练方法,包括:
[0005]获取样本图像,将所述样本图像分别输入第一编码网络和第二编码网络,分别得到所述样本图像的查询向量和键向量;
[0006]基于同一样本图像的查询向量和键向量构建正样本对;
[0007]针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量;
[0008]基于样本图像的查询向量、与该查询向量的相似度低于预设阈值的其他样本图像的键向量,构建负样本对;
[0009]基于所述正样本对、所述负样本对训练所述图像处理网络。
[0010]根据本公开的一方面,提供了一种图像处理方法,包括:
[0011]基于图像处理网络的提取目标图像的图像特征,得到所述目标图像的特征向量,基于所述特征向量对所述目标图像进行图像处理,其中,所述图像处理网络的是基于图像处理网络的训练方法训练得到的。
[0012]根据本公开的另一方面,提供了一种图像处理网络的训练装置,包括:
[0013]获取模块,用于获取样本图像,将所述样本图像分别输入第一编码网络和第二编码网络,分别得到所述样本图像的查询向量和键向量;
[0014]第一构建模块,用于基于同一样本图像的查询向量和键向量构建正样本对;
[0015]计算模块,用于针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量;
[0016]第二构建模块,用于基于样本图像的查询向量、与该查询向量的相似度低于预设阈值的其他样本图像的键向量,构建负样本对;
[0017]训练模块,用于基于所述正样本对、所述负样本对训练所述图像处理网络。
[0018]根据本公开的另一方面,提供了一种图像处理装置,包括:
[0019]分析模块,用于基于图像处理网络提取目标图像的图像特征,得到所述目标图像的特征向量,基于所述特征向量对所述目标图像进行图像处理,其中,所述图像处理网络是基于图像处理网络的训练装置训练得到的。
[0020]根据本公开的又一方面,提供了一种电子设备,包括:
[0021]至少一个处理器;以及
[0022]与所述至少一个处理器通信连接的存储器;其中,
[0023]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行图像处理网络的训练方法。
[0024]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行图像处理网络的训练方法。
[0025]根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现图像处理网络的训练方法。
[0026]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0027]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0028]图1为本公开实施例提供的图像处理网络的训练方法的一种流程示意图;
[0029]图2为本公开实施例提供的图像处理方法的一种流程示意图;
[0030]图3是用来实现本公开实施例的图像处理网络的训练方法的装置的框图;
[0031]图4是用来实现本公开实施例的图像处理方法的装置的框图;
[0032]图5是用来实现本公开实施例的图像处理网络的训练方法的电子设备的框图。
具体实施方式
[0033]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0034]随着深度学习的发展,越来越多的深度学习网络被应用于图像处理,图像处理中,通常先采用神经网络提取图像特征,再基于图像特征进行后续处理。
[0035]近年来,无监督学习在自然语言处理领域取得了较大的成功,但在计算机视觉领域,有监督的学习仍然占据主流。然而,当前绝大多数视频图像数据都是不存在标注信息的,标注这些数据需要耗费巨大的人力。因此,合理利用海量的视频图像数据进行无监督学习,是计算机视觉领域的一个重要发展方向。
[0036]目前常用的无监督学习方法是对比损失(contrastive loss)学习方法,对比学习的目标是训练一个编码器,也叫编码网络,训练目标是:编码器能够对同类数据进行相似的编码,并使不同类的数据的编码结果尽可能的不同。在计算机视觉领域,训练好的编码器可以用于提取通用的视觉表征,即提取图像的图像特征,用于后续的进一步图像处理。
[0037]具体实现中,将输入编码网络的样本分为正负样本进行学习,学习目标为:正样本之间的向量表示尽可能相似,而正样本与负样本之间的向量表示尽可能差异较大。
[0038]然而,相关技术中,忽略了训练集中往往存在相似的样本图像,直接让当前样本图像经过编码网络输出的向量和其他样本图像经过编码网络输出的向量构成负样本对,这样会导致两个相似的样本图像对应的两个向量构成了负样本对,这是不合理的,会导致编码
网络的训练效果较差,不能合理、准确的提取图像的图像特征。
[0039]为了解决上述技术问题,本公开提供了一种图像处理网络的训练方法、装置、电子设备及存储介质。
[0040]本公开的一个实施例中,提供了一种基于图像处理网络的训练方法,图像处理网络包括第一编码网络和第二编码网络,方法包括:
[0041]获取样本图像,将样本图像分别输入第一编码网络和第二编码网络,分别得到样本图像的查询向量和键向量;
[0042]基于同一样本图像的查询向量和键向量构建正样本对;
[0043]针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量;
[0044]基于样本图像的查询向量、与该查询向量的相似度低于预设阈值的其他样本图像的键向量,构建负样本对;
[0045]基于正样本对、负样本对训练图像处理网络。
[0046]可见,在构建负样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理网络的训练方法,所述图像处理网络包括第一编码网络和第二编码网络,所述方法包括:获取样本图像,将所述样本图像分别输入第一编码网络和第二编码网络,分别得到所述样本图像的查询向量和键向量;基于同一样本图像的查询向量和键向量构建正样本对;针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量;基于样本图像的查询向量、与该查询向量的相似度低于预设阈值的其他样本图像的键向量,构建负样本对;基于所述正样本对、所述负样本对训练所述图像处理网络。2.根据权利要求1所述的方法,其中将所述样本图像分别输入第一编码网络和第二编码网络,分别得到所述样本图像的查询向量和键向量,包括:对所述样本图像进行预设多种类型的数据增强;将经过预设多种类型的数据增强后的样本图像输入第一编码网络得到多个查询向量;将经过预设多种类型的数据增强后的样本图像输入第二编码网络得到多个键向量。3.根据权利要求1或2所述的方法,其中,所述基于所述正样本对、所述负样本对训练所述图像处理网络,包括:以最小化每一正样本对中查询向量和键向量的相似度、最大化每一负样本对中查询向量和键向量的相似度为目标,调整所述第一编码网络中的参数;基于所述第一编码网络中的参数,采用动量更新方式更新所述第二编码网络中的参数。4.根据权利要求3所述的方法,还包括:基于所述样本图像的键向量更新预先构建的记忆队列,所述记忆队列中存储预设数目的所述样本图像的历史键向量;所述针对每一样本图像,计算该样本图像的查询向量与其他样本图像的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量,包括:针对每一样本图像,计算该样本图像的查询向量与更新后的记忆队列队中存储的键向量的相似度,确定相似度低于预设阈值的其他样本图像的键向量。5.根据权利要求1

4任一项所述的方法,其中基于所述正样本对、所述负样本对训练所述图像处理网络,还包括:基于预设的训练终止条件,将当前第一编码网络确定为训练完成的图像特征提取网络。6.一种图像处理方法,包括:基于图像处理网络提取目标图像的图像特征,得到所述目标图像的特征向量,基于所述特征向量对所述目标图像进行图像处理,其中,所述图像处理网络是基于权利要求1

5的方法训练得到的。7.根据权利要求6所述的方法,其中,基于所述特征向量对所述目标图像进行图像处理,包括:基于所述特征向量对所述目标图像进行图像分类、图像检测、图像分割或图像识别。
8.一种图像处理网络的训练装置,所述图像处理网络包括第一编码网络和第二编码网络,装置包括:编码模块,用于获取样本图像,将所述样本图像分别输入第一编码网络和第二编码网络,分别得到所述样本图像的查询向量和键...

【专利技术属性】
技术研发人员:陈子亮
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1