对编码器进行训练的方法、装置、设备及存储介质制造方法及图纸

技术编号:31501961 阅读:17 留言:0更新日期:2021-12-22 23:21
本申请公开了一种对编码器进行训练的方法、装置、设备及存储介质,属于图像处理领域。所述方法包括:获取属于同一图像类别的第一样本图像和第二样本图像;将所述第一样本图像和所述第二样本图像分别输入到编码器,得到所述第一样本图像对应的第一哈希码以及所述第二样本图像对应的第二哈希码;确定所述第一哈希码和所述第二哈希码的对比损失;基于所述对比损失,对所述编码器进行训练。采用本申请提供的对编码器进行训练的方法,可以提高编码器在对图像进行分类、检索的精准度。检索的精准度。检索的精准度。

【技术实现步骤摘要】
对编码器进行训练的方法、装置、设备及存储介质


[0001]本申请涉及图像处理领域,特别涉及一种对编码器进行训练的方法、装置、设备及存储介质。

技术介绍

[0002]图像哈希方法是图像检索领域中常见的一种图像检索方法,即可以将图像分别编码成哈希码,然后在对图像进行检索时,根据图像对应哈希码的匹配度,确定各图像显示的内容是否接近。
[0003]在相关技术中,可以通过完成训练的生成模型得到图像对应的哈希码。在对生成模型进行训练时,生成模型中可以包括编码器和解码器,对应的训练过程如下:将样本图像输入到编码器中,得到样本图像对应的哈希码,然后将样本图像对应的哈希码输入到解码器中,由解码器还原出哈希码对应的图像,最后通过解码器还原的图像与样本图像确定对应的损失值,进而通过损失值对编码器和解码器进行训练。
[0004]由于对生成模型进行训练时,解码器只有在很好的还原出样本图像时,生成模型才会在训练过程中变得收敛,这样就需要训练后的编码器输出样本图像的哈希码,能够尽可能的包含样本图像中对应图像内容的所有信息。但是在对图像进行分类或检索时,往往只需要基于图像中的某个特征即可完成,例如,对同一辆车拍摄的两个图像,一个是在地下停车场拍摄的,另一个是在室外拍摄的,虽然拍摄地点不同导致两个图像中的背景不同,但这两个图像都属于“车”这一类的图像。而如果编码器对上述两个图像输出的哈希码中,包括了大量的背景信息,就会导致两个图像对应的哈希码的匹配度较低,进而可能会将两个图像确定为不同的类别。
[0005]基于以上推理可知,目前的对生成模型的训练方法,使得训练后的编码器输出图像的哈希码,可以较为全面的包含对应图像内容的所有信息,反而可能会降低对图像进行检索、分类的精准度。

技术实现思路

[0006]本申请实施例提供了一种对编码器进行训练的方法、装置、设备及存储介质,能够提高编码器对图像进行分类、检索的精准度,所述技术方案如下:
[0007]第一方面,提供了一种对编码器进行训练的方法,所述方法包括:
[0008]获取属于同一图像类别的第一样本图像和第二样本图像;
[0009]将所述第一样本图像和所述第二样本图像分别输入到编码器,得到所述第一样本图像对应的第一哈希码以及所述第二样本图像对应的第二哈希码;
[0010]确定所述第一哈希码和所述第二哈希码的对比损失;
[0011]基于所述对比损失,对所述编码器进行训练。
[0012]可选的,所述获取属于同一图像类别的第一样本图像和第二样本图像,包括:
[0013]获取目标图像,对所述目标图像进行两次随机数据增强处理,得到属于同一图像
类别的第一样本图像和第二样本图像。
[0014]可选的,所述基于所述对比损失,对所述编码器进行训练,包括:
[0015]基于所述对比损失以及信息瓶颈优化方程,分别确定所述第一哈希码对应的第一损失值以及所述第二哈希码对应的第二损失值,其中,所述信息瓶颈优化方程中包括样本图像对应的哈希码与所述样本图像对应图像标签的互信息,以及所述样本图像对应哈希码与所述样本图像的互信息;
[0016]分别基于所述第一损失值以及所述第二损失值,对所述编码器进行训练。
[0017]可选的,所述基于所述对比损失以及预设的信息瓶颈优化方程,分别确定所述第一哈希码对应的第一损失值以及所述第二哈希码对应的第二损失值,包括:
[0018]将所述对比损失确定为所述第一哈希码与第一样本图像对应图像标签的第一互信息;对所述第一样本图像进行变分估计,确定所述第一哈希码与所述第一样本图像的第二互信息,基于确定的第一互信息、所述第二互信息以及所述信息瓶颈优化方程,确定所述第一损失值;
[0019]将所述对比损失确定为所述第二哈希码与第二样本图像对应图像标签的第三互信息;对所述第二样本图像进行变分估计,确定所述第二哈希码与所述第二样本图像的第四互信息,基于确定的所述第三互信息、所述第四互信息以及所述信息瓶颈优化方程,确定所述第二损失值,其中,所述第一样本图像对应图像标签与所述第二样本图像对应图像标签相同。
[0020]第二方面、提供了一种对编码器进行训练的装置,所述装置包括:
[0021]获取模块,用于获取属于同一图像类别的第一样本图像和第二样本图像;
[0022]输入模块,用于将所述第一样本图像和所述第二样本图像分别输入到编码器,得到所述第一样本图像对应的第一哈希码以及所述第二样本图像对应的第二哈希码;
[0023]确定模块,用于确定所述第一哈希码和所述第二哈希码的对比损失;
[0024]训练模块,用于基于所述对比损失,对所述编码器进行训练。
[0025]可选的,所述获取模块,用于:
[0026]获取目标图像,对所述目标图像进行两次随机数据增强处理,得到属于同一图像类别的第一样本图像和第二样本图像。
[0027]可选的,所述训练模块,用于:
[0028]基于所述对比损失以及信息瓶颈优化方程,分别确定所述第一哈希码对应的第一损失值以及所述第二哈希码对应的第二损失值,其中,所述信息瓶颈优化方程中包括样本图像对应的哈希码与所述样本图像对应图像标签的互信息,以及所述样本图像对应哈希码与所述样本图像的互信息;
[0029]分别基于所述第一损失值以及所述第二损失值,对所述编码器进行训练。
[0030]可选的,所述训练模块,用于:
[0031]将所述对比损失确定为所述第一哈希码与第一样本图像对应图像标签的第一互信息;对所述第一样本图像进行变分估计,确定所述第一哈希码与所述第一样本图像的第二互信息,基于确定的第一互信息、所述第二互信息以及所述信息瓶颈优化方程,确定所述第一损失值;
[0032]将所述对比损失确定为所述第二哈希码与第二样本图像对应图像标签的第三互
信息;对所述第二样本图像进行变分估计,确定所述第二哈希码与所述第二样本图像的第四互信息,基于确定的所述第三互信息、所述第四互信息以及所述信息瓶颈优化方程,确定所述第二损失值,其中,所述第一样本图像对应图像标签与所述第二样本图像对应图像标签相同。
[0033]第三方面、提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如第一方面所述的对编码器进行训练的方法所执行的操作。
[0034]第四方面、提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如第一方面所述的对编码器进行训练的方法所执行的操作。
[0035]本申请实施例提供的技术方案带来的有益效果是:
[0036]在本申请中,通过属于同一类别图像对应哈希码的对比损失对编码器进行训练,不需要依靠解码器输出图像的哈希码使编码器变得收敛,也就说,在本申请中只有在编码器输出的两个图像的哈希码匹配度较高时,即输出的两个图像的哈希码中更多的包含两个图像共同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对编码器进行训练的方法,其特征在于,所述方法包括:获取属于同一图像类别的第一样本图像和第二样本图像;将所述第一样本图像和所述第二样本图像分别输入到编码器,得到所述第一样本图像对应的第一哈希码以及所述第二样本图像对应的第二哈希码;确定所述第一哈希码和所述第二哈希码的对比损失;基于所述对比损失,对所述编码器进行训练。2.根据权利要求1所述的方法,其特征在于,所述获取属于同一图像类别的第一样本图像和第二样本图像,包括:获取目标图像,对所述目标图像进行两次随机数据增强处理,得到属于同一图像类别的第一样本图像和第二样本图像。3.根据权利要求1所述的方法,其特征在于,所述基于所述对比损失,对所述编码器进行训练,包括:基于所述对比损失以及信息瓶颈优化方程,分别确定所述第一哈希码对应的第一损失值以及所述第二哈希码对应的第二损失值,其中,所述信息瓶颈优化方程中包括样本图像对应的哈希码与所述样本图像对应图像标签的互信息,以及所述样本图像对应哈希码与所述样本图像的互信息;分别基于所述第一损失值以及所述第二损失值,对所述编码器进行训练。4.根据权利要求3所述的方法,其特征在于,所述基于所述对比损失以及预设的信息瓶颈优化方程,分别确定所述第一哈希码对应的第一损失值以及所述第二哈希码对应的第二损失值,包括:将所述对比损失确定为所述第一哈希码与第一样本图像对应图像标签的第一互信息;对所述第一样本图像进行变分估计,确定所述第一哈希码与所述第一样本图像的第二互信息,基于确定的第一互信息、所述第二互信息以及所述信息瓶颈优化方程,确定所述第一损失值;将所述对比损失确定为所述第二哈希码与第二样本图像对应图像标签的第三互信息;对所述第二样本图像进行变分估计,确定所述第二哈希码与所述第二样本图像的第四互信息,基于确定的所述第三互信息、所述第四互信息以及所述信息瓶颈优化方程,确定所述第二损失值,其中,所述第一样本图像对应图像标签与所述第二样本图像对应图像标签相同。5.一种对编码器进行训练的装置,其特征在于,所述装置包括:获取模块,用于获取属于同一图像类别的第一样本图像和第二样本图像;输入模块,用于将所述第一样本图...

【专利技术属性】
技术研发人员:欧子菁赵瑞辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1