模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:22002131 阅读:29 留言:0更新日期:2019-08-31 05:55
本公开实施例提供了一种模型训练方法、装置、电子设备及存储介质,包括:获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;基于训练样本数据对初始的模型进行训练,直至原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。在本公开实施例中,由于训练后的模型是满足约束条件的,因此通过该模型得到的哈希码分布概率也是相似的,进而解决了鲁棒性较差的问题。

Model training methods, devices, electronic devices and storage media

【技术实现步骤摘要】
模型训练方法、装置、电子设备及存储介质
本公开涉及图像处理
,具体而言,本公开涉及一种模型训练方法、装置、电子设备及存储介质。
技术介绍
现有技术中,对于原始图像,用户可能对图像会进行一些改变,比如,将图像进行旋转、在图像上加几个文字、将图像放大或缩小等简单的变换操作,变换后的图像与原始图像本质上是相同或相似的图像,理论上变换前后的图像的哈希码应该是尽可能相同。但是,现有技术中得到图像的哈希码的方式,由于哈希算法的鲁棒性不强,会经常导致变换前后的图像的哈希码的鲁棒性较差。
技术实现思路
本公开的目的旨在至少能解决上述的技术缺陷之一,提升用户的使用体验。本公开采用的技术方案如下:第一方面,本公开提供了一种模型训练方法,该方法包括:获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。本公开第一方面可选的实施例中,变换图像是通过下列方式得到的:在预设的图像变换参数取值范围内随机选取图像变换参数的取值;基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。本公开第一方面可选的实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。本公开第一方面可选的实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。第二方面,本公开还提供了一种判断相似图像的方法,该方法包括:获取至少两个待检测图像;通过模型得到每个待检测图像的哈希码分布概率,其中,模型是通过第一方面实施例中任一项的方法训练得到的;基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像。第三方面,本公开提供了一种模型训练装置,该装置包括:样本数据获取模块,用于获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;模型训练模块,用于基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。本公开第三方面可选的实施例中,样本数据获取模块通过以下方式得到变换图像:在预设的图像变换参数取值范围内随机选取图像变换参数的取值,基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。本公开第三方面可选的实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。本公开第三方面可选的实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。第四方面,本公开提供了一种判断相似图像的装置,该装置包括:图像获取模块,获取至少两个待检测图像;图像处理模块,用于通过模型得到每个待检测图像的哈希码分布概率,基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像,其中,模型是通过第一方面实施例中任一项的方法训练得到的第五方面,本公开提供了一种电子设备,该电子设备包括处理器和存储器;存储器,用于存储计算机操作指令;处理器,用于通过调用计算机操作指令,执行如本公开的第一方面和第二方面中的任一实施例所示的方法。第六方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本公开的第一方面和第二方面中的任一实施例所示的方法。本公开实施例提供的技术方案带来的有益效果是:在本公开实施例中,可以基于训练样本数据中的图像对对初始的模型进行训练,并且在各图像对中的原始图像的哈希码分布概率和换图像的哈希码分布概率的相似度满足预设条件时,可以完成对初始的模型的训练,由于训练后的模型是满足约束条件的,因此变换前后的图像通过该训练后的模型得到的哈希码分布概率自然也是相似的,进而解决了变换前后的图像的哈希码的鲁棒性较差的问题。附图说明为了更清楚地说明在本公开的实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。图1为本公开的实施例中一种模型训练方法的流程示意图;图2为本公开的实施例中一种判断相似图像的方法的示意图;图3为本公开的实施例中一种模型训练方法装置的结构示意图;图4为本公开的实施例中一种判断相似图像的装置的结构示意图;图5为本公开的实施例提供的一种电子设备的结构示意图。具体实施方式下面详细描述本公开的实施例,该实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开的技术感,而不能解释为对本公开的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在该特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。本公开的实施例提供了一种模型训练方法,如图1所示,该方法可以包括:步骤S110,获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像。其中,得到原始图像的变换图像的具体实现方式,本公开实施例不做限定,如可以将原始图像进行旋转、平移、缩放得到变换图像。在实际应用中,样本数据中所包括的图像对可以是对一张原始图像进行不同的变换得到的图像对,如可以对原始图像分别进行放大、平移、缩放变换,进而得到变换图像A、变换图像B和变换图像C,此时训练样本数据中所包括图像对为原始图像和变换图像A、原始图像和变换图像B,以及原始图像和变换图像C。当然,在实际应用中,样本数据中所包括的图像对也可以是对不同的原始图像进行变换,进而得到原始图像的变换图像。如可以对原始图像A、原始图像B和原始图像C分别进行放大变换,进而得到原始图像A的变换图像a、原始图像B的变换图像b、原始图像C的变换图像c本文档来自技高网
...

【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:获取训练样本数据,所述训练样本数据包括至少一个图像对,所述图像对包括原始图像以及所述原始图像的变换图像;基于所述训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度满足预设条件;其中,所述模型是以图像为输入,以图像的哈希码分布概率为输出的模型,所述哈希码分布概率为输入至所述模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取训练样本数据,所述训练样本数据包括至少一个图像对,所述图像对包括原始图像以及所述原始图像的变换图像;基于所述训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度满足预设条件;其中,所述模型是以图像为输入,以图像的哈希码分布概率为输出的模型,所述哈希码分布概率为输入至所述模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。2.根据权利要求1所述的方法,其特征在于,所述变换图像是通过下列方式得到的:在预设的图像变换参数取值范围内随机选取图像变换参数的取值;基于所述图像变换参数的取值对所述原始图像进行变换,得到所述原始图像的变换图像。3.根据权利要求2所述的方法,其特征在于,所述图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。4.根据权利要求1所述的方法,其特征在于,通过所述原始图像的哈希码分布概率与所述变换图像的哈希码分布概率之间的相对熵,衡量所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度是否满足预设条件。5.一种判断相似图像的方法,其特征在于,所述方法包括:获取至少两个待检测图像;通过所述模型得到每个待检测图像的哈希码分布概率,其中,所述模型是通过权利要求1至4中任一项所述的方法训练得到的;基于所述每个待检测图像的哈希码分布概率,确定所述待检测图像中的相似图像。6.一种模型训练装置,其特征在于,包括:样本数据获取模块,...

【专利技术属性】
技术研发人员:何轶李根李磊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1