模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:22055359 阅读:30 留言:0更新日期:2019-09-07 15:17
本公开实施例提供了一种模型训练方法、装置、电子设备及存储介质,包括:获取训练样本图片;基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;其中模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码后验概率分布为图片被哈希到各候选哈希码的概率。在本公开实施例中,对初始的模型进行训练结束的条件为图片的哈希码概率分布满足预设条件,该特征表征了不同图片的哈希码不相同的概率大于预设值,并且由于图片的哈希码是根据图片的哈希码概率分布确定出的,进而可以保证不同的图片对应于不同的哈希码。

Model training methods, devices, electronic devices and storage media

【技术实现步骤摘要】
模型训练方法、装置、电子设备及存储介质
本公开涉及图片处理
,具体而言,本公开涉及一种模型训练方法、装置、电子设备及存储介质。
技术介绍
随着数码摄像设备的普及,数码图片数量急速增长,面对海量的图片数据,如何将海量图片数据进行储存以及对其进行快速的计算,是目前图片处理领域需要面临的问题,而基于哈希码技术学习的图片检索算法,将高维的图片数据用低维的“0”和“1”哈希码表示,大降低了海量数据对于存储空间的要求。凭借哈希算法在海量图片检索中表现出的计算高效性和低内存可行性,哈希码技术的应用越来越受大家关注,而好的哈希码的衡量标准除了希望同一图片的变换前后的图片鲁棒外,还希望不同图片所对应的哈希码不同,但是,现有技术中不同的图片还有可能对应于相同的哈希码。
技术实现思路
本公开的目的旨在至少能解决上述的技术缺陷之一,提升用户的使用体验。本公开采用的技术方案如下:第一方面,本公开实施例提供了一种模型训练方法,该方法包括:获取训练样本图片;基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;其中,模型是以图片为输入、以图片的哈希码概率分布为输出的模型本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:获取训练样本图片;基于所述训练样本图片对初始的模型进行训练,直至所述模型输出的各训练样本图片的哈希码概率分布满足预设条件;其中,所述模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取训练样本图片;基于所述训练样本图片对初始的模型进行训练,直至所述模型输出的各训练样本图片的哈希码概率分布满足预设条件;其中,所述模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。2.根据权利要求1所述的方法,其特征在于,在一次训练过程中,通过所述模型得到各训练样本图片的哈希码概率分布之后,还包括:根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,所述哈希码先验概率分布包括各候选哈希码的先验概率;确定每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量,并得到差异量总和,所述差异量总和为每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量的和;其中,所述预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。3.根据权利要求2所述的方法,其特征在于,所述确定每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量,并得到差异量总和,包括:计算所述先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;根据所述第一熵和各个第二熵,得到各训练样本图片对应的相对熵;将各训练样本图片对应的相对熵的相加,得到所述差异量总和。4.根据权利要求2所述的方法,其特征在于,确定各候选哈希码的先验概率,包括:针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于所述候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定所述候选哈希码对应于各训练样本图片的先验概率;根据所述候选哈希码对应于各训练样本图片的先验概率,确定所述候选哈希码所对应的先验概率。5.一种图片的哈希码确定方法,其特征在于,包括:获取待处理图片;通过模型得到所述待处理图片的哈希码...

【专利技术属性】
技术研发人员:何轶李根李磊周浩
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1