样本权重分配方法、模型训练方法、电子设备及存储介质组成比例

技术编号:18351227 阅读:45 留言:0更新日期:2018-07-02 00:59
本发明专利技术提供一种样本权重分配方法,所述方法包括:获取训练样本,所述训练样本包括正样本集及负样本集;计算所述正样本集中每个正样本对的距离,及所述负样本集中每个负样本对的距离;根据所述正样本集中每个正样本对的距离,确定所述正样本集的距离分布;根据所述负样本集中每个负样本对的距离,确定所述负样本集的距离分布;基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布。本发明专利技术还提供一种模型训练方法、电子设备及存储介质。本发明专利技术能增加分类错误的样本对的权重,在模型训练过程中,增大所述分类错误的样本对目标损失的贡献,从而能更好地修正模型参数,提高模型参数的表达能力。

【技术实现步骤摘要】
样本权重分配方法、模型训练方法、电子设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种样本权重分配方法、模型训练方法、电子设备及存储介质。
技术介绍
在机器学习领域,在模型(例如特征提取模型、人脸特征表达模型等)的训练中损失函数分为两类,第一类是基于分类的度量,由于不是直接对特征进行度量,性能有限;另外一类是直接面向特征度量的端到端的方法,此类方法由于需要挑选到难易程度合适的样本网络才能较好收敛。现有的方法主要通过以下两种方式获取难易程度合适的样本:第一、在模型训练到一定阶段后,根据模型的特征表达,选择一些难度适中的样本,这样的方式操作起来麻烦,并且随着模型的训练,所选择的样本的难以程度发生变化,原有的离线选择的样本不在具有代表性,无法充分表达后续添加的样本的特征。第二、在模型训练的过程中,根据每次训练的模型选择难度适中的样本,虽然这种方法选择的训练样本具有代表性,能有有效的提高模型的表达能力,但是需要的计算资源过大,在实际模型训练中难以实现。
技术实现思路
鉴于以上内容,有必要提供一种样本权重分配方法、模型训练方法、电子设备及存储介质,能增加分类错误的样本对的权重,在模型训练过程中,增大所述分类错误的样本对目标损失的贡献,从而能更好地修正模型参数,提高模型参数的表达能力。一种样本权重分配方法,所述方法包括:获取训练样本,所述训练样本包括正样本集及负样本集,所述正样本集包括正样本对及所述负样本集包括负样本对;计算所述正样本集中每个正样本对的距离,及所述负样本集中每个负样本对的距离;根据所述正样本集中每个正样本对的距离,确定所述正样本集的距离分布,所述正样本集的距离分布表示正样本对出现频率与距离的关系;根据所述负样本集中每个负样本对的距离,确定所述负样本集的距离分布,所述负样本集的距离分布表示负样本对出现频率与距离的关系;基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布。根据本专利技术优选实施例,所述基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布包括:基于所述正样本集的距离分布及所述负样本集的距离分布,确定分类错误的第一样本集;在所述训练样本的权重分布中,增加所述第一样本集中每个样本对的权重;及/或基于所述正样本集的距离分布及所述负样本集的距离分布,确定分类正确的第二样本集;在所述训练样本的权重分布中,减少所述第二样本集中每个样本对的权重。根据本专利技术优选实施例,所述训练样本的权重分布为正态分布,当所述正样本集中正样本对的最大距离小于或等于所述负样本集中负样本对的最小距离时,在确定所述训练样本的权重分布时,所述方法还包括:将所述最大距离与所述最小距离的均值确定为所述训练样本的权重分布的均值。根据本专利技术优选实施例,所述训练样本的权重分布为正态分布,当所述正样本集中正样本对的最大距离大于所述负样本集中负样本对的最小距离时,在确定所述训练样本的权重分布时,所述方法还包括:将所述正样本集的距离分布与所述负样本集的距离分布的交叉点对应的距离值作为所述训练样本的权重分布的均值;或将在正样本对出现的频率与负样本对出现的频率的之差的绝对值最小处对应的距离作为所述训练样本的权重分布的均值。根据本专利技术优选实施例,在确定所述训练样本的权重分布的均值时,所述方法还包括:配置预设步长、初始均值及迭代终止条件;基于所述初始均值及所述预设步长,在所述最小距离与最大距离组成的区间内进行迭代搜索满足所述迭代终止条件的最优距离值,在所述最优距离值处,正样本对出现的频率与负样本对出现的频率的之差的绝对值最小。根据本专利技术优选实施例,所述训练样本的权重分布为正态分布,在确定所述训练样本的权重分布时,所述方法还包括:在每次训练过程中,获取所述正样本集中正样本对之间距离的标准差;根据所述正样本集中正样本对之间距离的标准差,更新每次训练过程中的所述训练样本的权重分布的标准差。一种模型训练方法,所述方法包括:获取训练样本;基于所述训练样本,利用损失函数及预设训练算法训练模型参数,其中所述损失函数与所述训练样本的权重分布相关联,所述训练样本的权重分布利用任意实施例中所述的样本权重分配方法得到。根据本专利技术优选实施例,所述方法还包括:利用所述损失函数,增加分类错误的样本对对目标损失的贡献率。一种电子设备,所述电子设备包括存储器及处理器,所述存储器用于存储至少一个指令,所述处理器用于执行所述至少一个指令以实现如任意实施例中所述的样本权重分配方法,及/或任意实施例中所述的模型训练方法。一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如任意实施例中所述的样本权重分配方法,及/或任意实施例中所述的模型训练方法。由以上技术方案可以看出,本专利技术提供一种样本权重分配方法,所述方法包括:获取训练样本,所述训练样本包括正样本集及负样本集;计算所述正样本集中每个正样本对的距离,及所述负样本集中每个负样本对的距离;根据所述正样本集中每个正样本对的距离,确定所述正样本集的距离分布;根据所述负样本集中每个负样本对的距离,确定所述负样本集的距离分布;基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布。本专利技术还提供一种模型训练方法、电子设备及存储介质。本专利技术能增加分类错误的样本对的权重,在模型训练过程中,增大所述分类错误的样本对目标损失的贡献,从而能更好地修正模型参数,提高模型参数的表达能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1是本专利技术样本权重分配方法的较佳实施例的流程图。图2是本专利技术的一个举例中样本的距离分布与权重分布的示意图。图3是本专利技术的一个举例中样本的距离分布的另一个示意图。图4是本专利技术模型训练方法的较佳实施例的流程图。图5是本专利技术样本权重分配装置的较佳实施例的功能模块图。图6是本专利技术模型训练装置的较佳实施例的功能模块图。图7是本专利技术至少一个实例中电子设备的较佳实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在本文档来自技高网
...
样本权重分配方法、模型训练方法、电子设备及存储介质

【技术保护点】
1.一种样本权重分配方法,其特征在于,所述方法包括:获取训练样本,所述训练样本包括正样本集及负样本集,所述正样本集包括正样本对及所述负样本集包括负样本对;计算所述正样本集中每个正样本对的距离,及所述负样本集中每个负样本对的距离;根据所述正样本集中每个正样本对的距离,确定所述正样本集的距离分布,所述正样本集的距离分布表示正样本对出现频率与距离的关系;根据所述负样本集中每个负样本对的距离,确定所述负样本集的距离分布,所述负样本集的距离分布表示负样本对出现频率与距离的关系;基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布。

【技术特征摘要】
1.一种样本权重分配方法,其特征在于,所述方法包括:获取训练样本,所述训练样本包括正样本集及负样本集,所述正样本集包括正样本对及所述负样本集包括负样本对;计算所述正样本集中每个正样本对的距离,及所述负样本集中每个负样本对的距离;根据所述正样本集中每个正样本对的距离,确定所述正样本集的距离分布,所述正样本集的距离分布表示正样本对出现频率与距离的关系;根据所述负样本集中每个负样本对的距离,确定所述负样本集的距离分布,所述负样本集的距离分布表示负样本对出现频率与距离的关系;基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布。2.如权利要求1所述的样本权重分配方法,其特征在于,所述基于所述正样本集的距离分布及所述负样本集的距离分布,确定所述训练样本的权重分布包括:基于所述正样本集的距离分布及所述负样本集的距离分布,确定分类错误的第一样本集;在所述训练样本的权重分布中,增加所述第一样本集中每个样本对的权重;及/或基于所述正样本集的距离分布及所述负样本集的距离分布,确定分类正确的第二样本集;在所述训练样本的权重分布中,减少所述第二样本集中每个样本对的权重。3.如权利要求1所述的样本权重分配方法,其特征在于,所述训练样本的权重分布为正态分布,当所述正样本集中正样本对的最大距离小于或等于所述负样本集中负样本对的最小距离时,在确定所述训练样本的权重分布时,所述方法还包括:将所述最大距离与所述最小距离的均值确定为所述训练样本的权重分布的均值。4.如权利要求1所述的样本权重分配方法,其特征在于,所述训练样本的权重分布为正态分布,当所述正样本集中正样本对的最大距离大于所述负样本集中负样本对的最小距离时,在确定所述训练样本的权重分布时,所述方法还包括:将所述正样本集的距离分布与所述负样本集的距离分布的交叉点对应的距离值作为所述训练样本的权重...

【专利技术属性】
技术研发人员:严蕤牟永强
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1