当前位置: 首页 > 专利查询>深圳大学专利>正文

模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29134613 阅读:20 留言:0更新日期:2021-07-02 22:30
本申请涉及一种模型训练方法、装置、计算机设备和存储介质。所述方法包括:获取三元组图像样本;将所述三元组图像样本输入至图像处理模型中,获得参考损失值;当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。采用本方法能够提高训练得到的模型的性能。

【技术实现步骤摘要】
模型训练方法、装置、计算机设备和存储介质
本申请涉及机器学习
,特别是涉及一种模型训练方法、装置、计算机设备和存储介质。
技术介绍
大多数现代机器学习算法(例如深度神经网络)都需要对数百种算法进行训练。而在某些实际问题中,往往无法提供大量示例。少样本学习方法通过使用少量示例来训练计算模型,试图解决这些问题。这些算法只需要几个每个类的训练示例,无需大量反复训练即可将模型推广到不熟悉的类别。为了解决少数问题,已经采用了诸如度量学习算法之类的方法。度量学习算法采用一些距离度量来发现图像之间的相似性。深度度量算法的最重要元素是损失函数。最受欢迎的损失函数之一是三元组损失函数。然而传统的通过三元组损失函数所训练得到的图像处理模型的性能较差。
技术实现思路
基于此,有必要针对上述技术问题,提供一种模型训练方法、装置、计算机设备和存储介质。一种模型训练方法,所述方法包括:获取三元组图像样本;将所述三元组图像样本输入至图像处理模型中,获得参考损失值;当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。一种模型训练装置,所述装置包括:图像样本获取模块,用于获取三元组图像样本;目标损失值获得模块,用于将所述三元组图像样本输入至图像处理模型中,获得参考损失值;所述目标损失值获得模块,还用于当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;参数调整模块,用于基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取三元组图像样本;将所述三元组图像样本输入至图像处理模型中,获得参考损失值;当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取三元组图像样本;将所述三元组图像样本输入至图像处理模型中,获得参考损失值;当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。上述模型训练方法、装置、计算机设备和存储介质,获取三元组图像样本,将三元组图像样本输入至图像处理模型中,获得参考损失值,当参考损失值满足预设损失值条件时,在参考损失值的基础上加入与预设损失值条件对应的调整项,获得目标损失值,能够通过更合理的损失值减少图像处理模型的训练时长,也能够使得模型训练不容易崩溃,能够使得训练完成的图像处理模型具有更好的性能。附图说明图1为一个实施例中模型训练方法的流程示意图;图2为一个实施例中训练前的图像处理模型的ROC曲线;图3为一个实施例中训练完成的图像处理模型的ROC曲线;图4为一个实施例中未迭代的图像处理模型的映射空间类间距的结果示意图;图5为一个实施例中迭代了100次的视频图像处理模型映射空间类间距的结果示意图;图6为一个实施例中模型训练装置的结构框图;图7为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的模型训练方法,可以应用于计算机设备中。其中,计算机设备可以为终端或者服务器。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图1所示,提供了一种模型训练方法,以该方法应用于计算机设备为例进行说明,包括以下步骤:步骤102,获取三元组图像样本。其中,三元组图像样本中包括3个图像样本,其中包括锚点图像样本(Anchor)、正图像样本(Positive)和负图像样本(Negative)。随机选取的锚点图像样本,与锚点图像样本属于相同类型的正图像样本,与锚点图像样本属于不同类的负图像样本。具体地,计算机设备读取数据集、预处理数据集中的图像,并分割出训练集和测试集。三元组图像样本是训练集中的图像样本。步骤104,将三元组图像样本输入至图像处理模型中,获得参考损失值。其中,图像处理模型可以是指图像识别模型,也可以是用于协同图像分割等的模型。图像处理模型具体可以是预训练图像处理模型。具体地,计算机设备将三元组图像样本输入至图像处理模型中,通过图像处模型获得该三元组图像样本对应的参考损失值。参考损失值可以是通过欧几里得距离或余弦距离实现。例如,其中,dis表示距离,τz表示第z个三元组图像样本,a表示锚点图像样本,p表示正图像样本,n表示负图像样本,m是一个常数。步骤106,当参考损失值满足预设损失值条件时,在参考损失值的基础上加入与预设损失值条件对应的调整项,获得目标损失值。其中,预设损失值条件用于判断参考损失值的大小是否满足预设条件。具体地,当参考损失值满足预设损失值条件时,在参考损失值的基础上加入与预设损失值条件对应的调整项,获得目标损失值。例如,预设损失值条件为参考损失值在预设范围内,加入的对应调整项为加上惩罚项。预设损失值条件为参考损失值大于预设距离阈值,加入的对应调整项为减去奖赏项。步骤108,基于目标损失值对图像处理模型中的参数进行调整,直至图像处理模型满足收敛条件,获得训练完成的图像处理模型。其中,收敛条件具体可以是训练次数达到预设次数、评估参数达到预设评估值等不限于此。具体地,计算机设备基于目标损失值对图像处理模型中的参数进行调整,直至图像处理模型满足收敛条件时,获得训练完成的图像处理模型。上述模型训练方法,获取三元组图像样本,将三元组图像样本输入至图像处理模型中,获得参考损失值,当参考损失值满足预设损失值条件时,在参考损失值的基础上加入与预设损失值条件对应的调整项,获得目标损失值,能够通过更合理的损失值减少图像处理模型的训练时长,也能够使得模型训练不容易崩溃,通过少量样本就能够将图像处本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:/n获取三元组图像样本;/n将所述三元组图像样本输入至图像处理模型中,获得参考损失值;/n当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;/n基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。/n

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:
获取三元组图像样本;
将所述三元组图像样本输入至图像处理模型中,获得参考损失值;
当所述参考损失值满足预设损失值条件时,在所述参考损失值的基础上加入与所述预设损失值条件对应的调整项,获得目标损失值;
基于所述目标损失值对所述图像处理模型中的参数进行调整,直至所述图像处理模型满足收敛条件,获得训练完成的图像处理模型。


2.根据权利要求1所述的方法,其特征在于,所述三元组图像样本包括锚点图像样本、正图像样本和负图像样本;所述参考损失值是基于第一距离值与第二距离值之差计算得到的;
所述当所述参考损失值满足预设损失值条件时,在所述参考损失值中加入与所述预设损失值条件对应的调整项,获得目标损失值,包括:
当第一距离值与第二距离值之差在预设范围内时,在所述参考损失值的基础上减去奖赏项,获得目标损失值;所述第一距离值是所述锚点图像样本与所述正图像样本之间的距离值;所述第二距离值是所述锚点图像样本与所述负图像样本之间的距离值。


3.根据权利要求2所述的方法,其特征在于,所述奖赏项的获取方式,包括:
根据所述第一距离值与所述第二距离值之差,与第一参数的乘积,获得奖赏项。


4.根据权利要求1所述的方法,其特征在于,所述三元组图像样本包括锚点图像样本、正图像样本和负图像样本;所述参考损失值是基于第一距离值与第二距离值之差计算得到的;
所述当所述参考损失值满足预设损失值条件时,在所述参考损失值中加入与所述预设损失值条件对应的调整项,获得目标损失值,包括:
当第一距离值与第二距离值之差大于预设距离阈值时,在所述参考损失值的基础上加上惩罚项,获得目标损失值;所述第一距离值是所述锚点图像样本与所述正图像样本之间的距离值;所述第二距离值是所述锚点图像样本与所述负图像样本之间的距离值。


5.根据权利要求4所述的方法,其特征在于,所述惩罚项的获取方式,包括:
根据所述第一距离值与所述第二距离值之和,与第二参...

【专利技术属性】
技术研发人员:石大明石闻天
申请(专利权)人:深圳大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1