模型训练、数据分类方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:30830253 阅读:20 留言:0更新日期:2021-11-18 12:42
本公开提供了一种模型训练、数据分类方法、装置、设备、存储介质及产品,涉及人工智能领域中的深度学习领域。具体实现方案为:基于预设指数超参数,确定分类模型的指数型损失函数;根据所述多个训练数据分别在所述分类模型对应分类概率及所述指数型损失函数,计算获得所述多个训练数据对应的目标损失值;在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练。本公开的技术方案提高了模型训练精度。开的技术方案提高了模型训练精度。开的技术方案提高了模型训练精度。

【技术实现步骤摘要】
模型训练、数据分类方法、装置、设备、存储介质及产品


[0001]本公开涉及人工智能领域中的深度学习领域,尤其涉及一种模型训练、数据分类方法、装置、设备、存储介质及产品。

技术介绍

[0002]随着人工智能技术的迅速发展,越来越多的领域会使用到机器学习模型和深度学习模型等。机器学习模型和深度学习模型的训练是较为普遍的研究领域。采用训练后的模型进行数据的分类。如图像分类、语音分类等。模型训练过程中,通常会使用到损失函数,以在多个训练数据输入到模型的类别判别模块,得到各个训练数据的分类概率之后,利用损失函数对多个训练数据各自的分类概率进行损失值计算,获得目标损失值。
[0003]但是,现有的损失函数不能对困难样本进行准确学习,不能对困难样本或者不均衡样本进一步收敛,不满足一些困难样本或者不均衡样本的学习需求,导致训练获得的模型不准确,进而采用训练获得的模型进行数据分类时,导致数据分类的结果也不够准确。

技术实现思路

[0004]本公开提供了一种用于模型训练、数据分类方法、装置、设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种模型训练方法,包括:
[0006]基于预设指数超参数,确定分类模型的指数型损失函数;
[0007]根据多个训练数据分别在所述分类模型对应分类概率及所述指数型损失函数,计算获得所述多个训练数据对应的目标损失值;
[0008]在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练,所述满足收敛条件的分类模型用于对待分类的数据进行分类。
[0009]根据本公开的第二方面,提供了一种数据分类方法,包括:
[0010]获取待分类的数据;
[0011]采用满足收敛条件的分类模型对所述待分类的数据进行分类,所述满足收敛条件的分类模型是采用如第一方面所述的模型训练方法对预设的分类模型分类训练获得的。
[0012]根据本公开的第三方面,提供了一种模型训练装置,包括:
[0013]函数确定单元,用于基于预设指数超参数,确定分类模型的指数型损失函数;
[0014]损失计算单元,用于根据多个训练数据分别在所述分类模型对应分类概率及指数型损失函数,计算获得所述多个训练数据对应的目标损失值;
[0015]训练终止单元,用于在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练,所述满足收敛条件的分类模型用于对待分类的数据进行分类。
[0016]根据本公开的第四方面,提供了一种数据分类装置,包括:
[0017]数据获取单元,用于获取待分类的数据;
[0018]数据分类单元,语义采用满足收敛条件的分类模型对所述待分类的数据进行分
类,所述满足收敛条件的分类模型是采用如第一方面所述的模型训练方法对预设的分类模型分类训练获得。
[0019]根据本公开的第五方面,提供了一种电子设备,包括:
[0020]至少一个处理器;以及
[0021]与所述至少一个处理器通信连接的存储器;其中,
[0022]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0023]根据本公开的第六方面,提供了一种电子设备,包括:
[0024]至少一个处理器;以及
[0025]与所述至少一个处理器通信连接的存储器;其中,
[0026]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使得所述至少一个处理器能够执行第二方面所述的方法。
[0027]根据本公开的第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面或者第二方面所述的方法。
[0028]根据本公开的第八方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或者第二方面所述的方法。
[0029]根据本公开的技术解决了通过采用能够对困难样进行进一步收敛的指数型损失函数,对分类模型进行收敛判断,以获得准确的分类模型,解决了因损失函数不能对困难样本进行进一步收敛导致的分类模型的训练精度,提高了分类模型的训练精度。
[0030]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0031]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0032]图1是根据本公开提供的用于模型训练方法的第一网络架构的示意图;
[0033]图2是根据本公开第一实施例提供的一种模型训练方法的流程图;
[0034]图3是根据本公开第二实施例提供的一种模型训练方法的流程图;
[0035]图4是根据本公开第三实施例提供的一种模型训练方法的流程图;
[0036]图5a是根据本公开实施例的指数型损失函数的一个曲线示意图;
[0037]图5b是根据本公开实施例的指数型损失函数的又一个曲线示意图;
[0038]图6是根据本公开实施例的多种损失函数的曲线示意图;
[0039]图7是根据本公开第四实施例提供的一种数据分类方法的流程图;
[0040]图8是根据本公开第五实施例提供的一种分类模型的训练装置的示意图;
[0041]图9是根据本公开第六实施例提供的一种分类模型的训练装置的示意图;
[0042]图10是根据本公开第七实施例提供的一种数据分类装置的示意图;
[0043]图11是用来实现本公开实施例的模型训练方法的电子设备的框图;
[0044]图12是用来实现本公开实施例的数据分类方法的电子设备的框图。
具体实施方式
[0045]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0046]本公开实施例提供一种模型训练、数据分类方法、装置、设备、存储介质及产品,应用于人工智能领域中的深度学习领域,以解决模型训练过程中,现有的损失函数收敛过快,不利于困难样本或者不均衡样本的训练,导致训练获得的模型精度不高的技术问题。
[0047]现有技术中,对模型进行训练过程中,通常可以将多个训练数据输入到模型的类别判别模块中,通过类别判别模块可以对多个训练数据各自的分类概率进行预测,以获得多个分类概率。在此之后,可以将多个分类概率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:基于预设指数超参数,确定分类模型的指数型损失函数;根据多个训练数据分别在所述分类模型对应分类概率及所述指数型损失函数,计算获得所述多个训练数据对应的目标损失值;在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练。2.根据权利要求1所述的方法,其中,所述基于预设指数超参数,确定分类模型的指数型损失函数,包括:基于预设指数超参数,确定所述指数超参数的目标参数值;根据所述指数超参数的目标参数值,构建所述指数型损失函数。3.根据权利要求2所述的方法,其中,所述基于预设指数超参数,确定所述指数超参数的目标参数值,包括:基于预设指数超参数,确定所述指数超参数使用时的参数规律信息;所述参数规律信息包括所述指数超参数取不同参数值时对所述指数型损失函数的损失值的影响;利用所述参数规律信息,确定所述指数超参数的目标参数值。4.根据权利要求3所述的方法,其中,所述基于预设指数超参数,确定所述指数超参数使用时的参数规律信息,包括:确定预设指数超参数的至少一个试验参数值;根据所述至少一个试验参数值分别构建试验损失函数,获得至少一个试验损失函数;对所述至少一个试验损失函数进行损失试验,获得所述至少一个试验损失函数分别对应的试验结果;根据所述至少一个试验损失函数分别对应的试验结果,生成所述指数超参数使用时的参数规律信息。5.根据权利要求4所述的方法,其中,所述对所述至少一个试验损失函数进行损失试验,获得所述至少一个试验损失函数分别对应的试验结果,包括:利用预定义的多个试验概率对任一个试验损失函数分别进行损失计算试验,获得所述多个试验概率分别对应的试验损失值;确定所述多个试验概率分别对应的试验损失值为所述试验损失函数的试验结果,以确定所述至少一个试验损失函数分别对应的试验结果。6.根据权利要求5所述的方法,其中,所述根据所述至少一个试验损失函数分别对应的试验结果,生成所述指数超参数使用时的参数规律信息,包括:根据任一个试验损失函数的多个试验概率,拟合所述试验损失函数的损失曲线,以获得所述至少一个试验损失函数分别对应的损失曲线;根据所述至少一个试验损失函数分别对应的损失曲线,确定所述指数超参数使用时的参数规律信息。7.根据权利要求6所述的方法,其中,所述根据所述至少一个试验损失函数分别对应的损失曲线,确定所述指数超参数使用时的参数规律信息,包括:根据所述至少一个试验损失函数分别对应的损失曲线的斜率,和/或,同一试验概率在所述至少一个试验损失函数分别对应损失曲线中的损失值,确定所述指数超参数使用时的
参数规律信息;其中,所述参数规律信息包括:所述至少一个试验损失函数分别对应的损失曲线的斜率与对应的试验参数值的取值成正比,和/或,同一试验概率在所述至少一个试验损失函数分别对应损失曲线中的损失值与对应的试验参数值的取值成正比。8.根据权利要求2~7任一项所述的方法,其中,所述指数超参数包括:阈值调节超参数以及权重调节超参数。9.根据权利要求2~7任一项所述的方法,其中,所述根据所述指数超参数的参数值,构建所述指数型损失函数,包括:根据所述指数超参数的参数值,结合输入变量,生成指数子函数;基于所述指数子函数,结合所述输入变量对应的对数子函数,生成所述指数型损失函数;其中,所述输入变量对应所述多个分类概率中的任一个。10.根据权利要求1~9任一项所述的方法,其中,所述根据所述多个分类概率及指数型损失函数,计算获得所述多个训练数据对应的目标损失值,包括:确定所述多个分类概率分别对应的分类置信度;将所述多个分类概率分别对应的分类置信度作为输入变量输入所述指数型损失函数,计算获得所述多个训练数据分别对应的目标损失值。11.根据权利要求1

10任一项所述的方法,其中,所述满足收敛条件的分类模型用于对待分类的数据进行分类;所述待分类的数据与所述多个训练样本的数据类型相同。12.一种数据分类方法,包括:获取待分类的数据;采用满足收敛条件的分类模型对所述待分类的数据进行分类,所述满足收敛条件的分类模型是采用如权利要求1

11任一项所述的模型训练方法对预设的分类模型分类训练获得的。13.一种模型训练装置,包括:函数确定单元,用于基于预设指数超参数,确定分类模型的指数型损失函数;损失计算单元,用于根据多个训练数据分别在所述分类模型对应分类概率及指数型损失函数,计算获得所述多个训练数据对应的目标损失值;训练终止单元,用于在所述...

【专利技术属性】
技术研发人员:周文硕武秉泓杨大陆杨叶辉黄海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1