【技术实现步骤摘要】
模型训练、数据分类方法、装置、设备、存储介质及产品
[0001]本公开涉及人工智能领域中的深度学习领域,尤其涉及一种模型训练、数据分类方法、装置、设备、存储介质及产品。
技术介绍
[0002]随着人工智能技术的迅速发展,越来越多的领域会使用到机器学习模型和深度学习模型等。机器学习模型和深度学习模型的训练是较为普遍的研究领域。采用训练后的模型进行数据的分类。如图像分类、语音分类等。模型训练过程中,通常会使用到损失函数,以在多个训练数据输入到模型的类别判别模块,得到各个训练数据的分类概率之后,利用损失函数对多个训练数据各自的分类概率进行损失值计算,获得目标损失值。
[0003]但是,现有的损失函数不能对困难样本进行准确学习,不能对困难样本或者不均衡样本进一步收敛,不满足一些困难样本或者不均衡样本的学习需求,导致训练获得的模型不准确,进而采用训练获得的模型进行数据分类时,导致数据分类的结果也不够准确。
技术实现思路
[0004]本公开提供了一种用于模型训练、数据分类方法、装置、设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种模型训练方法,包括:
[0006]基于预设指数超参数,确定分类模型的指数型损失函数;
[0007]根据多个训练数据分别在所述分类模型对应分类概率及所述指数型损失函数,计算获得所述多个训练数据对应的目标损失值;
[0008]在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练,所述满足收敛条件的分 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,包括:基于预设指数超参数,确定分类模型的指数型损失函数;根据多个训练数据分别在所述分类模型对应分类概率及所述指数型损失函数,计算获得所述多个训练数据对应的目标损失值;在所述目标损失值满足预设损失阈值的情况下,确定所述预设的分类模型满足收敛条件,停止训练。2.根据权利要求1所述的方法,其中,所述基于预设指数超参数,确定分类模型的指数型损失函数,包括:基于预设指数超参数,确定所述指数超参数的目标参数值;根据所述指数超参数的目标参数值,构建所述指数型损失函数。3.根据权利要求2所述的方法,其中,所述基于预设指数超参数,确定所述指数超参数的目标参数值,包括:基于预设指数超参数,确定所述指数超参数使用时的参数规律信息;所述参数规律信息包括所述指数超参数取不同参数值时对所述指数型损失函数的损失值的影响;利用所述参数规律信息,确定所述指数超参数的目标参数值。4.根据权利要求3所述的方法,其中,所述基于预设指数超参数,确定所述指数超参数使用时的参数规律信息,包括:确定预设指数超参数的至少一个试验参数值;根据所述至少一个试验参数值分别构建试验损失函数,获得至少一个试验损失函数;对所述至少一个试验损失函数进行损失试验,获得所述至少一个试验损失函数分别对应的试验结果;根据所述至少一个试验损失函数分别对应的试验结果,生成所述指数超参数使用时的参数规律信息。5.根据权利要求4所述的方法,其中,所述对所述至少一个试验损失函数进行损失试验,获得所述至少一个试验损失函数分别对应的试验结果,包括:利用预定义的多个试验概率对任一个试验损失函数分别进行损失计算试验,获得所述多个试验概率分别对应的试验损失值;确定所述多个试验概率分别对应的试验损失值为所述试验损失函数的试验结果,以确定所述至少一个试验损失函数分别对应的试验结果。6.根据权利要求5所述的方法,其中,所述根据所述至少一个试验损失函数分别对应的试验结果,生成所述指数超参数使用时的参数规律信息,包括:根据任一个试验损失函数的多个试验概率,拟合所述试验损失函数的损失曲线,以获得所述至少一个试验损失函数分别对应的损失曲线;根据所述至少一个试验损失函数分别对应的损失曲线,确定所述指数超参数使用时的参数规律信息。7.根据权利要求6所述的方法,其中,所述根据所述至少一个试验损失函数分别对应的损失曲线,确定所述指数超参数使用时的参数规律信息,包括:根据所述至少一个试验损失函数分别对应的损失曲线的斜率,和/或,同一试验概率在所述至少一个试验损失函数分别对应损失曲线中的损失值,确定所述指数超参数使用时的
参数规律信息;其中,所述参数规律信息包括:所述至少一个试验损失函数分别对应的损失曲线的斜率与对应的试验参数值的取值成正比,和/或,同一试验概率在所述至少一个试验损失函数分别对应损失曲线中的损失值与对应的试验参数值的取值成正比。8.根据权利要求2~7任一项所述的方法,其中,所述指数超参数包括:阈值调节超参数以及权重调节超参数。9.根据权利要求2~7任一项所述的方法,其中,所述根据所述指数超参数的参数值,构建所述指数型损失函数,包括:根据所述指数超参数的参数值,结合输入变量,生成指数子函数;基于所述指数子函数,结合所述输入变量对应的对数子函数,生成所述指数型损失函数;其中,所述输入变量对应所述多个分类概率中的任一个。10.根据权利要求1~9任一项所述的方法,其中,所述根据所述多个分类概率及指数型损失函数,计算获得所述多个训练数据对应的目标损失值,包括:确定所述多个分类概率分别对应的分类置信度;将所述多个分类概率分别对应的分类置信度作为输入变量输入所述指数型损失函数,计算获得所述多个训练数据分别对应的目标损失值。11.根据权利要求1
‑
10任一项所述的方法,其中,所述满足收敛条件的分类模型用于对待分类的数据进行分类;所述待分类的数据与所述多个训练样本的数据类型相同。12.一种数据分类方法,包括:获取待分类的数据;采用满足收敛条件的分类模型对所述待分类的数据进行分类,所述满足收敛条件的分类模型是采用如权利要求1
‑
11任一项所述的模型训练方法对预设的分类模型分类训练获得的。13.一种模型训练装置,包括:函数确定单元,用于基于预设指数超参数,确定分类模型的指数型损失函数;损失计算单元,用于根据多个训练数据分别在所述分类模型对应分类概率及指数型损失函数,计算获得所述多个训练数据对应的目标损失值;训练终止单元,用于在所述...
【专利技术属性】
技术研发人员:周文硕,武秉泓,杨大陆,杨叶辉,黄海峰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。