训练方法、装置和计算机可读存储介质制造方法及图纸

技术编号:38143660 阅读:13 留言:0更新日期:2023-07-08 10:00
本公开涉及一种训练方法、装置和计算机可读存储介质,涉及人工智能技术领域。本公开的方法包括:获取用于训练的样本组,其中,样本组包括多个样本,多个样本的第一类特征的值互不相同,第二类特征的值相同;将样本组输入机器学习模型,得到输出的样本组中各个样本对应的结果;根据各个样本对应的结果确定第一损失函数的值,其中,第一损失函数根据单调约束条件构建,各个样本对应的结果越符合单调约束条件,第一损失函数的值越小,单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关;根据第一损失函数的值调整机器学习模型的参数。值调整机器学习模型的参数。值调整机器学习模型的参数。

【技术实现步骤摘要】
训练方法、装置和计算机可读存储介质


[0001]本公开涉及人工智能
,特别涉及一种训练方法、装置和计算机可读存储介质。

技术介绍

[0002]数据驱动的人工智能及其相关技术在各行各业都发挥了巨大作用,带来了很高价值。并且随着机器学习、深度学习等技术在各种场景下广泛应用,对于模型的可解释性也有着极高的需求。其中,模型可解释性的一个重要体现方面在于样本属性与样本预测值之间的关系上,通常建模专家会要求特征与模型的输出预测值之间满足某种先验经验约束。
[0003]但是,受样本采集偏差、模型训练过程的随机性等影响,最终得到的特征与模型的输出预测值之间不满先验经验约束足。

技术实现思路

[0004]专利技术人发现:在某些场景中,基于先验知识会出现输入的特征的值在一定区间内与模型的输出值呈现单调相关的特性,但是在实际训练过程中,输入的特征的值与模型的输出值不满足单调相关的特性,并且偏差较大,影响了模型的准确性和合理性。
[0005]本公开所要解决的一个技术问题是:如何提高训练后模型的准确性和合理性。
[0006]根据本公开的一些实施例,提供的一种训练方法,包括:获取用于训练的样本组,其中,样本组包括多个样本,多个样本的第一类特征的值互不相同,第二类特征的值相同;将样本组输入机器学习模型,得到输出的样本组中各个样本对应的结果;根据各个样本对应的结果确定第一损失函数的值,其中,第一损失函数根据单调约束条件构建,各个样本对应的结果越符合单调约束条件,第一损失函数的值越小,单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关;根据第一损失函数的值调整机器学习模型的参数。
[0007]在一些实施例中,根据各个样本对应的结果确定第一损失函数的值包括:将各个样本对应的结果按照预设顺序排列,其中,预设顺序为按照各个样本的第一类特征的值由小到大或由大到小的顺序;根据每相邻两个样本对应的结果的差值确定第一损失函数的值。
[0008]在一些实施例中,根据每相邻两个样本对应的结果的差值确定第一损失函数的值包括:针对每相邻两个样本对应的结果的差值,确定差值是否满足单调约束条件;将不满足单调约束条件的各个差值相加,得到求和结果;根据求和结果确定第一损失函数的值。
[0009]在一些实施例中,样本组还包括原始样本,原始样本与多个样本中的一个相同,该方法还包括:根据原始样本对应的结果与原始样本的标注信息确定第二损失函数的值;根据第一损失函数的值调整机器学习模型的参数包括:将第一损失函数的值和第二损失函数的值进行加权求和,得到总损失函数的值;根据总损失函数的值调整机器学习模型的参数。
[0010]在一些实施例中,根据总损失函数的值调整机器学习模型的参数包括:根据总损
失函数的值确定是否达到预设收敛条件;在未达到预设收敛条件的情况下,根据总损失函数和预设参数调整方法,调整机器学习模型的参数。
[0011]在一些实施例中,该方法还包括:获取原始样本;根据原始样本的第一类特征的值和第二类特征的值,生成多个样本;将原始样本和多个新样本组成样本组。
[0012]在一些实施例中,在第一类特征的取值为连续值的情况下,将第一类特征的取值的预设区间划分为多个子区间,并设置各个子区间对应的转换值;将原始样本的第一类特征的原始值替换为所在的子区间对应的转换值,作为原始样本的第一类特征的值;将各个子区间的转换值作为多个样本中各个样本的第一类特征的值。
[0013]在一些实施例中,第一类特征为用户的知识水平评价指标,第二类特征包括用户的历史行为信息,机器学习模型为风险预测模型,各个样本对应的结果为各个样本对应的资源占用超过期限的概率。
[0014]在一些实施例中,第一类特征为用户关于对象的历史访问次数,第二类特征包括用户的属性信息,机器学习模型为对象推荐模型,各个样本对应的结果为各个样本对应的对象的推荐概率。
[0015]在一些实施例中,第一类特征为用户的年龄,第二类特征包括用户的历史问诊信息,机器学习模型为预测模型,各个样本对应的结果为各个样本对应的用户的出现预设症状概率。
[0016]在一些实施例中,该方法还包括:将待预测用户的特征信息输入风险预测模型,其中,待预测用户的信特征息包括:待预测用户的知识水平评价指标,以及待预测用户的历史行为信息;获取风险预测模型输出的待预测用户对资源占用超过期限的概率。
[0017]在一些实施例中,该方法还包括:将待推荐用户的特征信息输入对象推荐模型,其中,待推荐用户的特征信息包括:待推荐用户关于对象的历史访问次数以及待推荐用户的属性信息;根据对象推荐模型输出的对象的推荐概率,确定是否向待推荐用户推荐对象。
[0018]在一些实施例中,该方法还包括:将待预测用户的特征信息输入预测模型,其中,待预测用户的特征信息包括:待预测用户的历史问诊信息,以及待预测用户的年龄;获取预测模型输出的待预测用户出现预设症状的概率。
[0019]根据本公开的另一些实施例,提供的一种训练装置,包括:获取模块,用于获取用于训练的样本组,其中,样本组包括多个样本,多个样本的第一类特征的值互不相同,第二类特征的值相同;输入模块,用于将样本组输入机器学习模型,得到输出的样本组中各个样本对应的结果;确定模块,用于根据各个样本对应的结果确定第一损失函数的值,其中,第一损失函数根据单调约束条件构建,各个样本对应的结果越符合单调约束条件,第一损失函数的值越小,单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关;调整模块,用于根据第一损失函数的值调整机器学习模型的参数。
[0020]根据本公开的又一些实施例,提供的一种训练装置,包括:处理器;以及耦接至处理器的存储器,用于存储指令,指令被处理器执行时,使处理器执行如前述任意实施例的训练方法。
[0021]根据本公开的再一些实施例,提供的一种非瞬时性计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意实施例的训练方法。
[0022]本公开的方法中样本组包括第一类特征的值互不相同,第二类特征的值相同的多
个样本,将样本组输入机器学习模型,得到输出的样本组中各个样本对应的结果,根据各个样本对应的结果确定第一损失函数的值,并调整机器学习模型的参数。由于第一损失函数根据单调约束条件构建,训练过程中可以使机器学习模型学习第一类特征和结果的单调相关的特性,训练得到的机器学习模型可以更加符合单调约束条件,提高了训练后模型的准确性和合理性。
[0023]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
[0024]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练方法,包括:获取用于训练的样本组,其中,所述样本组包括多个样本,所述多个样本的第一类特征的值互不相同,第二类特征的值相同;将所述样本组输入机器学习模型,得到输出的所述样本组中各个样本对应的结果;根据所述各个样本对应的结果确定第一损失函数的值,其中,所述第一损失函数根据单调约束条件构建,所述各个样本对应的结果越符合所述单调约束条件,所述第一损失函数的值越小,所述单调约束条件为所述各个样本的第一类特征的值在预设区间内与所述各个样本对应的结果单调相关;根据所述第一损失函数的值调整所述机器学习模型的参数。2.根据权利要求1所述的训练方法,其中,所述根据所述各个样本对应的结果确定第一损失函数的值包括:将所述各个样本对应的结果按照预设顺序排列,其中,所述预设顺序为按照所述各个样本的第一类特征的值由小到大或由大到小的顺序;根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值。3.根据权利要求2所述的训练方法,其中,所述根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值包括:针对每相邻两个样本对应的结果的差值,确定所述差值是否满足所述单调约束条件;将不满足所述单调约束条件的各个差值相加,得到求和结果;根据所述求和结果确定所述第一损失函数的值。4.根据权利要求1所述的训练方法,其中,所述样本组还包括原始样本,所述原始样本与所述多个样本中的一个相同,所述方法还包括:根据所述原始样本对应的结果与所述原始样本的标注信息确定第二损失函数的值;所述根据所述第一损失函数的值调整所述机器学习模型的参数包括:将所述第一损失函数的值和所述第二损失函数的值进行加权求和,得到总损失函数的值;根据所述总损失函数的值调整所述机器学习模型的参数。5.根据权利要求4所述的训练方法,其中,所述根据所述总损失函数的值调整所述机器学习模型的参数包括:根据所述总损失函数的值确定是否达到预设收敛条件;在未达到预设收敛条件的情况下,根据所述总损失函数和预设参数调整方法,调整所述机器学习模型的参数。6.根据权利要求4所述的训练方法,还包括:获取所述原始样本;根据所述原始样本的第一类特征的值和第二类特征的值,生成所述多个样本;将所述原始样本和所述多个新样本组成样本组。7.根据权利要求6所述的训练方法,其中,在所述第一类特征的取值为连续值的情况下,将所述第一类特征的取值的所述预设区间划分为多个子区间,并设置各个子区间对应的转换值;将所述原始样本的第一类特征的原始值替换为所在的子区间对应的转换值,作为所述
原始样本的第一类特征的值;将各个子区间的转换值作为所述多个样本中各个样本的第一类特征的值。8.根据权利要求1所述的训练方法,其中,所述第一类特征为用户的知识水平...

【专利技术属性】
技术研发人员:高俊杰汪冬冬郑邦祺黄志翔杨恺
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1