训练方法、装置和计算机可读存储介质制造方法及图纸

技术编号：38143660 阅读：13 留言：0更新日期：2023-07-08 10:00

本公开涉及一种训练方法、装置和计算机可读存储介质，涉及人工智能技术领域。本公开的方法包括：获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同；将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果；根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关；根据第一损失函数的值调整机器学习模型的参数。值调整机器学习模型的参数。值调整机器学习模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
训练方法、装置和计算机可读存储介质

[0001]本公开涉及人工智能
，特别涉及一种训练方法、装置和计算机可读存储介质。

技术介绍

[0002]数据驱动的人工智能及其相关技术在各行各业都发挥了巨大作用，带来了很高价值。并且随着机器学习、深度学习等技术在各种场景下广泛应用，对于模型的可解释性也有着极高的需求。其中，模型可解释性的一个重要体现方面在于样本属性与样本预测值之间的关系上，通常建模专家会要求特征与模型的输出预测值之间满足某种先验经验约束。
[0003]但是，受样本采集偏差、模型训练过程的随机性等影响，最终得到的特征与模型的输出预测值之间不满先验经验约束足。

技术实现思路

[0004]专利技术人发现：在某些场景中，基于先验知识会出现输入的特征的值在一定区间内与模型的输出值呈现单调相关的特性，但是在实际训练过程中，输入的特征的值与模型的输出值不满足单调相关的特性，并且偏差较大，影响了模型的准确性和合理性。
[0005]本公开所要解决的一个技术问题是：如何提高训练后模型的准确性和合理性。
[0006]根据本公开的一些实施例，提供的一种训练方法，包括：获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同；将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果；根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样...

【技术保护点】

【技术特征摘要】
1.一种训练方法，包括：获取用于训练的样本组，其中，所述样本组包括多个样本，所述多个样本的第一类特征的值互不相同，第二类特征的值相同；将所述样本组输入机器学习模型，得到输出的所述样本组中各个样本对应的结果；根据所述各个样本对应的结果确定第一损失函数的值，其中，所述第一损失函数根据单调约束条件构建，所述各个样本对应的结果越符合所述单调约束条件，所述第一损失函数的值越小，所述单调约束条件为所述各个样本的第一类特征的值在预设区间内与所述各个样本对应的结果单调相关；根据所述第一损失函数的值调整所述机器学习模型的参数。2.根据权利要求1所述的训练方法，其中，所述根据所述各个样本对应的结果确定第一损失函数的值包括：将所述各个样本对应的结果按照预设顺序排列，其中，所述预设顺序为按照所述各个样本的第一类特征的值由小到大或由大到小的顺序；根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值。3.根据权利要求2所述的训练方法，其中，所述根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值包括：针对每相邻两个样本对应的结果的差值，确定所述差值是否满足所述单调约束条件；将不满足所述单调约束条件的各个差值相加，得到求和结果；根据所述求和结果确定所述第一损失函数的值。4.根据权利要求1所述的训练方法，其中，所述样本组还包括原始样本，所述原始样本与所述多个样本中的一个相同，所述方法还包括：根据所述原始样本对应的结果与所述原始样本的标注信息确定第二损失函数的值；所述根据所述第一损失函数的值调整所述机器学习模型的参数包括：将所述第一损失函数的值和所述第二损失函数的值进行加权求和，得到总损失函数的值；根据所述总损失函数的值调整所述机器学习模型的参数。5.根据权利要求4所述的训练方法，其中，所述根据所述总损失函数的值调整所述机器学习模型的参数包括：根据所述总损失函数的值确定是否达到预设收敛条件；在未达到预设收敛条件的情况下，根据所述总损失函数和预设参数调整方法，调整所述机器学习模型的参数。6.根据权利要求4所述的训练方法，还包括：获取所述原始样本；根据所述原始样本的第一类特征的值和第二类特征的值，生成所述多个样本；将所述原始样本和所述多个新样本组成样本组。7.根据权利要求6所述的训练方法，其中，在所述第一类特征的取值为连续值的情况下，将所述第一类特征的取值的所述预设区间划分为多个子区间，并设置各个子区间对应的转换值；将所述原始样本的第一类特征的原始值替换为所在的子区间对应的转换值，作为所述
原始样本的第一类特征的值；将各个子区间的转换值作为所述多个样本中各个样本的第一类特征的值。8.根据权利要求1所述的训练方法，其中，所述第一类特征为用户的知识水平...

【专利技术属性】
技术研发人员：高俊杰，汪冬冬，郑邦祺，黄志翔，杨恺，
申请(专利权)人：京东科技控股股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人