一种业务模型训练方法和装置制造方法及图纸

技术编号:27317589 阅读:52 留言:0更新日期:2021-02-10 09:52
本说明书实施例提供了一种业务模型训练方法和装置,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。分别训练所述n个分类模型中对应的分类模型。分别训练所述n个分类模型中对应的分类模型。

【技术实现步骤摘要】
一种业务模型训练方法和装置
[0001]本申请为2020年6月19日提交的申请号为202010566083.6,名为“一种业务模型训练方法和装置”的专利技术专利申请的分案申请。


[0002]本说明书实施例涉及机器学习
,更具体地,涉及一种业务模型训练方法和装置。

技术介绍

[0003]在互联网的应用场景中,每天会有大量的数据需要分析,而机器学习作为一种技术手段,正在越来越多的场景中发挥着作用。对于给定的任务,为取得良好的部署效果,可通过集成学习来集成多个不同的分类模型,而提升整体的集成模型的泛化性能。对于集成学习而言,有两个关键的因素需要考虑:其一是单个分类模型的准确率(accuracy),其二是分类模型间的多样性(diversity),只有做到“好而不同”,才有利于整体的集成模型取得更好的效果。然而,目前的方法中,获得多样性的主要办法是通过采集训练样本获得多个不同的训练样本集,来训练集成模型中的各个分类模型。
[0004]因此,需要一种更有效的业务模型训练方案。

技术实现思路

[0005]本说明书实施例旨在提供一种更有效的业务模型训练方案,以解决现有技术中的不足。
[0006]为实现上述目的,本说明书一个方面提供一种由计算机执行的业务模型训练方法,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:
[0007]获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;
[0008]通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;
[0009]生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;
[0010]以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。
[0011]在一种实施方式中,将所述特征数据转换为n个不同的转换数据包括,通过以下任一模型将所述特征数据映射为映射数据:随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。
[0012]在一种实施方式中,将所述特征数据转换为n个不同的转换数据还包括,在将所述特征数据映射为映射数据之后,将所述映射数据与所述特征数据拼接,以获取转换数据。
[0013]在一种实施方式中,将所述特征数据转换为n个不同的转换数据还包括,将所述特征数据转换为维度减少的转换数据。
[0014]在一种实施方式中,所述业务对象为以下任一对象:用户、商户、商品、交易。
[0015]本说明书另一方面提供一种部署于计算机中的业务模型训练装置,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述装置包括:
[0016]获取单元,配置为,获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;
[0017]转换单元,配置为,通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;
[0018]生成单元,配置为,生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;
[0019]训练单元,配置为,以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。
[0020]在一种实施方式中,所述转换单元包括,映射子单元,配置为,通过以下任一模型将所述特征数据映射为映射数据:随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。
[0021]在一种实施方式中,所述转换单元还包括,拼接子单元,配置为,在将所述特征数据映射为映射数据之后,将所述映射数据与所述特征数据拼接,以获取转换数据。
[0022]在一种实施方式中,所述转换单元还配置为,将所述特征数据转换为维度减少的转换数据。
[0023]本说明书另一方面提供一种通过业务模型处理业务数据的方法,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中,所述业务数据为业务对象的特征数据,n为大于1的自然数,所述方法包括:
[0024]通过所述n个转换模型,将所述业务数据转换为n个不同的转换数据;
[0025]将各个所述转换数据分别输入所述n个分类模型中的对应的分类模型,以从所述n个分类模型分别输出对所述业务对象的初始分类结果;
[0026]基于从所述n个分类模型分别输出的对所述业务对象的初始分类结果,确定对所述业务对象的分类结果。
[0027]本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项方法。
[0028]本说明书另一方面提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一项方法。
[0029]通过根据本说明书实施例的业务模型训练方法,通过在作为集成模型的业务模型中增加转换模型以对特征数据进行转换,大大提高了业务模型中的分类模型的多样性,从而使得整体的模型效果更好,另外,通过使用转换模型对特征数据进行降维,提高了业务模型的计算效率。
附图说明
[0030]通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:
[0031]图1示出根据本说明书实施例的业务模型100的结构示意图;
[0032]图2示出根据本说明书实施例的一种由计算机执行的业务模型训练方法流程图;
[0033]图3示出根据本说明书实施例的一种通过业务模型处理业务数据的方法流程图;
[0034]图4示出通过业务模型100预测业务对象的分类结果的过程示意图;
[0035]图5示出根据本说明书实施例的一种部署于计算机中的业务模型训练装置500。
具体实施方式
[0036]下面将结合附图描述本说明书实施例。
[0037]图1示出根据本说明书实施例的业务模型100的结构示意图。如图1中所示,业务模型100为一种集成模型,其中包括多个分类模型,图1中示意示出第一分类模型111、第二分类模型112和第三分类模型113。所述业务模型100中还包括与多个分类模型分别对应的多个转换模型,图1中示意示出第一转换模型121、第二转换模型122和第三转换模型123。另外,业务模型100中还包括确定单元13,确定单元13用于基于各个分类模型的输出确定业务模型100的输出。所述业务模型100例如用于预测用户的消费水平,也就是说,所述业务模型100的输出值用于预测用户的消费水平,例如,该输出值对应于低水平、中水平、高水平中的一个。
[0038]为了训练这样的业务模型100,首先获取与多个用户分别对应的训练样本集,该训练样本集中包括多个第一训练样本,例如包括第一训练样本(X,y),其中,X为该第一训练样本对应的用户的特征数据,该特征数据X中例如包括用户的性别、年龄、工作、历史交易数据等数据,y为该第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种业务模型训练方法,所述方法由计算机执行,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值,其中,所述业务对象为以下任一对象:用户、商户、商品、交易,所述业务模型用于预测业务对象的分类结果,所述标签值用于指示业务对象的标定分类结果;通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。2.根据权利要求1所述的方法,其中,将所述特征数据转换为n个不同的转换数据包括,通过以下任一模型将所述特征数据映射为映射数据:随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。3.根据权利要求2所述的方法,其中,将所述特征数据转换为n个不同的转换数据还包括,在将所述特征数据映射为映射数据之后,将所述映射数据与所述特征数据拼接,以获取转换数据。4.根据权利要求1或2所述的方法,其中,将所述特征数据转换为n个不同的转换数据还包括,将所述特征数据转换为维度减少的转换数据。5.一种业务模型训练装置,所述装置部署于计算机中,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述装置包括:获取单元...

【专利技术属性】
技术研发人员:张雅淋
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1