分类模型训练方法和装置、分类方法和装置制造方法及图纸

技术编号:33617409 阅读:59 留言:0更新日期:2022-06-02 00:35
本公开提供了一种分类模型训练方法和装置,涉及大数据、机器学习等技术领域。具体实现方案为:基于分类建模任务,确定待构建模型的建模信息;基于建模信息,在历史模型库中选取至少一个预训练模型;基于选取的样本,得到预训练模型的输出结果;基于输出结果和样本,对待构建模型进行训练,得到训练完成的分类模型。该实施方式提升了分类模型分类效果。该实施方式提升了分类模型分类效果。该实施方式提升了分类模型分类效果。

【技术实现步骤摘要】
分类模型训练方法和装置、分类方法和装置


[0001]本公开涉及计算机
,具体涉及大数据、机器学习等
,尤其涉及一种分类模型训练方法和装置、分类方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]分类模型在建模时,可以采用将历史样本和本次建模样本混合训练的建模方式,该方式建模耗时长,且建模效果不佳;还可以采用目标样本的建模方式,在这个方式中在目标样本是一些小样本的场景下,由于无法使用复杂算法,建模效果不佳。

技术实现思路

[0003]本公开提供了一种分类模型训练方法和装置、分类方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。
[0004]根据第一方面,提供了一种分类模型训练方法,该方法包括:基于分类建模任务,确定待构建模型的建模信息;基于建模信息,在历史模型库中选取至少一个预训练模型;基于选取的样本,得到预训练模型的输出结果;基于输出结果和样本,对待构建模型进行训练,得到训练完成的分类模型。
[0005]根据第二方面,提供了一种分类方法,该方法包括:获取待分类数据;将待分类数据输入采用如第一方面任一实现方式描述的方法生成的分类模型中,输出待分类数据的分类结果。
[0006]根据第三方面,提供了一种分类模型训练装置,该装置包括:确定单元,被配置成基于分类建模任务,确定待构建模型的建模信息;选取单元,被配置成基于建模信息,在历史模型库中选取至少一个预训练模型;得到单元,被配置成基于选取的样本,得到预训练模型的输出结果;训练单元,被配置成基于输出结果和样本,对待构建模型进行训练,得到训练完成的分类模型。
[0007]根据第四方面,又提供了一种分类装置,该装置包括:获取单元,被配置成被配置成获取待分类数据;输入单元,被配置成将待分类数据输入采用如第三方面任一实现方式描述的装置生成的分类模型中,得到待分类数据的分类结果。
[0008]根据第五方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面任一实现方式描述的方法。
[0009]根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面任一实现方式描述的方法。
[0010]根据第七方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面或第二方面任一实现方式描述的方法。
[0011]本公开的实施例提供的分类模型训练方法和装置,首先,基于分类建模任务,确定待构建模型的建模信息;其次,基于建模信息,在历史模型库中选取至少一个预训练模型;再次,基于选取的样本,得到预训练模型的输出结果;最后,基于输出结果和样本,对待构建模型进行训练,得到训练完成的分类模型。由此,将历史模型库中预训练模型的输出结果加入到新建的分类模型的特征池中,高效地利用了历史样本和历史建模结果,提升了分类模型的分类效果。
[0012]本公开的实施例提供的分类方法和装置,获取待分类数据;将待分类数据输入采用本实施例的分类模型训练方法生成的分类模型中,得到待分类数据的分类结果。由此,采用分类模型训练方法得到的分类模型进行分类,可以对待分类数据进行可靠的分类,保证了数据分类的有效性。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开分类模型训练方法的一个实施例的流程图;
[0016]图2是根据本公开分类模型训练方法适用场景的一种结构示意图;
[0017]图3是根据本公开分类方法的一个实施例的流程图;
[0018]图4是根据本公开分类模型训练装置的一个实施例的结构示意图;
[0019]图5是根据本公开选取单元的一个实施例的结构示意图;
[0020]图6是根据本公开筛选模块的一个实施例的结构示意图;
[0021]图7是根据本公开得到单元的一个实施例的结构示意图;
[0022]图8是根据本公开得到单元的另一个实施例的结构示意图;
[0023]图9是根据本公开得到单元的再一个实施例的结构示意图;
[0024]图10是根据本公开训练单元的一个实施例的结构示意图;
[0025]图11是根据本公开分类装置的一个实施例的结构示意图;
[0026]图12是用来实现本公开实施例的分类模型训练方法或分类方法的电子设备的框图。
具体实施方式
[0027]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]针对传统的小目标样本建模效果不好,或者历史样本和历史建模结果无法高效复用的问题,本公开提出了一种分类模型训练方法,图1示出了根据本公开分类模型训练方法的一个实施例的流程100,上述分类模型训练方法包括以下步骤:
[0029]步骤101,基于分类建模任务,确定待构建模型的建模信息。
[0030]本实施例中,分类模型训练方法运行于其上的执行主体在建模之前首先需要确定
所要建立的模型的任务,即建模任务。例如,建模任务为金融风控类型预测。
[0031]本实施例中,待构建模型可以是基学习器或者分类网络,待构建模型的参数还不确定,通过对待构建模型进行训练,可以生成分类模型。
[0032]本实施例中,待构建模型的建模信息是与待构建模型相关的信息,建模信息包括与待构建模型在建模过程相关的建模参数,建模参数包括:待构建模型的样本、待构建模型的超参数、待构建模型的参数、待构建模型的业务场景等。其中,通过待构建模型的样本可以确定样本特征。
[0033]在这里,样本是待构建模型的分类建模任务对应的实际业务场景样本,样本可以主要用于分类模型的建模,也即对待构建模型的训练。可选地,通过对样本进行标签标注可以得到待构建模型的正样本和负样本。
[0034]本实施例中,样本是用于训练待构建模型的样本,样本可以是从大量的数据集或数据源中选取的样本,待构建模型的样本的数量不做限制,例如,样本是从目标样本集中选取的第一预设数目的样本。
[0035]本实施例中,上述基于分类建模任务,确定待构建模型的建模信息包括:基于待构建模型的分类建模任务,确定待构建模型的样本、样本特征以及待构建模型的业务场景。其中,业务场景可以基于待构建模型所适用的场景不同而表现不同,例如,金融本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法,所述方法包括:基于分类建模任务,确定待构建模型的建模信息;基于所述建模信息,在历史模型库中选取至少一个预训练模型;基于选取的样本,得到所述预训练模型的输出结果;基于所述输出结果和所述样本,对所述待构建模型进行训练,得到训练完成的分类模型。2.根据权利要求1所述的方法,其中,所述建模信息包括:样本特征和业务场景信息;所述基于所述建模信息,在历史模型库中选取至少一个预训练模型包括:基于所述样本特征,从所述历史模型库中选取预筛选模型;基于所述业务场景信息,从所述预筛选模型中选取至少一个预训练模型。3.根据权利要求2所述的方法,其中,所述基于所述样本特征,从所述历史模型库中选取预筛选模型包括:确定所述历史模型库中各个模型的样本特征空间;基于所述样本特征与各个模型的样本特征空间的重合率,选取预筛选模型。4.根据权利要求1所述的方法,其中,所述预训练模型包括:神经网络模型,所述基于选取的样本,得到所述预训练模型的输出结果包括:将选取的样本输入所述神经网络模型,得到所述神经网络模型输出的第一预测结果;采集所述神经网络模型的隐节点的隐向量;拼接所述第一预测结果和所述隐向量,得到所述神经网络模型的输出结果。5.根据权利要求1所述的方法,其中,所述预训练模型包括:树模型,所述基于选取的样本,得到所述预训练模型的输出结果包括:将选取的样本输入所述树模型,得到所述树模型输出的第二预测结果;采集所述树模型输出的叶子节点索引号;对所述叶子节点索引号进行独热编码;拼接所述第二预测结果和进行独热编码后的叶子节点索引号,得到所述树模型的输出结果。6.根据权利要求1所述的方法,其中,所述预训练模型包括:神经网络模型和树模型,所述基于选取的样本,得到所述预训练模型的输出结果包括:将选取的样本输入所述神经网络模型,得到所述神经网络模型输出的第一预测结果;采集所述神经网络模型的隐节点的隐向量;将选取的样本输入所述树模型,得到所述树模型输出的第二预测结果;采集所述树模型输出的叶子节点索引号;对所述叶子节点索引号进行独热编码;拼接所述第一预测结果、所述第二预测结果、所述隐向量和进行独热编码后的叶子节点索引号,得到所述预训练模型的输出结果。7.根据权利要求1

6之一所述的方法,其中,所述基于所述输出结果和所述样本,对所述待构建模型进行训练,得到训练完成的分类模型包括:将所述输出结果以及所述样本进行拼接,得到拼接样本;采用所述拼接样本对所述待构建模型进行训练,得到训练完成的分类模型。
8.一种分类方法,所述方法:获取待分类数据;将所述待分类数据输入如权利要求1

7任一项所述的方法生成的分类模型中,输出所述待分类数据的分类结果。9.一种分类模型训练装置,所述装置包括:确定单元,被配置成基于分类建模任务,确定待构建模型的建模信息;选取单元,被配置成基于所述建模信息,在历史模型库中选取至少一个预训练模型;得到单元,被配置成基于选取的样本,得到所述预训练模型的输出结果;训练单元,被配置成基于所述输出结果和所述样本,对所述待构建模型进行训练,得到训练完成的分类模型。10.根据权利要求9所述的装置,所述建模信息包括:样本特征和业务场景信息;所述选取单元包...

【专利技术属性】
技术研发人员:李硕王天祺刘昊骋田建徐靖宇徐世界
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1