分类模型训练方法和装置、分类方法和装置制造方法及图纸

技术编号：33617409 阅读：64 留言：0更新日期：2022-06-02 00:35

本公开提供了一种分类模型训练方法和装置，涉及大数据、机器学习等技术领域。具体实现方案为：基于分类建模任务，确定待构建模型的建模信息；基于建模信息，在历史模型库中选取至少一个预训练模型；基于选取的样本，得到预训练模型的输出结果；基于输出结果和样本，对待构建模型进行训练，得到训练完成的分类模型。该实施方式提升了分类模型分类效果。该实施方式提升了分类模型分类效果。该实施方式提升了分类模型分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型训练方法和装置、分类方法和装置

[0001]本公开涉及计算机
，具体涉及大数据、机器学习等
，尤其涉及一种分类模型训练方法和装置、分类方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]分类模型在建模时，可以采用将历史样本和本次建模样本混合训练的建模方式，该方式建模耗时长，且建模效果不佳；还可以采用目标样本的建模方式，在这个方式中在目标样本是一些小样本的场景下，由于无法使用复杂算法，建模效果不佳。

技术实现思路

[0003]本公开提供了一种分类模型训练方法和装置、分类方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。
[0004]根据第一方面，提供了一种分类模型训练方法，该方法包括：基于分类建模任务，确定待构建模型的建模信息；基于建模信息，在历史模型库中选取至少一个预训练模型；基于选取的样本，得到预训练模型的输出结果；基于输出结果和样本，对待构建模型进行训练，得到训练完成的分类模型。
[0005]根据第二方面，提供了一种分类方法，该方法包括：获取待分类数据；将待分类数据输入采用如第一方面任一实现方式描述的方法生成的分类模型中，输出待分类数据的分类结果。
[0006]根据第三方面，提供了一种分类模型训练装置，该装置包括：确定单元，被配置成基于分类建模任务，确定待构建模型的建模信息；选取单元，被配置成基于建模信息，在历史模型库中选取至少一个预训练模型；得到单元，被配置成基于选取的样本，得到预训练模型的输出结果；训练单元，...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法，所述方法包括：基于分类建模任务，确定待构建模型的建模信息；基于所述建模信息，在历史模型库中选取至少一个预训练模型；基于选取的样本，得到所述预训练模型的输出结果；基于所述输出结果和所述样本，对所述待构建模型进行训练，得到训练完成的分类模型。2.根据权利要求1所述的方法，其中，所述建模信息包括：样本特征和业务场景信息；所述基于所述建模信息，在历史模型库中选取至少一个预训练模型包括：基于所述样本特征，从所述历史模型库中选取预筛选模型；基于所述业务场景信息，从所述预筛选模型中选取至少一个预训练模型。3.根据权利要求2所述的方法，其中，所述基于所述样本特征，从所述历史模型库中选取预筛选模型包括：确定所述历史模型库中各个模型的样本特征空间；基于所述样本特征与各个模型的样本特征空间的重合率，选取预筛选模型。4.根据权利要求1所述的方法，其中，所述预训练模型包括：神经网络模型，所述基于选取的样本，得到所述预训练模型的输出结果包括：将选取的样本输入所述神经网络模型，得到所述神经网络模型输出的第一预测结果；采集所述神经网络模型的隐节点的隐向量；拼接所述第一预测结果和所述隐向量，得到所述神经网络模型的输出结果。5.根据权利要求1所述的方法，其中，所述预训练模型包括：树模型，所述基于选取的样本，得到所述预训练模型的输出结果包括：将选取的样本输入所述树模型，得到所述树模型输出的第二预测结果；采集所述树模型输出的叶子节点索引号；对所述叶子节点索引号进行独热编码；拼接所述第二预测结果和进行独热编码后的叶子节点索引号，得到所述树模型的输出结果。6.根据权利要求1所述的方法，其中，所述预训练模型包括：神经网络模型和树模型，所述基于选取的样本，得到所述预训练模型的输出结果包括：将选取的样本输入所述神经网络模型，得到所述神经网络模型输出的第一预测结果；采集所述神经网络模型的隐节点的隐向量；将选取的样本输入所述树模型，得到所述树模型输出的第二预测结果；采集所述树模型输出的叶子节点索引号；对所述叶子节点索引号进行独热编码；拼接所述第一预测结果、所述第二预测结果、所述隐向量和进行独热编码后的叶子节点索引号，得到所述预训练模型的输出结果。7.根据权利要求1
‑
6之一所述的方法，其中，所述基于所述输出结果和所述样本，对所述待构建模型进行训练，得到训练完成的分类模型包括：将所述输出结果以及所述样本进行拼接，得到拼接样本；采用所述拼接样本对所述待构建模型进行训练，得到训练完成的分类模型。
8.一种分类方法，所述方法：获取待分类数据；将所述待分类数据输入如权利要求1
‑
7任一项所述的方法生成的分类模型中，输出所述待分类数据的分类结果。9.一种分类模型训练装置，所述装置包括：确定单元，被配置成基于分类建模任务，确定待构建模型的建模信息；选取单元，被配置成基于所述建模信息，在历史模型库中选取至少一个预训练模型；得到单元，被配置成基于选取的样本，得到所述预训练模型的输出结果；训练单元，被配置成基于所述输出结果和所述样本，对所述待构建模型进行训练，得到训练完成的分类模型。10.根据权利要求9所述的装置，所述建模信息包括：样本特征和业务场景信息；所述选取单元包...

【专利技术属性】
技术研发人员：李硕，王天祺，刘昊骋，田建，徐靖宇，徐世界，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人