模型训练方法、装置及电子设备制造方法及图纸

技术编号：28980565 阅读：15 留言：0更新日期：2021-06-23 09:27

本申请公开了模型训练方法、装置及电子设备，涉及机器学习等人工智能技术领域。具体实现方案为：获取多个待训练模型，所述多个待训练模型包括结构不同的第一待训练模型和第二待训练模型；获取所述第二待训练模型输出的第一目标预估信息，所述第一目标预估信息为所述第二待训练模型输出的与所述第一待训练模型输入的特征信息相关的预估信息；将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数。根据本申请的技术，解决了对于系统链上多个场景加载的相同任务但是结构各异的预估模型的预估结果一致性比较低的问题，提高了多个预估模型的预估结果的一致性。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置及电子设备
本申请涉及人工智能
，尤其涉及机器学习
，具体涉及一种模型训练方法、装置及电子设备。
技术介绍
随着计算机技术的高速发展，模型得到了高速发展，各个系统通常都会嵌入模型，以进行任务预估。对于系统链上的不同场景，受制于性能约束，对于相同的预估任务而言，通常加载的模型往往也不尽相同。以搜索广告系统为例，从上游广告触发、排序、计费各个环节到最终的展现，本质上是一个包含多级漏斗的复杂系统，而受制于性能与优化方式的约束，在系统的各级漏斗都会有排序和截断问题，因此，往往会在系统的不同环节，有着对于相同任务但是结构各异的预估模型，这些模型的预估因子会作为重要排序依据。目前，对于系统链上多个场景加载的相同任务但是结构各异的预估模型通常都是独立训练，以分别得到各个模型的预估因子。
技术实现思路
本公开提供了一种模型训练方法、装置及电子设备。根据本公开的第一方面，提供了一种模型训练方法，包括：获取多个待训练模型，所述多个待训练模型包括结构不同的第一待训练模型和第二待训练模型；获取所述第二待训练模型输出的第一目标预估信息，所述第一目标预估信息为所述第二待训练模型输出的与所述第一待训练模型输入的特征信息相关的预估信息；将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数。根据本公开的第二方面，提供了一种模型训练装置，包括：第一获取模块，用于获取多个...

【技术保护点】
1.一种模型训练方法，包括：/n获取多个待训练模型，所述多个待训练模型包括结构不同的第一待训练模型和第二待训练模型；/n获取所述第二待训练模型输出的第一目标预估信息，所述第一目标预估信息为所述第二待训练模型输出的与所述第一待训练模型输入的特征信息相关的预估信息；/n将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数。/n

【技术特征摘要】
1.一种模型训练方法，包括：
获取多个待训练模型，所述多个待训练模型包括结构不同的第一待训练模型和第二待训练模型；
获取所述第二待训练模型输出的第一目标预估信息，所述第一目标预估信息为所述第二待训练模型输出的与所述第一待训练模型输入的特征信息相关的预估信息；
将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数。

2.根据权利要求1所述的方法，其中，所述将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数，包括：
获取所述第一待训练模型输出的第一预估信息；
确定所述第一标签信息与所述第一预估信息的第一差异信息；
基于所述第一差异信息，更新所述第一待训练模型的参数。

3.根据权利要求2所述的方法，所述基于所述第一差异信息，更新所述第一待训练模型的参数之前，所述方法还包括：
获取所述第一待训练模型对应的第二标签信息；
确定所述第二标签信息与所述第一预估信息的第二差异信息；
所述基于所述第一差异信息，更新所述第一待训练模型的参数，包括：
基于所述第一差异信息和第二差异信息，更新所述第一待训练模型的参数。

4.根据权利要求1所述的方法，其中，所述多个待训练模型还包括第三待训练模型，所述第三待训练模型输出的预估信息的维度大于或等于所述第二待训练模型输出的预估信息的维度；
所述获取所述第二待训练模型输出的第一目标预估信息，包括：
获取所述第三待训练模型输出的第二目标预估信息，所述第二目标预估信息为所述第三待训练模型输出的与所述第二待训练模型输入的特征信息相关的预估信息；
将所述第二目标预估信息作为所述第二待训练模型对应的第三标签信息，对所述第二待训练模型进行训练，以更新所述第二待训练模型的参数；
基于更新的所述第二待训练模型的参数，确定所述第一目标预估信息。

5.根据权利要求1所述的方法，其中，所述第一待训练模型输出的预估信息的维度等于所述第二待训练模型输出的预估信息的维度；
所述将所述第一目标预估信息作为所述第一待训练模型对应的第一标签信息，对所述第一待训练模型进行训练，以更新所述第一待训练模型的参数之后，所述方法还包括：
基于更新的所述第一待训练模型的参数，确定所述第一待训练模型输出的第二预估信息；
将所述第二预估信息作为所述第二待训练模型对应的第四标签信息，对所述第二待训练模型进行训练，以更新所述第二待训练模型的参数。

6.一种模型训练装置，包括：
第一获取模块，用于获取多个待训练模型，所述多个待训练模型包括结构不同的第一待训练模型和第二待训练模型；
第二获取模块，用于获取所述第二待训练模型输出...

【专利技术属性】
技术研发人员：李健，殷硕，叶超，宋斌斌，何洋，丁斌，嵇智，邓涛，张文，国智，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人