模型训练方法、点击率确定方法及相关设备技术

技术编号：38029813 阅读：12 留言：0更新日期：2023-06-30 10:56

本公开的实施方式提供了一种模型训练方法、点击率确定方法及相关设备，属于计算机技术领域。该方法包括：获取训练样本集合，训练样本集合包括多个业务场景下的训练样本及对应的样本标签；将训练样本分别输入第一预测模型和第二预测模型，并将第一预测模型的中间数据迁移至第二预测模型，获得第一预测模型输出的第一训练点击率和第二预测模型输出的第二训练点击率；根据第一训练点击率、第二训练点击率和样本标签，调整第一预测模型和第二预测模型的模型参数。本公开能够缓解部分数据稀疏的场景，模型收敛困难，预测准确率较低的问题，解决单域模型维护困难的问题及基于多场景混合数据集建模的引起的跷跷板效应。数据集建模的引起的跷跷板效应。数据集建模的引起的跷跷板效应。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、点击率确定方法及相关设备

[0001]本公开涉及计算机
，更具体地，本公开的实施方式涉及一种模型训练方法、点击率确定方法及相关设备。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着互联网的普及，越来越多的用户使用网页、APP等互联网产品获取信息。但互联网中充斥着大量的信息，如何快速的为用户提供其所需要的信息成为提高用户满意度的主要手段。
[0004]相关技术中，通常是通过点击率预估模型的预测结果为用户推荐信息。然而，现有大都是利用各场景的交互数据进行单场景下模型训练，这样，对于数据稀疏的场景，模型收敛困难，预测准确率较低；另外会导致模型数量随着场景数而增加，模型维护困难，需要消耗大量资源。而基于多场景混合数据集的模型训练过程，往往存在部分场景模型性能提升，而部分场景模型性能下降的跷跷板效应。

技术实现思路

[0005]本公开的实施方式提供一种模型训练方法、点击率确定方法及相关设备。
[0006]在本公开实施方式的第一方面中，提供了一种模型训练方法，所述方法包括：获取训练样本集合，所述训练样本集合包括多个业务场景下的训练样本及对应的样本标签；将所述训练样本分别输入第一预测模型和第二预测模型，并将所述第一预测模型的中间数据迁移至所述第二预测模型，获得所述第一预测模型输出的第一训练点击率和所述第二预测模型输出的第二训练点击率；根据所述第一训练点击率、所述第二训

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：获取训练样本集合，所述训练样本集合包括多个业务场景下的训练样本及对应的样本标签；将所述训练样本分别输入第一预测模型和第二预测模型，并将所述第一预测模型的中间数据迁移至所述第二预测模型，获得所述第一预测模型输出的第一训练点击率和所述第二预测模型输出的第二训练点击率；根据所述第一训练点击率、所述第二训练点击率和所述样本标签，调整所述第一预测模型和所述第二预测模型的模型参数。2.根据权利要求1所述的方法，其特征在于，所述第一预测模型包括多个业务场景对应的场景模型，所述训练样本包括样本场景特征，所述方法还包括：根据所述样本场景特征，在所述第一预测模型中确定所述训练样本对应的场景模型；所述将训练样本分别输入第一预测模型和第二预测模型，包括：将所述训练样本分别输入对应的场景模型和所述第二预测模型。3.根据权利要求2所述的方法，其特征在于，所述获得第一训练点击率，包括：基于第一标准化处理，通过所述第一预测模型对所述训练样本进行前向处理，获得所述第一训练点击率，所述第一标准化处理的标准化参数为基于该场景模型对应的业务场景下的训练样本确定的。4.根据权利要求3所述的方法，其特征在于，所述获得第二训练点击率，包括：基于第二标准化处理，通过所述第二预测模型对所述中间数据和所述训练样本进行前向处理，以获得所述第二训练点击率，所述第二标准化处理的标准化参数为基于输入所述第二预测模型的多个业务场景下的训练样本确定的，多个业务场景对应的训练样本之间具有特征关联。5.根据权利要求1所述的方法，其特征在于，所述根据第一训练点击率、第二训练点击率和样本标签，调整第一预测模型和第二预测模型的模型参数，包括：根据所述第一训练点击率和所述样本标签，确定第一损失函数；根据所述第二训练点击率和所述样本标签，确定第二损失函数；根据所述第一损失函数和所述第二损失函数，确定目标损失函数；根据所述目标损失函数，调整所述第一预测模型和所述第二预测模型的模型参数。6.根据权利要求5所述的方法，其特征在于，所述将所述第一预测模型的中间数据迁移至所述第二预测模型，...

【专利技术属性】
技术研发人员：赵鑫萍，章莺，肖强，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人