数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：28676518 阅读：36 留言：0更新日期：2021-06-02 02:53

本申请公开了一种数据处理方法、装置、电子设备及存储介质，涉及机器学习模型的处理技术领域。具体实现方案为：获取目标用户使用的任务模型的训练状态；根据训练状态将目标用户划分到目标任务，目标任务为多任务学习模型中的一个任务，多任务学习模型配置有与训练状态匹配的任务；使用任务对目标用户进行预测。本申请实施例提供的数据处理方案，能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务，根据训练状态将目标用户划分到相应的目标任务中，由目标任务对目标用户进行预测，进而使用与目标用户匹配度更高的目标任务对目标用户进行预测，能够更加准确的预测转化率，优化转化率的预测效果。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质
本申请涉及数据处理技术，尤其涉及机器学习模型的处理技术。
技术介绍
在搜索广告的场景中，广告主和搜索引擎方均希望得到更高的转化量。通常在广告展现之前预估展示广告之后的转化率。目前使用基于单任务的深度学习方法构建转化率预估模型。但是，由于不同的广告主数据诸多维度上存在较大差异，导致使用一个模型对不同广告主数据的转化率进行预估时，会出现过拟合和欠拟合并存的问题，转化率预测效果差。
技术实现思路
本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质，可以实现优化转化率的预测效果，提高转化率预测准确性。本申请实施例提供了一种数据处理方法，包括：获取目标用户使用的任务模型的训练状态；根据训练状态将目标用户划分到多任务学习模型中的目标任务，目标任务为与任务模型的训练状态匹配的任务；使用目标任务对目标用户进行预测。上述申请实施例提供的数据处理方案，能够获取目标用户使用的任务模型的训练状态，根据训练状态将目标用户划分到多任务学习模型中...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取目标用户使用的任务模型的训练状态；/n根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务，所述目标任务为与所述任务模型的训练状态匹配的任务；/n使用所述目标任务对所述目标用户进行预测。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取目标用户使用的任务模型的训练状态；
根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务，所述目标任务为与所述任务模型的训练状态匹配的任务；
使用所述目标任务对所述目标用户进行预测。

2.根据权利要求1所述的数据处理方法，其特征在于，所述获取目标用户使用的任务模型的训练状态，包括：
计算目标用户使用的任务模型的训练AUC和评估AUC；
根据所述训练AUC和所述评估AUC的取值，确定所述目标用户使用的任务模型的训练状态。

3.根据权利要求2所述的数据处理方法，其特征在于，所述计算目标用户使用的任务模型的训练AUC和评估AUC，包括：
统计预设时间段内，所述目标用户使用的任务模型的输入数据和输出数据，所述预设时间段根据预设时间点划分为第一时间段和第二时间段；
根据所述第一时间段采集的输入数据和输出数据计算训练AUC；
根据所述第二时间段采集的输入数据和输出数据计算评估AUC。

4.根据权利要求2所述的数据处理方法，其特征在于，根据所述训练AUC和所述评估AUC的取值，确定所述目标用户使用的任务模型的训练状态，包括：
若所述训练AUC与所述评估AUC的差值小于等于第一预设参数，且所述训练AUC大于等于第二预设参数、所述评估AUC大于等于第三预设参数，则目标用户使用的任务模型的训练状态为正常状态；
相应的，根据所述训练状态将目标用户划分到目标任务，包括：
若目标用户使用的任务模型的训练状态为正常状态，将所述目标用户划分到第一任务，所述第一任务使用的反向传播学习率等于预设传播学习率，第一任务使用的网络隐层数量为预设隐层数量。

5.根据权利要求2所述的数据处理方法，其特征在于，所述根据所述训练AUC和所述评估AUC的取值，确定所述目标用户使用的任务模型的训练状态，包括：
若所述训练AUC与所述评估AUC的差值大于第一预设参数，则所述目标用户使用的任务模型的训练状态为过拟合状态；
相应的，根据所述训练状态将目标用户划分到目标任务，包括：
若所述目标用户使用的任务模型...

【专利技术属性】
技术研发人员：丁娇，刘琦凯，李沛龙，曹旭磊，杨雷，曾云峰，李晨瑞，黄旺，胡均毅，朱威，秦首科，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人