数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28676518 阅读:36 留言:0更新日期:2021-06-02 02:53
本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质
本申请涉及数据处理技术,尤其涉及机器学习模型的处理技术。
技术介绍
在搜索广告的场景中,广告主和搜索引擎方均希望得到更高的转化量。通常在广告展现之前预估展示广告之后的转化率。目前使用基于单任务的深度学习方法构建转化率预估模型。但是,由于不同的广告主数据诸多维度上存在较大差异,导致使用一个模型对不同广告主数据的转化率进行预估时,会出现过拟合和欠拟合并存的问题,转化率预测效果差。
技术实现思路
本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质,可以实现优化转化率的预测效果,提高转化率预测准确性。本申请实施例提供了一种数据处理方法,包括:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到多任务学习模型中的目标任务,目标任务为与任务模型的训练状态匹配的任务;使用目标任务对目标用户进行预测。上述申请实施例提供的数据处理方案,能够获取目标用户使用的任务模型的训练状态,根据训练状态将目标用户划分到多任务学习模型中的目标任务,并通过该本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标用户使用的任务模型的训练状态;/n根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务,所述目标任务为与所述任务模型的训练状态匹配的任务;/n使用所述目标任务对所述目标用户进行预测。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标用户使用的任务模型的训练状态;
根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务,所述目标任务为与所述任务模型的训练状态匹配的任务;
使用所述目标任务对所述目标用户进行预测。


2.根据权利要求1所述的数据处理方法,其特征在于,所述获取目标用户使用的任务模型的训练状态,包括:
计算目标用户使用的任务模型的训练AUC和评估AUC;
根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态。


3.根据权利要求2所述的数据处理方法,其特征在于,所述计算目标用户使用的任务模型的训练AUC和评估AUC,包括:
统计预设时间段内,所述目标用户使用的任务模型的输入数据和输出数据,所述预设时间段根据预设时间点划分为第一时间段和第二时间段;
根据所述第一时间段采集的输入数据和输出数据计算训练AUC;
根据所述第二时间段采集的输入数据和输出数据计算评估AUC。


4.根据权利要求2所述的数据处理方法,其特征在于,根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态,包括:
若所述训练AUC与所述评估AUC的差值小于等于第一预设参数,且所述训练AUC大于等于第二预设参数、所述评估AUC大于等于第三预设参数,则目标用户使用的任务模型的训练状态为正常状态;
相应的,根据所述训练状态将目标用户划分到目标任务,包括:
若目标用户使用的任务模型的训练状态为正常状态,将所述目标用户划分到第一任务,所述第一任务使用的反向传播学习率等于预设传播学习率,第一任务使用的网络隐层数量为预设隐层数量。


5.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态,包括:
若所述训练AUC与所述评估AUC的差值大于第一预设参数,则所述目标用户使用的任务模型的训练状态为过拟合状态;
相应的,根据所述训练状态将目标用户划分到目标任务,包括:
若所述目标用户使用的任务模型...

【专利技术属性】
技术研发人员:丁娇刘琦凯李沛龙曹旭磊杨雷曾云峰李晨瑞黄旺胡均毅朱威秦首科
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1