【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质
本申请涉及数据处理技术,尤其涉及机器学习模型的处理技术。
技术介绍
在搜索广告的场景中,广告主和搜索引擎方均希望得到更高的转化量。通常在广告展现之前预估展示广告之后的转化率。目前使用基于单任务的深度学习方法构建转化率预估模型。但是,由于不同的广告主数据诸多维度上存在较大差异,导致使用一个模型对不同广告主数据的转化率进行预估时,会出现过拟合和欠拟合并存的问题,转化率预测效果差。
技术实现思路
本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质,可以实现优化转化率的预测效果,提高转化率预测准确性。本申请实施例提供了一种数据处理方法,包括:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到多任务学习模型中的目标任务,目标任务为与任务模型的训练状态匹配的任务;使用目标任务对目标用户进行预测。上述申请实施例提供的数据处理方案,能够获取目标用户使用的任务模型的训练状态,根据训练状态将目标用户划分到多任务学习模型中 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标用户使用的任务模型的训练状态;/n根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务,所述目标任务为与所述任务模型的训练状态匹配的任务;/n使用所述目标任务对所述目标用户进行预测。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标用户使用的任务模型的训练状态;
根据所述训练状态将目标用户划分到多任务学习模型MTL中的目标任务,所述目标任务为与所述任务模型的训练状态匹配的任务;
使用所述目标任务对所述目标用户进行预测。
2.根据权利要求1所述的数据处理方法,其特征在于,所述获取目标用户使用的任务模型的训练状态,包括:
计算目标用户使用的任务模型的训练AUC和评估AUC;
根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态。
3.根据权利要求2所述的数据处理方法,其特征在于,所述计算目标用户使用的任务模型的训练AUC和评估AUC,包括:
统计预设时间段内,所述目标用户使用的任务模型的输入数据和输出数据,所述预设时间段根据预设时间点划分为第一时间段和第二时间段;
根据所述第一时间段采集的输入数据和输出数据计算训练AUC;
根据所述第二时间段采集的输入数据和输出数据计算评估AUC。
4.根据权利要求2所述的数据处理方法,其特征在于,根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态,包括:
若所述训练AUC与所述评估AUC的差值小于等于第一预设参数,且所述训练AUC大于等于第二预设参数、所述评估AUC大于等于第三预设参数,则目标用户使用的任务模型的训练状态为正常状态;
相应的,根据所述训练状态将目标用户划分到目标任务,包括:
若目标用户使用的任务模型的训练状态为正常状态,将所述目标用户划分到第一任务,所述第一任务使用的反向传播学习率等于预设传播学习率,第一任务使用的网络隐层数量为预设隐层数量。
5.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述训练AUC和所述评估AUC的取值,确定所述目标用户使用的任务模型的训练状态,包括:
若所述训练AUC与所述评估AUC的差值大于第一预设参数,则所述目标用户使用的任务模型的训练状态为过拟合状态;
相应的,根据所述训练状态将目标用户划分到目标任务,包括:
若所述目标用户使用的任务模型...
【专利技术属性】
技术研发人员:丁娇,刘琦凯,李沛龙,曹旭磊,杨雷,曾云峰,李晨瑞,黄旺,胡均毅,朱威,秦首科,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。