【技术实现步骤摘要】
本公开涉及计算机,具体而言,涉及一种模型训练方法、装置、电子设备和存储介质。
技术介绍
1、随着计算机技术和互联网技术的发展,越来越多的通过互联网向用户推送内容,例如向用户推送广告或者向用户发放优惠券等。由于不同用户对不同类型的推送内容的感兴趣程度不同,因此,为了提升推送内容的收益最大化,相关技术中通过增益模型筛选出针对目标推送内容的敏感用户,然后对该敏感用户推送该目标内容。
2、然而,该方式虽然能够提升推送内容的收益,但由于每个增益模型只能适配一个应用场景,导致不同的应用场景需要分别对不同的增益模型进行训练,如此,不仅导致增益模型的通用性较差,还提升了训练成本。
技术实现思路
1、本公开实施例至少提供一种模型训练方法、装置、电子设备及存储介质,可以使得模型适配不同的场景实验数据,进而可以在提升模型训练的通用性的同时降低训练成本。
2、本公开实施例提供了一种模型训练方法,包括:
3、获取针对目标策略的目标实验数据,所述目标实验数据为基于所述目标策略对第一
...【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述多个特征处理模板基于不同类型的策略优化目标构建生成,所述从多个预设的特征处理模板中确定与所述目标策略匹配的目标特征处理模板,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于针对所述初始增益模型的多组不同的超参数以及所述训练数据集分别对所述初始增益模型进行训练,得到多个训练好的第一增益模型,包括:
4.根据权利要求1所述的方法,其特征在于,所述将多个所述第一增益模型中训练结果符合预设要求的第一增益模型作为目标增益模型,包括:
...
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述多个特征处理模板基于不同类型的策略优化目标构建生成,所述从多个预设的特征处理模板中确定与所述目标策略匹配的目标特征处理模板,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于针对所述初始增益模型的多组不同的超参数以及所述训练数据集分别对所述初始增益模型进行训练,得到多个训练好的第一增益模型,包括:
4.根据权利要求1所述的方法,其特征在于,所述将多个所述第一增益模型中训练结果符合预设要求的第一增益模型作为目标增益模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1-5所述的方法,其特征在于,所述目标策略包括上下滑动角度放大策略、画质提升策略或者资源推荐策略。
7.一种策略应用方法,其特征在于,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述目标增益模型...
【专利技术属性】
技术研发人员:李政庭,邓伟辉,赵翊竹,王震,傅德良,李小成,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。