【技术实现步骤摘要】
转化率预估模型的训练方法、预测方法、装置和设备
[0001]本申请涉及人工智能领域,特别涉及一种转化率预估模型的训练方法、预测方法、装置和设备。
技术介绍
[0002]广告是现代生活中不可或缺的一种宣传载体。不同的广告会存在不同的价值,对于一个广告请求,转化率预估模型针对每个广告都预估该广告请求在该广告上的转化率,转化率预估的准确性是进行广告推荐的最重要的环节之一。
[0003]相关技术中,深度学习模型的建模方式主要采用线性&深度(Wide&Deep)模型并在其上叠加全连接层,通过深度学习模型的方法来预测转化率。
[0004]然而,相关技术中的深度学习模型的特征学习能力不足,容易导致转化率预估偏差问题。
技术实现思路
[0005]本申请提供了一种转化率预估模型的训练方法、预测方法、装置和设备。所述技术方案如下:
[0006]根据本申请的一方面,提供了一种转化率预估模型的训练方法,所述转化率预估模型包括第一分支和第二分支;所述第一分支包括第一特征提取网络,所述第二分支包括依次级联的第二特征提取网络、专家网络和深层网络,以及连接所述第二特征提取网络的输出端与所述深层网络的输入端的门控网络;
[0007]所述方法包括:
[0008]接收样本广告播放请求,所述样本广告播放请求携带多任务场景下的样本特征,所述样本特征包括标签信息;
[0009]将所述样本特征输入所述第一分支,基于所述第一特征提取网络进行转化率预估,得到第一预测信息; ...
【技术保护点】
【技术特征摘要】
1.一种转化率预估模型的训练方法,其特征在于,所述转化率预估模型包括第一分支和第二分支;所述第一分支包括第一特征提取网络,所述第二分支包括依次级联的第二特征提取网络、专家网络和深层网络,以及连接所述第二特征提取网络的输出端与所述深层网络的输入端的门控网络;所述方法包括:接收样本广告播放请求,所述样本广告播放请求携带多任务场景下的样本特征,所述样本特征包括标签信息;将所述样本特征输入所述第一分支,基于所述第一特征提取网络进行转化率预估,得到第一预测信息;以及,将所述样本特征输入所述第二分支,基于所述第二特征提取网络对所述样本特征进行特征交叉,得到底层特征;基于所述专家网络对所述底层特征进行特征映射,得到专家特征;基于所述深层网络对所述专家特征以及所述门控网络传递的底层映射特征进行转化率预估,得到第二预测信息;所述底层映射特征是所述门控网络对所述底层特征进行映射处理得到的;基于所述标签信息、所述第一预测信息和所述第二预测信息,确定训练损失;基于所述训练损失,对所述转化率预估模型的模型参数进行训练。2.根据权利要求1所述的方法,其特征在于,所述深层网络包括依次级联的至少两层正则化层;所述门控网络包括专家门控网络和深度门控网络,所述深度门控网络包括至少两个子门控网络;所述第二特征提取网络的输出端通过所述专家门控网络与所述深层网络的输入端连接,所述第二特征提取网络的输出端还通过所述至少两个子门控网络与所述至少两层正则化层的输入端分别连接;所述基于所述深层网络对所述专家特征以及所述门控网络传递的底层映射特征进行转化率预估,得到第二预测信息,包括:将所述专家特征以及所述专家门控网络传递的第一底层映射特征进行点乘,得到专家映射特征;基于所述深层网络的所述至少两层正则化层,对所述专家映射特征以及所述至少两个子门控网络传递的第二底层映射特征进行转化率预估,得到所述第二预测信息。3.根据权利要求2所述的方法,其特征在于,所述深层网络的所述至少两层正则化层包括依次级联的第一正则化层和第二正则化层;所述深度门控网络的所述至少两个子门控网络包括第一子门控网络和第二子门控网络;所述第二特征提取网络的输出端通过所述专家门控网络与所述第一正则化层的输入端连接;所述第二特征提取网络的输出端通过所述深度门控网络的所述第一子门控网络与所述第一正则化层的输入端连接,所述第二特征提取网络的输出端还通过所述深度门控网络的所述第二子门控网络与所述第二正则化层的输入端连接;所述基于所述深层网络的所述至少两层正则化层,对所述专家映射特征以及所述至少两个子门控网络传递的第二底层映射特征进行转化率预估,得到所述第二预测信息,包括:将所述专家映射特征以及所述第一子门控网络传递的第一子底层映射特征进行点乘,得到专家门控特征;
基于所述深层网络的所述第一正则化层,对所述专家门控特征进行映射处理,得到第一深度特征;将所述第一深度特征以及所述第二子门控网络传递的第二子底层映射特征进行点乘,得到深度门控特征;基于所述深层网络的所述第二正则化层,对所述深度门控特征进行转化率预估,得到所述第二预测信息。4.根据权利要求3所述的方法,其特征在于,所述深层网络还包括与所述第二正则化层的输出端连接的全连接层;所述基于所述深层网络的所述第二正则化层,对所述深度门控特征进行转化率预估,得到所述第二预测信息,包括:基于所述深层网络的所述第二正则化层,对所述深度门控特征进行映射处理,得到第二深度特征;基于所述深层网络的所述全连接层,对所述第二深度特征进行转化率预估,得到所述第二预测信息。5.根据权利要求1至4任一所述的方法,其特征在于,所述专家门控网络包括依次级联的第三正则化层和第一全连接层;所述方法还包括:基于所述专家门控网络的所述第三正则化层,对所述底层特征进行正则化处理,得到第一底层特征;基于所述专家门控网络的所述全连接层,对所述第一底层特征进行映射处理,得到所述第一底层映射特征。6.根据权利要求1至4任一所述的方法,其特征在于,所述深度门控网络中的所述至少两个子门控网络中的第一子门控网络包括依次级联的第四正则化层、第二全连接层和第一非线性函数;所述方法还包括:基于所述第一子门控网络的所述第四正则化层,对所述底层特征进行正则化处理,得到第一子底层特征;基于所述第一子门控网络的所述第二全连接层,对所述第一子底层特征进行映射处理,得到所述第一子底层连接特征;基于所述第一子门控网络的所述第一非线性函数,对所述第一子底层连接特征进行非线性映射,得到所述第一子底层映射特征。7.根据权利要求1至4任一所述的方法,其特征在于,所述深度门控网络中的所述至少两个子门控网络中的第二子门控网络包括依次级联的第五正则化层、第三全连接层和第二非线性函数;所述方法还包括:基于所述第二子门控网络的所述第五正则化层,对所述底层特征进行正则化处理,得到第二子底层特征;基于所述第二子门控网络的所述第三全连接层,对所述第二子底层特征进行映射处理,得到所述第二子底层连接特征;
基于所述第二子门控网络的所述第二非线性函数,对所述第二子底层连接特征进行非线性映射,得到所述第二子底层映射特征。8.根据权利要求1至7任一所述的方法,其特征在于,所述专家网络包括并行的至少两个子专家网络...
【专利技术属性】
技术研发人员:吴航,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。