点击率预估模型训练方法、点击率预估方法及电子设备技术

技术编号:35898069 阅读:45 留言:0更新日期:2022-12-10 10:32
本发明专利技术涉及深度学习领域,具体涉及一种点击率预估模型训练方法、点击率预估方法及电子设备。该方法包括:获取训练数据集;将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。上述方法保证了生成的点击率预估模型的准确性,进而可以保证基于点击率预估模型得到点击率结果的准确性。的准确性。的准确性。

【技术实现步骤摘要】
点击率预估模型训练方法、点击率预估方法及电子设备


[0001]本专利技术涉及深度学习领域,具体涉及一种点击率预估模型训练方法、点击率预估方法及电子设备。

技术介绍

[0002]随着信息时代的到来,通过广告进行商品销售的模式被广泛应用,其中,对如何预估广告点击率,从而根据用户的特征属性,预测用户点击商品的概率,更好的获得更高的广告点击率,增加商品的曝光度尤为重视。
[0003]目前,进行广告点击率预估方法主要包括基于深度学习的预估方法。基于深度学习的广告点击率预估方法,主要通过将离散特征转化为连续的特征向量,并将其简单的拼接起来,进行的非结构化特征组合,输入到一个深度神经网络结构中,忽视了各种特征之间的结构特性,导致广告点击率预估精度不高。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种点击率预估模型训练方法,旨在解决现有技术导致广告点击率预估精度不高的问题。
[0005]根据第一方面,本专利技术实施例提供了一种点击率预估模型训练方法,包括:
[0006]获取训练数据集;
[0007]将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;
[0008]对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
[0009]本申请实施例提供的点击率预估模型训练方法,获取训练数据集,将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,保证了生成的初始特征的准确性。然后,对初始特征进行扩展和压缩处理,使得可以基于初始特征生出更丰富的特征,保证了特征的全面性。然后,基于扩展和压缩后的特征,生成目标特征,保证了生成的目标特征的准确性。对目标特征进行识别,输出点击率预估结果,保证了输出的点击率预估结果的准确性。然后,基于点击率预估结果以及预设损失函数,计算损失值,保证了计算得到的损失值的准确性。然后,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型,保证了生成的点击率预估模型的准确性,进而可以保证基于点击率预估模型得到点击率结果的准确性。
[0010]结合第一方面,在第一方面第一实施方式中,对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征,包括:
[0011]使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征;
[0012]对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征;
[0013]基于各个交互特征之间的关系,生成目标特征。
[0014]本申请实施例提供的点击率预估模型训练方法,使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征,保证了生成的备用特征的准确性以及多样性。然后,对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征,保证了生成的多个交互特征的准确性。基于各个交互特征之间的关系,生成目标特征,保证了生成的目标特征的准确性,进而可以保证训练得到的点击率预估模型的准确性。
[0015]结合第一方面第一实施方式,在第一方面第二实施方式中,使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征,包括:
[0016]使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征;
[0017]使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征;
[0018]对第二候选特征进行分析,生成备用特征。
[0019]本申请实施例提供的点击率预估模型训练方法,使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征,保证了生成的第一候选特征的准确性以及多样性。使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征,保证了生成的第二候选特征的准确性。对第二候选特征进行分析,生成备用特征,保证了生成的备用特征的准确性。
[0020]结合第一方面第二实施方式,在第一方面第三实施方式中,对第二候选特征进行分析,生成备用特征,包括:
[0021]基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重;
[0022]利用域权重乘以第二候选特征,生成备用特征。
[0023]本申请实施例提供的点击率预估模型训练方法,基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重,保证了计算得到的第二候选特征对应的域权重的准确性。然后,利用域权重乘以第二候选特征,生成备用特征,保证了生成的备用特征的准确性。
[0024]结合第一方面第一实施方式,在第一方面第四实施方式中,基于各个交互特征之间的关系,生成目标特征,包括:
[0025]获取各个交互特征对应的权重信息以及偏值;
[0026]将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征。
[0027]本申请实施例提供的点击率预估模型训练方法,获取各个交互特征对应的权重信息以及偏值,然后,将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征,保证了生成的目标特征的准确性。
[0028]结合第一方面,在第一方面第五实施方式中,对训练数据集进行特征提取,生成初始特征,包括:
[0029]对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征。
[0030]本申请实施例提供的点击率预估模型训练方法,对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征,保证了生成的初始特征的准确性。
[0031]结合第一方面,在第一方面第六实施方式中,获取训练数据集,包括:
[0032]获取原始数据,原始数据包括用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征以及点击率结果;
[0033]对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据;
[0034]对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据;
[0035]基于目标数据,生成训练数据集。
[0036]本申请实施例提供的点击率预估模型训练方法,获取原始数据,然后对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据,保证了生成的候选数据的准确性。然后,对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据,保证了生成的目标数据的准确性,然后,基于目标数据,生成训练数据集,保证了生成的训练数据集的准确性。
[0037]根据第二方面,本专利技术实施例提供了一种点击率预估方法,包括:
[0038]获取待预估数据,待预估数据包括用户属性、广告属性、用户的过往历史点击记录以及上下文的环境特征;
[0039]将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,点击率预估模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种点击率预估模型训练方法,其特征在于,包括:获取训练数据集;将所述训练数据集输入至初始点击率预估网络中,对所述训练数据集进行特征提取,生成初始特征,并对所述初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;对所述目标特征进行识别,输出点击率预估结果,基于所述点击率预估结果以及预设损失函数,计算损失值,基于所述损失值对所述初始点击率预估网络进行更新,生成点击率预估模型。2.根据权利要求1所述的方法,其特征在于,所述对所述初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征,包括:使用两种不同线性的方式对所述初始特征进行扩展和压缩处理,生成备用特征;对所述备用特征和所述初始特征进行多次交互迭代处理,生成多个交互特征;基于各个所述交互特征之间的关系,生成所述目标特征。3.根据权利要求2所述的方法,其特征在于,所述使用两种不同线性的方式对所述初始特征进行扩展和压缩处理,生成备用特征,包括:使用内积的线性方式对所述初始特征进行扩展处理,生成第一候选特征;使用哈达玛乘积的线性方式,对所述第一候选特征进行压缩处理,生成第二候选特征;对所述第二候选特征进行分析,生成所述备用特征。4.根据权利要求3所述的方法,其特征在于,所述对所述第二候选特征进行分析,生成所述备用特征,包括:基于所述初始特征与所述第一候选特征之间的关系,计算所述第二候选特征对应的域权重;利用所述域权重乘以所述第二候选特征,生成所述备用特征。5.根据权利要求2所述的方法,其特征在于,所述基于各个所述交互特征之间的关系,生成所述目标特征,包括:获取各个所述交互特征对应的权重信息以及偏值;将各个所述交互特征乘以对应的权重...

【专利技术属性】
技术研发人员:张文领
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1