点击率预估模型训练方法和装置制造方法及图纸

技术编号:39675219 阅读:29 留言:0更新日期:2023-12-11 18:41
本公开提供了一种点击率预估模型训练方法和装置,涉及人工智能技术领域

【技术实现步骤摘要】
点击率预估模型训练方法和装置、点击率预估方法和装置


[0001]本公开涉及计算机
,具体涉及人工智能
,尤其涉及点击率预估模型训练方法和装置

点击率预估方法和装置

电子设备

计算机可读存储介质


技术介绍

[0002]现有的推荐系统场景下,模型预估点击率普遍采用增量更新的方式,即基于增量的数据继续训练上一次服务的模型

这种更新方式会造成模型在增量的数据上过拟合,过度的拟合到增量数据上的分布,导致模型缺少泛化能力,影响了模型训练效果


技术实现思路

[0003]本公开的实施例提出了点击率预估模型训练方法和装置

点击率预估方法和装置

电子设备

计算机可读存储介质

[0004]第一方面,本公开的实施例提供了一种点击率预估模型训练方法,该方法包括:获取预置的样本集,样本集至少包括一个样本,样本包括:用户特征和商品特征;获取预先构建的点击率预估网络,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种点击率预估模型训练方法,所述方法包括:获取预置的样本集,所述样本集至少包括一个样本,所述样本包括:用户特征和商品特征;获取预先构建的点击率预估网络,所述点击率预估网络包括:特征先验模块和模型先验模块,其中,所述特征先验模块包括:特征先验层和特征处理层,所述特征先验层用于获取样本中各个特征的先验点击率信息,所述特征处理层基于所述先验点击率信息,得到所述样本的特征向量;所述模型先验模块用于对所述特征向量进行预测得到点击率预估值;执行以下训练步骤:从所述样本集中选取样本;将该样本输入所述点击率预估网络,得到所述点击率预估网络输出的点击率预估值;分别计算所述特征先验层的特征损失值

所述特征处理层和所述模型先验模块的模型损失值;响应于所述点击率预估网络满足训练完成条件,将所述点击率预估网络作为点击率预估模型
。2.
根据权利要求1所述的方法,所述特征处理层包括:离散化层和高维嵌入层;所述离散化层用于对所述先验点击率信息进行离散化处理;所述高维嵌入层用于提取离散化处理后先验点击率信息的高维特征,得到第一高维特征向量,将所述第一高维特征向量作为所述特征向量
。3.
根据权利要求2所述的方法,所述特征处理层还包括:初始嵌入层,用于提取样本中各个特征的高维特征,得到第二高维特征向量,连接所述第一高维特征向量和所述第二高维特征向量,得到所述特征向量
。4.
根据权利要求2或3所述的方法,所述计算所述特征先验层的特征损失值包括:利用最大化似然估计方法构建所述特征先验层的损失函数;基于所述特征先验层的损失函数,得到所述特征先验层的特征损失值
。5.
根据权利要求2或3所述的方法,所述计算所述特征处理层和所述模型先验模块的模型损失值包括:构建所述特征处理层和所述模型先验模块的交叉熵损失函数;基于所述交叉熵损失函数,得到所述特征处理层和所述模型先验模块的模型损失值
。6.
根据权利要求2或3所述的方法,所述计算所述特征处理层和所述模型先验模块的模型损失值包括:构建所述特征处理层和所述模型先验模块的交叉熵损失函数;构建所述特征处理层和所述模型先验模块的当前参数分布与历史参数分布之间的距离函数;基于所述交叉...

【专利技术属性】
技术研发人员:杨晨
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1