预测模型训练方法和装置制造方法及图纸

技术编号:34293149 阅读:33 留言:0更新日期:2022-07-27 09:59
本说明书实施例提供一种训练预测模型的方法和装置,该预测模型包括第一分支和第二分支;根据该方法,首先获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示用户是否点击了目标对象;第二标签表示该用户是否实施与目标对象有关的目标行为。利用预测模型对样本特征进行处理,第一分支输出用户点击目标对象的第一概率;第二分支输出用户实施目标行为的第二概率。基于第一标签值和第一概率,确定第一损失。并且,在预设条件满足的情况下,根据第二标签值和第二概率确定第二损失,并根据第一损失和第二损失确定该目标样本的预测损失,其中预设条件包括,第一标签值指示用户点击了目标对象。于是可以根据上述预测损失,训练该预测模型。训练该预测模型。训练该预测模型。

【技术实现步骤摘要】
预测模型训练方法和装置


[0001]本说明书一个或多个实施例涉及人工智能领域,尤其涉及一种预测用户行为的预测模型的训练方法及装置。

技术介绍

[0002]点击后的转化率(CVR),是指用户在点击目标对象后,对其实施预定转化行为的比例,该预定转化行为可以包括购买,收藏,加购,转发等等。对CVR进行预测,是当前多种技术场景中一项重要而核心的预测任务。例如,在推荐系统中,可以将待推荐的备选物品的CVR预测值作为重要的排序因素,用来帮助平衡用户的点击行为和后续转化行为。
[0003]然而,在用机器学习的方式训练CVR预测模型,从而对CVR进行预测时,常常面临多项困难,例如包括,训练数据的稀少,样本选择的偏差,等等。这使得CVR预测模型的训练效果仍不够理想。
[0004]希望有一种新的方案,能够提升用户行为预测模型的训练效果,从而进一步提升对用户行为的预测效果。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种预测模型的训练方法,能够更有效地训练得到预测模型,用于在全空间进行用户转化行为的预测。
[0006]根据第一方面,提供一种训练预测模型的方法,所述预测模型包括第一分支和第二分支,所述包括:获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示目标样本对应的用户是否点击了目标对象;第二标签表示该用户是否实施了与所述目标对象相关的目标行为;利用所述预测模型对所述样本特征进行模型处理,从而所述第一分支输出所述用户点击所述目标对象的第一概率;所述第二分支输出该用户实施所述目标行为的第二概率;根据第一标签的第一标签值和所述第一概率,确定第一损失;在满足预设条件的情况下,根据第二标签的第二标签值和所述第二概率确定第二损失,并根据所述第一损失和第二损失确定所述目标样本的预测损失;其中所述预设条件包括,所述第一标签值指示所述用户点击了所述目标对象;根据所述预测损失,训练所述预测模型。
[0007]根据一种实施方式,上述方法还包括:在不满足所述预设条件的情况下,根据所述第一标签值和第二标签值的第一乘积和所述第一概率和第二概率的第二乘积,确定第三损失;并根据所述第一损失和第三损失确定所述预测损失。
[0008]在一个实施例中,所述预设条件还包括,所述第二标签值指示所述用户没有实施目标行为。
[0009]在一个实施例中,所述预测模型还包括嵌入层;所述模型处理包括,利用所述嵌入层将所述样本特征编码为嵌入向量,将所述嵌入向量分别输入所述第一分支和第二分支。
[0010]进一步的,在一个示例中,样本特征包括所述用户的用户特征,和所述目标对象的对象特征;利用所述嵌入层将所述样本特征编码为嵌入向量,具体包括:将所述用户特征编码为第一向量;以及,将所述对象特征编码为第二向量;对所述第一向量和第二向量进行聚合,得到所述嵌入向量。
[0011]在一个更进一步的例子中,所述样本特征还包括所述用户和所述目标对象的交互特征;利用所述嵌入层将所述样本特征编码为嵌入向量,还包括:将所述交互特征编码为第三向量;其中,所述嵌入向量还基于所述第三向量得到。
[0012]根据一种实施方式,上述预测模型还包括门控单元和乘积计算单元;所述门控单元在所述预设条件得到满足时,阻断目标通路,在所述预设条件不满足时,导通所述目标通路,其中所述目标通路用于将所述第一概率和第二概率传输到所述乘积计算单元,以计算所述第二乘积。
[0013]在不同实施例中,所述目标行为包括以下之一:购买,收藏,加入购物车,下载,转发。
[0014]根据第二方面,提供了一种训练预测模型的装置,所述预测模型包括第一分支和第二分支,所述装置包括:样本获取单元,配置为获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示目标样本对应的用户是否点击了目标对象;第二标签表示该用户是否实施了与所述目标对象有关的目标行为;概率预测单元,配置为利用所述预测模型对所述样本特征进行模型处理,从而所述第一分支输出所述用户点击所述目标对象的第一概率;所述第二分支输出该用户实施所述目标行为的第二概率;第一损失确定单元,配置为根据第一标签的第一标签值和所述第一概率,确定第一损失;第二损失确定单元,配置为在满足预设条件的情况下,根据第二标签的第二标签值和所述第二概率确定第二损失,并根据所述第一损失和第二损失确定所述目标样本的预测损失;其中所述预设条件包括,所述第一标签值指示所述用户点击了所述目标对象;训练单元,配置为根据所述预测损失,训练所述预测模型。
[0015]根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序在计算机中执行时,令计算机执行上述第一方面的方法。
[0016]根据第四方面,提供了一种计算设备,包括存储器和处理器,存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面的方法。
[0017]在本说明书实施例提供的训练方案中,在训练样本的标签指示出对应用户点击了目标对象的情况下,采用CVR预测任务的预测损失替代点击+转化(CTCVR)预测任务的预测损失,如此避免了该情况下CTR任务和CTCVR任务的梯度冲突,从而实现了更好的训练效果。
附图说明
[0018]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用
的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0019]图1示出全空间多任务模型的示意图;图2示出第一标签y和第二标签z的各种可能取值下第一梯度和第二梯度的总结图表;图3示出根据一个实施例的训练预测模型的方法流程图;图4示出预测模型的结构和训练过程示意图;图5示出根据一个实施例的训练装置的结构示意图。
具体实施方式
[0020]下面结合附图,对本说明书提供的方案进行描述。
[0021]在典型的互联网场景中,各种服务平台通过互联网展现多种对象。用户在浏览到感兴趣的对象时,首先会对其进行点击,以获得进一步信息,或者获得转化的入口。然后,用户可能对点击后的部分对象,实施转化行为。例如在典型的电商场景中,服务平台会呈现各种推荐的商品。用户会点击其中感兴趣的一些商品,进而有可能购买其中的一些。因此,用户行为遵循一个严格的序列模式,也就是,展现(impression)

>点击

>转化。
[0022]对于服务平台而言,最为关心的是用户的转化率,因此,预测点击后的转化率(post

click conversion rate,CVR)是服务平台中一项重要的任务。然而,如上所述,用户行为呈现严格的序列性,转化相对于点击的时序依赖,使得CVR预测模型的构建面临几项挑战和困难。
[0023]一项困难是训练数据的稀少和稀疏。可以理解的,对象的每一次展现都可以贡献出一个关于点击率CTR(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练预测模型的方法,所述预测模型包括第一分支和第二分支,所述方法包括:获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示目标样本对应的用户是否点击了目标对象;第二标签表示该用户是否实施了与所述目标对象相关的目标行为;利用所述预测模型对所述样本特征进行模型处理,从而所述第一分支输出所述用户点击所述目标对象的第一概率;所述第二分支输出该用户实施所述目标行为的第二概率;根据第一标签的第一标签值和所述第一概率,确定第一损失;在满足预设条件的情况下,根据第二标签的第二标签值和所述第二概率确定第二损失,并根据所述第一损失和第二损失确定所述目标样本的预测损失;其中所述预设条件包括,所述第一标签值指示所述用户点击了所述目标对象;根据所述预测损失,训练所述预测模型。2.根据权利要求1所述的方法,还包括:在不满足所述预设条件的情况下,根据所述第一标签值和第二标签值的第一乘积和所述第一概率和第二概率的第二乘积,确定第三损失;并根据所述第一损失和第三损失确定所述预测损失。3.根据权利要求1或2所述的方法,其中,所述预设条件还包括,所述第二标签值指示所述用户没有实施所述目标行为。4.根据权利要求1或2所述的方法,其中,所述预测模型还包括嵌入层;所述模型处理包括,利用所述嵌入层将所述样本特征编码为嵌入向量,将所述嵌入向量分别输入所述第一分支和第二分支。5.根据权利要求4所述的方法,其中,所述样本特征包括所述用户的用户特征,和所述目标对象的对象特征;利用所述嵌入层将所述样本特征编码为嵌入向量,包括:将所述用户特征编码为第一向量;以及,将所述对象特征编码为第二向量;对所述第一向量和第二向量进行聚合,得到所述嵌入向量。6.根据权利要求5所述的方法,其中,所述样本特征还包括所述用户和所述目标对象的交互特征;利用所述嵌入层将所述样本特征编码为嵌入向量,还包括:将所述交互特征编码为第三向量;所述嵌入向量还基于所述第三向量得到。7.根据权利要求2所述的方法,其中,所述预测模型还包括门控单元和乘积计算单元;所述门控单元在所述预设条件得到满足时,阻断目标通路,在所述预设条件不满足时,导通所述目标通路,其中所述目标通路用于将所述第一概率和第二概率传输到所述乘积计算单元,以计算所述第二乘积。8.根据权利要求1或2所述的方法,其中,所述目标行为包括以下之一:购买,收藏,加入购物车,下载,转发。9.一种训练预测模型的装置,所述预测模型包括第一分支和第二分支,所述装置包括:样本获取单元,配置为获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示目标样本对应的用户是否点击了目标对象;第二标签...

【专利技术属性】
技术研发人员:张文鹏顾立宏张冠男顾进杰钟文亮
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1