预测模型训练方法和装置制造方法及图纸

技术编号：34293149 阅读：33 留言：0更新日期：2022-07-27 09:59

本说明书实施例提供一种训练预测模型的方法和装置，该预测模型包括第一分支和第二分支；根据该方法，首先获取目标样本，其包括样本特征，第一标签和第二标签；第一标签指示用户是否点击了目标对象；第二标签表示该用户是否实施与目标对象有关的目标行为。利用预测模型对样本特征进行处理，第一分支输出用户点击目标对象的第一概率；第二分支输出用户实施目标行为的第二概率。基于第一标签值和第一概率，确定第一损失。并且，在预设条件满足的情况下，根据第二标签值和第二概率确定第二损失，并根据第一损失和第二损失确定该目标样本的预测损失，其中预设条件包括，第一标签值指示用户点击了目标对象。于是可以根据上述预测损失，训练该预测模型。训练该预测模型。训练该预测模型。

全部详细技术资料下载

【技术实现步骤摘要】
预测模型训练方法和装置

[0001]本说明书一个或多个实施例涉及人工智能领域，尤其涉及一种预测用户行为的预测模型的训练方法及装置。

技术介绍

[0002]点击后的转化率（CVR），是指用户在点击目标对象后，对其实施预定转化行为的比例，该预定转化行为可以包括购买，收藏，加购，转发等等。对CVR进行预测，是当前多种技术场景中一项重要而核心的预测任务。例如，在推荐系统中，可以将待推荐的备选物品的CVR预测值作为重要的排序因素，用来帮助平衡用户的点击行为和后续转化行为。
[0003]然而，在用机器学习的方式训练CVR预测模型，从而对CVR进行预测时，常常面临多项困难，例如包括，训练数据的稀少，样本选择的偏差，等等。这使得CVR预测模型的训练效果仍不够理想。
[0004]希望有一种新的方案，能够提升用户行为预测模型的训练效果，从而进一步提升对用户行为的预测效果。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种预测模型的训练方法，能够更有效地训练得到预测模型，用于在全空间进行用户转化行为的预测。
[0006]根据第一方面，提供一种训练预测模型的方法，所述预测模型包括第一分支和第二分支，所述包括：获取目标样本，其包括样本特征，第一标签和第二标签；第一标签指示目标样本对应的用户是否点击了目标对象；第二标签表示该用户是否实施了与所述目标对象相关的目标行为；利用所述预测模型对所述样本特征进行模型处理，从而所述第一分支输出所述用户点击所述目标对象的第一概率；所述第二分支输出该用户实施所...

【技术保护点】

【技术特征摘要】
1.一种训练预测模型的方法，所述预测模型包括第一分支和第二分支，所述方法包括：获取目标样本，其包括样本特征，第一标签和第二标签；第一标签指示目标样本对应的用户是否点击了目标对象；第二标签表示该用户是否实施了与所述目标对象相关的目标行为；利用所述预测模型对所述样本特征进行模型处理，从而所述第一分支输出所述用户点击所述目标对象的第一概率；所述第二分支输出该用户实施所述目标行为的第二概率；根据第一标签的第一标签值和所述第一概率，确定第一损失；在满足预设条件的情况下，根据第二标签的第二标签值和所述第二概率确定第二损失，并根据所述第一损失和第二损失确定所述目标样本的预测损失；其中所述预设条件包括，所述第一标签值指示所述用户点击了所述目标对象；根据所述预测损失，训练所述预测模型。2.根据权利要求1所述的方法，还包括：在不满足所述预设条件的情况下，根据所述第一标签值和第二标签值的第一乘积和所述第一概率和第二概率的第二乘积，确定第三损失；并根据所述第一损失和第三损失确定所述预测损失。3.根据权利要求1或2所述的方法，其中，所述预设条件还包括，所述第二标签值指示所述用户没有实施所述目标行为。4.根据权利要求1或2所述的方法，其中，所述预测模型还包括嵌入层；所述模型处理包括，利用所述嵌入层将所述样本特征编码为嵌入向量，将所述嵌入向量分别输入所述第一分支和第二分支。5.根据权利要求4所述的方法，其中，所述样本特征包括所述用户的用户特征，和所述目标对象的对象特征；利用所述嵌入层将所述样本特征编码为嵌入向量，包括：将所述用户特征编码为第一向量；以及，将所述对象特征编码为第二向量；对所述第一向量和第二向量进行聚合，得到所述嵌入向量。6.根据权利要求5所述的方法，其中，所述样本特征还包括所述用户和所述目标对象的交互特征；利用所述嵌入层将所述样本特征编码为嵌入向量，还包括：将所述交互特征编码为第三向量；所述嵌入向量还基于所述第三向量得到。7.根据权利要求2所述的方法，其中，所述预测模型还包括门控单元和乘积计算单元；所述门控单元在所述预设条件得到满足时，阻断目标通路，在所述预设条件不满足时，导通所述目标通路，其中所述目标通路用于将所述第一概率和第二概率传输到所述乘积计算单元，以计算所述第二乘积。8.根据权利要求1或2所述的方法，其中，所述目标行为包括以下之一：购买，收藏，加入购物车，下载，转发。9.一种训练预测模型的装置，所述预测模型包括第一分支和第二分支，所述装置包括：样本获取单元，配置为获取目标样本，其包括样本特征，第一标签和第二标签；第一标签指示目标样本对应的用户是否点击了目标对象；第二标签...

【专利技术属性】
技术研发人员：张文鹏，顾立宏，张冠男，顾进杰，钟文亮，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人