一种预估排序方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38474720 阅读:11 留言:0更新日期:2023-08-15 16:54
本申请公开一种预估排序方法、装置、计算机设备及存储介质,属于人工智能技术领域。本申请通过基于携带第一行为的曝光事件和未携带第一行为的曝光事件构建第一样本集和基于携带第二行为的曝光事件和未携带第二行为的曝光事件构建第二样本集,基于第一样本集和第二样本集对多任务学习模型进行拟合训练,得到预估排序模型,将用户数据导入预估排序模型得到信息预估排序结果,基于信息预估排序结果完成信息推送。此外,本申请还涉及区块链技术,用户数据可存储于区块链中。本申请通过在多任务学习模型中将第一行为特征和第二行为特征实现拟合,解决样本选择偏差问题,提高模型泛化性能力,提升预测准确度和用户使用体验。提升预测准确度和用户使用体验。提升预测准确度和用户使用体验。

【技术实现步骤摘要】
一种预估排序方法、装置、计算机设备及存储介质


[0001]本申请属于人工智能
,具体涉及一种预估排序方法、装置、计算机设备及存储介质。

技术介绍

[0002]在搜索和推荐等信息检索场景下,最基础的一个目标就是用户的CTR(Click

Through

Rate,点击通过率),表征用户看见了一篇内容之后是否会去点击阅读。但CTR仅能表征点击阅读行为,而用户在产品上的行为可以是多种多样的,比如点赞、收藏、分享、评论、转化(购买)等,此类行为需要模型通过统一的范式标准进行衡量。
[0003]虽然可以对用户的CTR进行单个目标的优化,但是这样的做法具有一定的片面性,容易推出来标题党,带来负面影响,即靠用户点击这个行为推荐出来的内容并不一定是用户非常满意的内容,用户的阅读量虽然上去了,但是其他的各种行为(收藏、点赞、分享等等)是下降的,这些数据下降代表着用户接收到太多不实用的信息,因此,需要将阅读、点赞、收藏、分享、转化(购买)等等一系列的行为归纳到一个模型里面进行学习,即多目标学习的推荐系统,多目标排序就是利用多个目标函数找到一种综合排序方法,使得多个目标都达到整体最优。
[0004]目前,最新的多目标学习的推荐系统基于多任务学习框架MMOE实现,该框架由OMOE(One

gate Mixture of Experts)演化而来,MMOE其实是MOE针对多任务学习的变种和优化,相对于OMOE的结构中所有任务共享一个门控网络,MMOE的结构优化为每个任务都单独使用一个门控网络,这样的改进可以针对不同任务得到不同的Experts权重,从而实现对Experts的选择性利用,不同任务对应的门控网络可以学习到不同的Experts组合模式,因此模型更容易捕捉到子任务间的相关性和差异性。
[0005]然而上述多目标学习的推荐模型在CVR(Conversion Rate,转化率)预估上仍然存在一些不足。首先,MMOE这样的多任务推荐模型仅用具有点击行为的样本来训练CVR预估模型,但训练好的模型确用在整个样本空间去做推断和预测的。由于点击事件相对于曝光事件来说要少很多,因此只是样本空间的一个很小的子集,这种训练样本从整体样本空间的一个较小子集中提取,而训练得到的模型却需要对整个样本空间中的样本做推断预测的现象称之为样本选择偏差,样本选择偏差会伤害学到的模型的泛化性能。

技术实现思路

[0006]本申请实施例的目的在于提出一种预估排序方法、装置、计算机设备及存储介质,以解决现有方案在训练多目标学习的推荐模型时存在样本选择偏差,存在样本选择偏差问题,导致训练得到的推荐模型泛化性能力,预测准确度低,影响用户使用体验。
[0007]为了解决上述技术问题,本申请实施例提供一种预估排序方法,采用了如下所述的技术方案:
[0008]一种预估排序方法,所述预估排序方法应用于多任务学习的预估排序模型,所述
方法包括:
[0009]获取携带第一行为的曝光事件和未携带第一行为的曝光事件,并基于携带第一行为的曝光事件和未携带第一行为的曝光事件构建第一样本集;
[0010]获取携带第二行为的曝光事件和未携带第二行为的曝光事件,并基于携带第二行为的曝光事件和未携带第二行为的曝光事件构建第二样本集;
[0011]基于所述第一样本集和所述第二样本集对预设的初始多任务学习模型进行拟合训练,得到预估排序模型;
[0012]接收信息推荐指令,获取推荐目标用户的用户数据,将所述用户数据导入所述预估排序模型,得到信息预估排序结果,基于所述信息预估排序结果完成信息推送。
[0013]进一步地,所述第一行为为用户点击行为,所述获取携带第一行为的曝光事件和未携带第一行为的曝光事件,并基于携带第一行为的曝光事件和未携带第一行为的曝光事件构建第一样本集,具体包括:
[0014]获取带有用户点击行为的曝光事件作为第一正样本,以及获取没有用户点击行为的曝光事件作为第一负样本;
[0015]组合所述第一正样本和所述第一负样本,构建所述第一样本集。
[0016]进一步地,所述第二行为为用户购买行为,所述获取携带第二行为的曝光事件和未携带第二行为的曝光事件,并基于携带第二行为的曝光事件和未携带第二行为的曝光事件构建第二样本集,具体包括:
[0017]获取带有用户购买行为的曝光事件作为第二正样本,以及获取没有用户购买行为的曝光事件作为第二负样本;
[0018]组合所述第二正样本和所述第二负样本,构建所述第二样本集。
[0019]进一步地,所述预估排序模型还包括多头注意力网络,所述基于所述第一样本集和所述第二样本集对预设的初始多任务学习模型进行拟合训练,得到预估排序模型,具体包括:
[0020]基于所述多头注意力网络对所述第一正样本进行特征提取,得到第一样本特征;
[0021]基于所述多头注意力网络对所述第二正样本进行特征提取,得到第二样本特征;
[0022]利用所述初始多任务学习模型基于第一样本特征对所述第一行为进行预测,得到第一行为预测结果;
[0023]利用所述初始多任务学习模型基于第二样本特征对所述第二行为进行预测,得到第二行为预测结果;
[0024]对所述第一行为预测结果和所述第二行为预测结果进行拟合,得到多任务预测拟合结果;
[0025]基于所述初始多任务学习模型的损失函数计算所述多任务预测拟合结果与预设的标准结果之间的预测误差;
[0026]基于所述预测误差对所述初始多任务学习模型进行迭代更新,得到所述预估排序模型。
[0027]进一步地,基于以下公式对所述第一行为预测结果和所述第二行为预测结果进行拟合:
[0028]p(y=1,z=1|x)=p(y=1|x1)*p(z=1|y=1,x2)
[0029]式中,p(y=1,z=1|x)为多任务预测拟合结果,p(y=1|x1)为第一行为预测结果,p(z=1|y=1,x2)为第二行为预测结果,x表示样本特征,x包括第一样本特征x1和第二样本特征x2,y表示第一行为,z表示第二行为。
[0030]进一步地,所述初始多任务学习模型包括第一学习网络和第二学习网络,所述第一学习网络用于对所述第一行为进行预测,所述第二学习网络用于对所述第二行为进行预测,所述初始多任务学习模型的损失函数表示如下:
[0031][0032]式中,L是初始多任务学习模型的交叉熵损失函数,θ1表示第一学习网络的网络参数,θ2表示第二学习网络的网络参数,N为样本总数,f(x
i
,θ1)=p(y=1|x
i
),f(x
i
,θ1)*f(x
i
,θ2)=p(z=1|y=1,x
i
)。
[0033]进一步地,所述基于所述预测误差对所述初始多任务学习模型进行迭代更新,得到所述预估排序模型,具体包括:
[0034]在所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预估排序方法,其特征在于,所述预估排序方法应用于多任务学习的预估排序模型,所述方法包括:获取携带第一行为的曝光事件和未携带第一行为的曝光事件,并基于携带第一行为的曝光事件和未携带第一行为的曝光事件构建第一样本集;获取携带第二行为的曝光事件和未携带第二行为的曝光事件,并基于携带第二行为的曝光事件和未携带第二行为的曝光事件构建第二样本集;基于所述第一样本集和所述第二样本集对预设的初始多任务学习模型进行拟合训练,得到预估排序模型;接收信息推荐指令,获取推荐目标用户的用户数据,将所述用户数据导入所述预估排序模型,得到信息预估排序结果,基于所述信息预估排序结果完成信息推送。2.如权利要求1所述的预估排序方法,其特征在于,所述第一行为为用户点击行为,所述获取携带第一行为的曝光事件和未携带第一行为的曝光事件,并基于携带第一行为的曝光事件和未携带第一行为的曝光事件构建第一样本集,具体包括:获取带有用户点击行为的曝光事件作为第一正样本,以及获取没有用户点击行为的曝光事件作为第一负样本;组合所述第一正样本和所述第一负样本,构建所述第一样本集。3.如权利要求1所述的预估排序方法,其特征在于,所述第二行为为用户购买行为,所述获取携带第二行为的曝光事件和未携带第二行为的曝光事件,并基于携带第二行为的曝光事件和未携带第二行为的曝光事件构建第二样本集,具体包括:获取带有用户购买行为的曝光事件作为第二正样本,以及获取没有用户购买行为的曝光事件作为第二负样本;组合所述第二正样本和所述第二负样本,构建所述第二样本集。4.如权利要求1至3任意一项所述的预估排序方法,其特征在于,所述预估排序模型还包括多头注意力网络,所述基于所述第一样本集和所述第二样本集对预设的初始多任务学习模型进行拟合训练,得到预估排序模型,具体包括:基于所述多头注意力网络对所述第一正样本进行特征提取,得到第一样本特征;基于所述多头注意力网络对所述第二正样本进行特征提取,得到第二样本特征;利用所述初始多任务学习模型基于第一样本特征对所述第一行为进行预测,得到第一行为预测结果;利用所述初始多任务学习模型基于第二样本特征对所述第二行为进行预测,得到第二行为预测结果;对所述第一行为预测结果和所述第二行为预测结果进行拟合,得到多任务预测拟合结果;基于所述初始多任务学习模型的损失函数计算所述多任务预测拟合结果与预设的标准结果之间的预测误差;基于所述预测误差对所述初始多任务学习模型进行迭代更新,得到所述预估排序模型。5.如权利要求4所述的预估排序方法,其特征在于,基于以下公式对所述第一行为预测结果和所述第二行为预测结果进行拟合:
p(y=1,z=1|x)=p(y=1|x1)*p(z=1|...

【专利技术属性】
技术研发人员:康莉
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1