【技术实现步骤摘要】
排序模型训练方法和排序方法
[0001]本申请属于信息处理
,具体涉及一种排序模型训练方法和排序方法。
技术介绍
[0002]随着互联网的蓬勃发展,各种网络信息也越来越多。因此,在向用户所使用的终端设备推送多个信息之前,或者多个服务后台将多种信息推送至用户所使用的终端设备后,需要利用排序模型对这些信息进行排序,以便用户查看。
[0003]目前,对排序模型的主要训练方式是,根据用户的历史反馈信息作为信息样本标签来训练排序模型。而历史排列靠前的信息由于排位优势,被用户点击查看的几率较大,历史排列靠后的信息由于排位劣势,被用户点击查看的几率较小,使得训练得到的排序模型无法准确反映信息对用户的价值大小。因此,相关技术中,用户获取对其有价值的信息所需的时间成本较高,用户体验较差。
技术实现思路
[0004]本申请实施例的目的是提供一种排序模型训练方法和排序方法,能够解决用户获取对其有价值的信息所需的时间成本较高,用户体验较差的问题。
[0005]第一方面,本申请实施例提供了一种排序模型训练方法,该 ...
【技术保护点】
【技术特征摘要】
1.一种排序模型训练方法,其特征在于,包括:获取目标信息及其对应的历史排序位置,生成训练样本;利用多目标网络模型确定所述训练样本对应的第一分数值和第二分数值,其中,所述第一分数值为排序存在排序位置偏差对应的分数值,所述第二分数值为排序不存在所述排序位置偏差对应的分数值;利用多层感知器,根据所述历史排序位置确定所述训练样本对应的第三分数值,其中,所述第三分数值为所述排序位置偏差对应的分数值;基于所述第一分数值、所述第二分数值和所述第三分数值,训练所述多目标网络模型,得到排序模型。2.根据权利要求1所述的方法,其特征在于,所述训练样本包括与所述目标信息对应的信息特征、用户特征以及场景特征;所述利用多目标网络模型确定所述训练样本对应的第一分数值和第二分数值,包括:将所述信息特征、所述用户特征以及所述场景特征输入至所述多目标网络模型,输出得到与所述训练样本对应的所述第一分数值和所述第二分数值。3.根据权利要求2所述的方法,其特征在于,所述训练样本还包括与所述历史排序位置对应的位置索引值;所述利用多层感知器,根据所述历史排序位置确定所述训练样本对应的第三分数值,包括:将所述场景特征和所述位置索引值输入至所述多层感知器,输出得到与所述训练样本对应的第三分数值。4.根据权利要求1所述的方法,其特征在于,所述训练样本包括与所述目标信息对应的用户反馈信息;所述基于所述第一分数值、所述第二分数值和所述第三分数值,训练所述多目标网络模型,得到排序模型,包括:将所述第二分数值与所述第三分数值相加,得到第四分数值;根据所述第一分数值和所述第四分数值,以及所述用户反馈信息,确定损失值;基于所述损失值分别调整所述多目标网络模型和所述多层感知器的模型参数,直至所述多目标网络模型收敛,得到所述排序模型。5.根据权利要求4所述的方法,其特征在于,在根据所述第一分数值和所述第四分数值,以及所述用户反馈信息,确定损失值之前,所述方法还包括:获取所述训练样本对应的第五分数值;其中,所述第五分数值为所述目标信息位于所述历史排序位置时得到用户正向反馈的后验概率值;所述根据所述第一分数值和所述第四分数值,以及所述用户反馈信息,确定损失值,包括:将所述第一分数值与所述第五分数值相加,得到第六分数值,以及将所述第四分数值与所述第五分数值相加,得到第七分数值;根据所述第六分数值和所述第七分数值,以及所述用户反馈信息,确定损失值。6.根据权利要求5所述的方法,其特征在于,所述获取所述训练样本对应的第五分数值,包括:
基于历史信息日志中记录的多个信息分别对应的信息标识、用户标识、用户反馈信息、位置索引值以及目标属性值建立初始数据表;其中,所述目标属性值为场景特征中包括的一种或多种属性值;根据所述位置索引值以及所述目标属性值对所述初始数据表中的数据进行聚合,得到聚合结果;根据所述聚合结果,计算不同的所述位置索引值和所述目标属性值条件下对应的信息得到用户正向反馈的后验概率值,得到后验关注率数据表;从所述后验关注率数据表中,获取所述目标信息在对应的目标属性值条件下,位于所述历史排序位置时,得到用户正向反馈的后验概率值,作为所述第五分数值。7.根据权利要求4所述的方法,其特征在于,所述将所述第二分数值与所述第三分数值相加,得到第四分数值,包括:根据所述第二分数值、所述第三分数值以及影响力参数,确定第四分数值;其中,所述影响力参数用于表征所述第三分数值对所述第四分数值的影响程度。8.一种排序方法,其特征在于,包括:获取与第一用户对应的N个信息,其中,所述第一用户为接收所述N个信息的终端设备对应的用户;利用排序模型消除所述N个信息的预测排序位置偏差,得到与每个信息分别对应的信息分数值,其中,所述排序模型为基于多目标网络模型和多层感知器训练得到;根据与每个信息分别对应的所述信息分数值,对所述N个信息进行排序,展示经排序的所述N个信息;其中,N为正整数,且N≥2。9.根据权利要求8所述的方法,其特征在于,所述利用排序模型消除所述N个信息的预测排序位置偏差,得到与每个信息分别对应的信息分数值,包括:获取与所述N个信息分别对应的信息特征、第一用户特征以及第一场景特征;其中,第一用户特征为所述第一用户的用户特征,所述第一场景特征为所述终端设备所处场景的场景特征;将所述N个信息特征中的每个信息特征分别与所述第一用户特征和所述第一场景特征进行关联,得到N个关联特征;将所述N个关联特征分别输入至所述排序模型,利用所述排序模型消除每个信息对应的预测排序位置偏差,输出得到与每个信息分别对应的信息分数值。10.根据权利要求8所述的方法,其特征在于,所述信息分数值包括原始分数值和去偏差分数值;其中,所述原始分数值为排序存在所述预测排序位置偏差的分数值,所述去偏差分数值为排序不存在所述预测排序位置偏差的分数值;所述根据与每个信息分别对应的所述信息分数值,对所述N个信息进行排序,展示经排序的所述N个信息,包括:对所述原始分数值和所述去偏差分数值进行加权求和,得到与每个信息分别对应...
【专利技术属性】
技术研发人员:黎浩正,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。