【技术实现步骤摘要】
媒体资源的处理方法和装置、存储介质及电子设备
[0001]本专利技术涉及计算机
,具体而言,涉及一种媒体资源的处理方法和装置、存储介质及电子设备。
技术介绍
[0002]在一个推荐场景中,推荐商品大多以一个列表的形式呈现给用户,如常见的电商、视频、新闻推荐等等。对于用户的一个请求,排序模型会对召回候选集的所有商品进行打分排序,分数最高的商品集合被展示给用户,这里就有一个position bias的问题,即用户更倾向于点击排名靠前的商品,而且这中倾向和用户真正的兴趣无关。如果对于不同位置上的点击率进行统计,可以发现排名靠前的商品点击率最高。这种现象可能会导致用户忽略自己真正感兴趣的商品,而只是点击排名靠前的商品。而用户行为又是构建模型输入的重要特征,因此,模型也会学习到用户带有位置偏差的行为,使得在打分的实时无法把用户最感兴趣的商品排到前面。
[0003]目前,消除position
‑
bias的方法是基于特征的方法,离线训练时加入position特征,线上预测时使用一个默认特征替代positio ...
【技术保护点】
【技术特征摘要】
1.一种媒体资源的处理方法,其特征在于,包括:将样本媒体资源的位置特征、所述样本媒体资源的资源特征和样本用户的用户特征输入到第一训练神经网络,得到所述第一训练神经网络输出的第一预测点击率,其中,所述位置特征用于表示所述样本媒体资源在推送给所述样本用户的一组媒体资源中的实际排列位置,所述第一预测点击率用于表示所述样本用户点击所述样本媒体资源的预测概率;将所述样本媒体资源的所述资源特征和所述样本用户的所述用户特征输入到第二训练神经网络,得到所述第二训练神经网络输出的第二预测点击率,所述第二预测点击率用于表示所述样本用户点击所述样本媒体资源的预测概率,所述第一训练神经网络与所述第二训练神经网络具有相同的模型结构;根据所述第一预测点击率、所述第二预测点击率以及实际点击结果,确定所述第二训练神经网络的目标损失函数的损失值,其中,所述实际点击结果用于表示所述样本用户是否实际点击所述样本媒体资源;根据所述目标损失函数的损失值,对所述第二训练神经网络中的模型参数进行调整。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一预测点击率、所述第二预测点击率以及实际点击结果,确定所述第二训练神经网络的目标损失函数的损失值,包括:根据所述第一预测点击率、所述第二预测点击率、预测曝光率以及所述实际点击结果,确定所述第二训练神经网络的所述目标损失函数的损失值,其中,所述预测曝光率是根据所述样本媒体资源的位置特征确定得到的曝光率,所述预测曝光率用于表示所述样本媒体资源被推送给所述样本用户的概率。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述样本媒体资源的位置特征输入到第三训练神经网络,得到所述第三训练神经网络输出的所述预测曝光率。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一预测点击率、所述第二预测点击率、预测曝光率以及所述实际点击结果,确定所述第二训练神经网络的目标损失函数的损失值,包括:根据所述第一预测点击率和所述第二预测点击率,确定第一损失值;根据所述第二预测点击率、所述预测曝光率以及所述实际点击结果,确定第二损失值;根据所述第一损失值和所述第二损失值,确定所述第二训练神经网络的目标损失函数的损失值。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一损失值和所述第二损失值,确定所述第二训练神经网络的目标损失函数的损失值,包括:通过以下公式,确定所述第二训练神经网络的所述目标损失函数的损失值:L=αL
(soft)
+(1
‑
α)L
(hard)
其中,L
(soft)
表示所述第一损失值,L
(hard)
表示所述第二损失值,L表示所述第二训练神经网络的所述目标损失函数的损失值,α表示预设的权重,0<α<1。6.根据权利要求4所述的方法,其特征在于,所述根据所述第一预测点击率和所述第二预测点击率,确定第一损失值,包括:将所述第一预测点击率和所述第二预测点击率之间的差值的平方确定为所述第一损
失值;或者将所述第二预测点击率与所述预测曝光率的和或乘积确定为预测输出值;将所述第一预测点击率和所述预测输出值之间的差值的平方确定为所述第一损失值。7.根据权利要求4所述的方法,其特征在于,所述根据所述第二预测点击率、所述预测曝光率以及所述实际点击结果,确定第二损失值,包括:将所述第二预测点击率与所述预测曝光率的和或乘积确定为预测输出值;将所述预测输出值与所述实际点击结果的交叉熵,确定为所述第二损失值。...
【专利技术属性】
技术研发人员:凌程,王亚龙,王瑞,夏锋,林乐宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。